jeudi 25 avril 2013

Big Data et recherche scientifique : des injonctions contradictoires ?

L'INTD accueillait aujourd'hui, 25 avril 2013, un séminaire organisé par sa directrice, Ghislaine Chartron, sur le thème des "Données ouvertes de la recherche et les enjeux associés". Deux intervenants ont permis aux élèves du Master 2 et aux doctorants de découvrir des initiatives concrètes dans ce domaine :

Un contexte politique international engagé

Plusieurs étapes sont à retenir pour mieux comprendre la mise en place progressive de ce mouvement au niveau international. Le texte fondateur reste la Déclaration de Berlin de 2003, qui posa le principe du libre accès comme outil de dissémination de l'information scientifique. L'idée (utopique ?) de la création d'une "base de connaissance globale de la pensée humaine" y est invoquée. En 2007, un rapport de l'OCDE a précisé les modalités économiques de cette ambition : un financement sur fonds publics, dont le ROI annoncé est une stimulation sans précédent de la créativité et de l'investissement. Enfin, en 2012, la Communauté Européenne a imposé à tous ses États membres de mettre en place cette politique d'ici 2014, avec un horizon opérationnel pour 2020. L'engagement dans certains pays ne s'est pas fait attendre. On citera notamment le Royaume-Uni (Research Council) ou l'Australie (ANDS).

Des enjeux paradoxaux ? 

L'enjeu immédiatement évoqué est bien sûr celui de la capitalisation patrimoniale des données de la recherche, puisque celles-ci appartiennent aux institutions employant les chercheurs qui les ont produites. On aperçoit une première contradiction entre cet objectif de sauvegarde et la notion de partage.
L'enjeu économique, aussi, n'est jamais bien loin, que le bénéfice soit immédiat ou issu des retombées de recherches futures, encouragées par ce partage. Les grandes revues scientifiques, si souvent accusées de confisquer un savoir issu de fonds publics, semblent l'avoir bien compris, comme le montrent les récentes initiatives de Science (FigShare) ou Nature (Scientific Data).
L'enjeu central reste évidemment celui de faire évoluer la science, de lui donner l'opportunité d'aller encore plus loin, grâce à des moyens inédits (qui posent d'ailleurs le problème du coût des infrastructures nécessaires). La révolution est telle qu'on parle aujourd'hui de "4ème paradigme", d'après l'expression de Jim Gray, pour désigner cette évolution vers des découvertes scientifiques issues d'une grande quantité de données (on pense ici au data mining).

Des questionnements pour la recherche, des opportunités pour les professionnels de l'IST

Comme toujours, de nouvelles perspectives font émerger de nouvelles problématiques : peut-on diffuser sur un pied d'égalité des données qui n'ont pas toutes la même valeur intrinsèque ? Comment s'assurer de la viabilité des données mises à disposition des autres chercheurs ? Il est à craindre qu'une différence de traitement finisse par s'imposer, selon que les données sont issues de recherches sur fonds publics ou privés... Un embargo permet au chercheur qui a produit les données d'en conserver la primeur, mais il finit par perdre cet avantage concurrentiel. Ira-t-on vers une course à la donnée, qui deviendrait le nouvel étalon de la productivité pour la recherche ? On évoquera enfin pour les SHS le problème récurrent de l'anonymisation des données, qualitatives en particulier.

Les spécialistes de l'information, quant à eux, trouveront encore une fois dans ce mouvement de fond l'occasion de se réinventer et d'acquérir de nouveaux débouchés. Il s'agit tout d'abord du développement nécessaire des bibliothèques en sciences sociales, qui devront se positionner comme soutien et outil de diffusion des centres de données (data library). Pour les professionnels de l'IST, une montée en puissance concernant les savoir-faire technologiques permettra d'appuyer leurs compétences de plus en plus indispensables en indexation et gestion des connaissances (DOI, Linked Open Data, ontologies et web sémantique).

Pour aller plus loin :

The RCUK Policy and Guidance on Open access, mis à jour le 8 avril 2013 (PDF)
The 4th paradigm : Data-Intensive Scientific Discovery, d'après les travaux de Jim Gray, Microsoft Research, octobre 2009 - téléchargeable gratuitement sur le site de Microsoft Research     
Le site du Réseau Quetelet, portail français d’accès aux données pour les sciences humaines et sociales. 


jeudi 18 avril 2013

Appellations attractives du métier

Les nécessités de l’activité technique du professionnel de l’information positionnent le métier, la fonction et les compétences associées sur une surface étendue d’appellations, au-delà des découpages contrôlés par les référentiels métiers dans les organisations. Les innovations lexicales sont autant de “bourgeons” pour caractériser les potentiels et les performances du documentaliste. Elles augmentent la liste ouverte de leurs valeurs ajoutées fortement mobilisables au service de l’entreprise dans la gestion des actifs informationnels.

La gouvernance de l’information
Le numéro inaugural en français de la [Harvard Business Review] sorti le 11 avril 2013, propose la traduction d’un article de Andrew MacAfee et Erik Brynjolfsson paru en octobre 2012 sur l’utilisation des "grandes données” pour la prise de décision. L’article initial avait fait l’objet d’une critique argumentée dans [Les Echos] le 12 mars dernier par Bruno Teboul qui développait que “ce n’est pas la quantité ou la qualité des données qui permettent de sécuriser une décision, mais le traitement que l’on en fait”. Le traitement et l’analyse de l'information formée de la contextualisation et de l’interprétation des données sont au coeur du savoir-faire du documentaliste; aussi quand le documentaliste participe à une architecture axée sur l'anticipation des besoins et des attentes des utilisateurs, on dit qu’il gagne le pont de la gouvernance avec l’information “point nodal dans l’organisation”; c’est le point de vue de Jean-Pascal Perrein dans la [Revue DocSI] de ce trimestre; quand placé au centre des projets, le documentaliste fait le lien entre les forces impliquées, les compétences techniques, juridiques, réglementaires et organisationnelles jusqu’à la transition des usages vers le nativement numérique. Il prend le nom de “professionnel de la dématique” dans le dossier Stratégie et Innovation numérique de [EcoRéseau] d'avril/mai 2013.

Le champ de l’interaction homme‐machine (IHM)
Le billet de Christine Sadier-Sireau [INTD 2012, sur ce blog, rubrique: Manifestation] invitait le professionnel de l’ingénierie documentaire à suivre l’actualité du design d’interaction. L’IHM porte sur la conception et la réalisation en contexte, de systèmes à la fois conformes aux services attendus par l’utilisateur cible, et attentifs à ses capacités motrices et cognitives, soit plus loin que l’organisation de la navigation par des liens et le remplissage de formulaires. La [31ème conférence ACM SIGCHI] -Association for Computing Machinery; Special Interest Group on Computer-Human Interaction- dédiée aux facteurs humains dans les systèmes informatiques ouvrira à Paris le 27 avril prochain sur le thème changing perspectives . Le sociologue et anthropologue Bruno Latour (Lauréat 2013 du prix Holberg, équivalent du Nobel pour les arts et lettres, les sciences humaines, le droit et la théologie) clôturera le 2 mai ce colloque international multidisciplinaire.

Références:
  • Harvard Business Review. Paris: Groupe HBR, 2013-Bimestriel. Rubrique: Organisation. ISSN: en cours;
  • Les Echo.fr <http://www.lesechos.fr/>;
  • Documentaliste - Sciences de l'Information. Paris: ADBS, 1964-Bimestriel. Dossier Gouvernance de l'information ISSN: 0012-4508;
  • EcoRéseau. Paris: LMédia, 2013-Bimestriel. Rubrique stratégie et Innovation numérique. ISSN 2265-7436;
  • ACM Europe: the ACM SIGCHI Conference on Human Factors in Computing Systems <http://chi2013.acm.org/> [Programme en ligne].

jeudi 11 avril 2013

Les coffres-forts numériques


Segment phare de l'archivage électronique auprès des entreprises, Markess International publiera dans les prochaines semaines ses perspectives pour 2015.


L'archivage électronique loin d'être une pratique nouvelle s'affirme auprès des décideurs d'entreprises et d'institutions. Le terme de coffre-fort numérique apparu en 2009 s'impose dès lors et renvoie à un gage de sécurité pour l'archivage des données à vocation "probatoire". Au delà des enjeux stratégiques pour les entreprises c'est tout un système de normalisation qui s'établit avec la parution en Juillet dernier de la norme Afnor NF Z42-020.

Quelques chiffres...

 En 2012, selon l'étude de Markess International "Archivage de contenus électroniques à vocation probatoire, approches et perspectives 2014" le marché de l'archivage des contenus numériques pesait 125 millions d'euros. Soit une augmentation de 19% entre 2011 et 2012.

  Selon le rapport à paraître : "Solutions de coffre-fort numérique: attentes et perspectives 2015" de l'agence Markess International cette tendance semble se confirmer. Reposant sur les témoignages de 130 décideurs, 25% des interrogés ont eu recours aux coffres-forts électroniques et 27% d'entre eux prévoient la mise en place de cette solution numérique pour 2015.

  Face à l'intérêt croissant des coffres-forts numériques, on s'interroge sur les raisons qui motivent les décideurs à franchir le pas.

 

Les enjeux stratégiques

  Pour les entreprises, l'enjeu est capital puisqu'il s'agit de conserver à la fois la pérennité, l'intégrité et la traçabilité de leurs ressources numériques.
 
  Outre l'importance de la pérennité, reposant sur une réflexion technique et l'évolution des supports physiques, penchons nous sur l'intégrité. 
  Pour le monde de l'entreprise cela revient à une préoccupation de tous temps:  la conservation sur le long terme des documents importants. Autrement dit la conservation des documents numériques à vocation "probatoire". Avec l'augmentation des flux numériques et la diminution des documents papiers, il est fréquent qu'une entreprise se retrouve dans une situation litigieuse faute de pouvoir fournir les preuves:  factures client, fiches de paie, bilans comptable, brevets etc... On observe dès lors que l'attention est portée sur ces documents "probatoires" et que le coffre fort numérique offre en plus des garanties de sécurité, une traçabilité.

La norme Afnor Z42-020

  Depuis 2001, la fédération nationale des tiers de confiance (FNTC) travaille à l'élaboration de certifications, normes et outils pour l'amélioration de la sécurité dans les échanges électroniques.
  Ces travaux aboutissent donc à la publication de la norme Afnor Z42-020 le 20 Juillet 2012. Cette normalisation va d'une part rassurer, en terme de qualité, les décideurs sur la solution de coffre-fort numérique. 78% d'entre eux, selon l'étude Markess de 2013 affirment choisir cette solution suite à la parution de la norme Afnor. D'autre part grâce aux différents "labels de confiance" et autres outils normalisés, comme l'horodatage, la signature électronique etc.. rendent ces documents recevables devant un tribunal.

Quelles perspective pour les documentalistes?

  Selon l'étude Markess de 2013, sur les attentes des 130 décideurs, 86% voient l'avantage d'une bonne indexation, 83% la recherche par mot clé et enfin 72% pour le classement. Malgré cela, nombre de décideurs confient ce type de projet à un service externe à celui de la documentation. En 2012, toujours selon Markess, 82% reconnaissent les confier à la DSI. Signe que le métier d'ingénieur documentaire est encore sous estimé.

Sources

Revue:

Archimag.n°262, de la démat des lettres à l'hypercourrier, Mars 2013, p12.

Sources électroniques:

Archimag


ZDNET


Markess

 


Fondamentaux du Cloud computing : le point de vue des grandes entreprises


Focus sur le rapport du CIGREF du 26 mars dernier, qui vise à "refléter la réalité des entreprises et non celui de l'écosystème IT" sur les différentes problématiques du Cloud computing, sur les modèles de services et sur la protection des données.
Ce groupe de travail a réfléchi à une compréhension commune du concept. Il propose de clarifier la définition du Cloud ainsi que les implications réelles pour l'utilisateur sur les coûts et la sécurité.


Une typologie du Cloud en 4 points : 
  • Géré en interne 
  • Géré en externe
  • Usage réservé à l'entreprise
  • Usage ouvert à l'extérieur

De bons usages :

Cette synthèse rassemble également des conseils et des bonnes pratiques à destination des entreprises sensibilisées à ces questions.


commons.wikimedia.org



Créé en 1970, la mission du Club Informatique des Grandes entreprises est de "promouvoir la culture numérique comme source d'innovation et de performance".



 Sources : 

Rapport du CIGREF du 26/03/2013 :
http://images.cigref.fr/Publication/2012-2013-Fondamentaux-Cloud-Computing-Point-de-vue-grandes-entreprises.pdf [En ligne] [Consulté le 11/04/2013]

Rapport Cloud Computing et protection des données Guide pratique à l'attention des directions générales et opérationnelles du 20/03/2013 :
http://www.cigref.fr/publications-numeriques/Guide-cloud-computing-2013/index.html [en ligne] [Consulté le 11/04/2013]

L'Usine nouvelle. Riha LOUKIL, 27/03/2013 :
http://www.usinenouvelle.com/article/le-cloud-computing-n-est-pas-ce-qu-on-vous-en-dit.N194088 [En ligne] [Consulté le 11/04/2013]

mardi 9 avril 2013

Intelligence Economique et information-documentation



Intelligence Économique et Information-Documentation:

l’intérêt de cet article est de pouvoir mettre en relief la valeur ajoutée et non moins grandissante du documentaliste à l'ère du web 2.0 via différentes sources.

En effet le contexte technique et économique actuelle pousse la plupart des entreprises à imaginer de plus en plus des alternatives et/ou solutions permettant de produire plus tout en réduisant au maximum leurs coûts. 

Pour ce faire, il faut s'informer ! Ce qui indubitablement pose la question du comment etc.

A partir de ce moment, de plain-pied on aborde l’intelligence économique qui n'est en réalité que de la veille stratégique et ceci,  en faisant appel aux acteurs de l'information-documentaire. En effet, aujourd'hui plus qu'hier l'entreprise a besoin de surveiller son environnement et ce n'est q'au travers d'une information qui peut devenir opérationnelle qu'elle parviendra à tirer son épingle du jeu.

Tout ceci s'inscrit dans un processus qui va de l'expression des besoins vers le rendu de l'information traitée aux acteurs concernés: c'est le cycle du renseignement.

Mais comment va-t-on  de la veille à l'intelligence économique et de quelle façon se décline réellement le rôle du spécialiste de l'info-doc?

Les réponses aux différentes questions vous les aurez sur le site de MANAGER GO!



Les sources:
  1. blogs les Échos http://blogs.lesechos.fr/intelligence-economique-r11.html
  2. Lien vers  BDD spécialisée http://search.ebscohost.com/login.aspx?direct=true&db=pcl&AN=26532475&lang=fr&site=ehost-live
  3. Lien vers BDD spécialisée http://web.ebscohost.com/ehost/detail?sid=16aa24e5-6c49-426e-b8a0-b9a2e63fe6e8%40sessionmgr114&vid=1&hid=114&bdata=Jmxhbmc9ZnImc2l0ZT1laG9zdC1saXZl#db=pcl&AN=26487522
  4. Lien vers BDD spécialisée http://search.ebscohost.com/login.aspx?direct=true&db=pcl&AN=25601160&lang=fr&site=ehost-live
  5. Un professionnel http://www.manager-go.com/intelligence-economique/
Mots clés: Intelligence économique, documentaliste, info-documentaire

La vague d'outils de curation alternatifs à Google

Après l'arrêt annoncé de Google Reader le 13 mars dernier [1], les professionnels de l'information s'interrogent sur l'utilisation des outils de curation gratuits du géant du Web. 
Un des inconvénients d'utiliser des offres gratuites d'organisation et de suivi de contenus est d'être témoin de leur disparition sur le web.

Cette vague de propositions alternatives met en lumière des acteurs moins importants de curation de contenus proposant des services similaires à Google comme ceux de Google Alerts et Google Documents.
Etant certains d'avoir une audience, puisque la plupart des veilleurs et professionnels de l'information cherchent ce type d'outils alternatifs à la lecture de la chronique d'une mort avancée de celle de Google Reader, ces fournisseurs semblent proposer des outils plutôt pertinents. Outils devenant plus performants avec le temps, l'émulation et la concurrence suscitées entre les acteurs.

Talkwalker, l'alternative à Google Alerts [2]

La chute de Google Reader a entraîné dans son passage celle de Google Alerts puisque plusieurs internautes ont pu constater de récents dysfonctionnements.
Talwalker développe un produit similaire à l'original pour convenir aux besoins des utilisateurs mais aussi une recherche avancée beaucoup plus fine.

L'interface graphique de Talkwalker est similaire à Google Alerts et comporte les mêmes fonctionnalités :
  • la recherche par mots-clés
  • l'utilisation des opérateurs booléens classiques 
  • le choix du type de contenu
  • la langue
  • la fréquence
  • le volume

Le service ajoute quelques finesses  de recherche aux fonctionnalités pour le plaisir du professionnel de l'information:
  • l'utilisation des guillemets pour les recherches effectuées sur caractère stricte
  • la possibilité de combiner ces opérateurs de recherche
  • la troncature avec l'utilisation du point d'interrogation et du caractère étoile
  • l'opérateur de proximité ~permettant d'analyser l'entourage du mot recherché entre guillemets
  • la combinaison des opérateurs booléens dans l'équation de recherche
Talkwalker n'est qu'un exemple dans la multitude des outils de curation à disposition des veilleurs. La mort d'outils monopolistiques serait-elle un bénéfice pour les chercheurs d'informations?
Kommunauty.fr [3] propose de capitaliser ces outils alternatifs au sein d'un site web. Celui-ci propose, comme critères de recherche pour la découverte de ces nouveaux outils, les services fournis par Google, créant de ce fait une standardisation des produits du Géant du web.

Sources
[1]Retour sur la fin annoncée de Google Reader, Frank Adebiaye, 19 mars 2013. (consulté le 9/04/2013)
http://bloguniversdoc.blogspot.fr/2013/03/retour-sur-la-fin-annoncee-de-google.html  
[2] TalkWalker Alerts : l’alternative de Google Alerts, Aref Jdey, 5 avril 2013. (consulté le 9/04/2013)
[3]Les alternatives à Google, Kommunauty.fr (consulté le 09/04/2013)


mercredi 3 avril 2013

Le marché d'occasion des contenus numériques : Amazon obtient son brevet

Le 29 janvier 2013, l'office des brevets américain accorde à Amazon son brevet "Secondary market for digital objects" qui concerne la revente d'occasion des contenus numériques.

Périmètre du brevet

Le périmètre du brevet concerne tous les objets numériques, livres, fichiers audios ou vidéos, applications informatiques, etc. Ainsi un utilisateur qui a "acheté auprès d'un fournisseur d'origine" un contenu numérique, pourra le revendre. Pour cela, les biens achetés seront stockés sur une médiathèque numérique en ligne. Lors de la revente, le contenu et les droits associés seront transférés du compte vendeur au compte acheteur. Ce transfert entrainera la perte définitive des droits du vendeur, sur le bien, au profit de l'acheteur. Le brevet prévoit que le nombre de transfert d'un ficher soit limité. L'objectif étant, de programmer une usure du contenu numérique, afin de calquer le marché de l'occasion des biens physiques. En effet, la revente des livre, CD, DVD, sont autorisés sans dédommagement des auteurs car l'usure du support rend le bien périssable.

Des acheteurs comblés

La mise en place d'un tel système répond à la demande des acheteurs, qui souhaiteraient bénéficier des même droits lors d'un achat de contenu numérique et d'un bien physique. Des utilisateurs de livre numérique revendiquent, dans une déclaration, le droit de :
  • facilité d'accès aux livres numériques (plus de contrainte de format propriétaire)
  • portabilité (accéder aux livres numériques sur n’importe laquelle plate-forme)
  • de conserver, d’archiver, de partager et de revendre un livre numérique acquis

La revente de fichiers musicaux numériques jugée illégale

Bien qu'Amazon n'est pas annoncé le lancement d'une plate-forme de vente d'occasion de contenu numérique, tous les acteurs intéressés par ce marché de l'occasion attendaient le jugement de la Cour de justice de New-York. En effet, la société ReDigi, qui a lancée, en 2011, sa plateforme de revente d'occasion de fichiers musicaux, a été traduite en justice. Capitol Records, maison d'édition de disques aux États-Unis, a considéré comme illégale la revente du contenu numérique. La Cour de justice de New-York a abondé dans son sens. En effet, le juge a considéré que les techniques utilisées par ReDigi ne permettent pas de certifier qu'un fichier revendu n'a pas été sauvegardé par le vendeur. Cependant, rien n'est encore figé, puisque RediGi a la possibilité de faire appel de cette décision jusqu'au 12 avril 2013.

Les questions autour de la filière de l'occasion du numérique

Apple a aussi déposé un brevet en juin 2012 qui concerne "la gestion d’accès à des éléments de contenu numérique». Qu'en est-il de Google ?
Les techniques déposées dans les brevets d'Amazon et Apple palient-elles au problème de sauvegarde évoqué par la Cour de justice de New-York ?
Comment les auteurs et éditeurs vont-ils s'intégrer dans ce nouveau modèle économique ?

Affaire à suivre...



Sources :






Base américaine des brevets - Secondary market for digital objects


Usages d'Internet dans les pays développés : l'éclairage d'une enquête canadienne

L’Union internationale des télécommunications (ITU) a mis en ligne son rapport provisoire sur la situation mondiale des TIC en 2013.

Selon ce rapport, plus de 39% de la population mondiale est  désormais connectée à Internet, ce qui représente plus de 2.7 milliards d'usagers.
On note une forte variation de la couverture selon le développement économique du pays : si 77% de la population des pays développés a accès à Internet, ce pourcentage tombe à 31% dans les pays en voie de développement.C'est en Europe que ce taux est le plus élevé (75%), suivi par le continent américain (61%).


Mais quels sont les usages majoritaires que la population a d'Internet dans les pays développés?
La publication des résultats d'une enquête de 2012 sur les pratiques des TIC au Québec apporte un éclairage sur ce point.
Cette enquête "NETendances", réalisée par le Cefrio (centre facilitant la recherche et l’innovation dans les organisations), montre qu'on utilise "Internet comme source d’information et mode de communication".

Internet de plus en plus présent dans les pratiques informationnelles


Internet constitue la source d'information majoritaire sur l'actualité pour un Québécois sur cinq.
Cela place ce média en 3e position, devant la radio, mais encore légèrement derrière la presse écrite.
La télévision reste le 1er média d'information pour près de 50% de la population adulte totale, mais, fait marquant, cette tendance s'inverse chez les jeunes.
Chez les 25 -34 ans, Internet rattrape ainsi le média télévisuel. Et chez les plus jeunes les (18-24 ans), Internet s'affirme comme source la plus utilisée pour s'informer sur l'actualité.

Ce sont les sites Internet dédiés à l'actualité que les usagers consultent préférentiellement.
Les microblogs comme Twitter et les fils RSS constituent quant à eux une source marginale d'information sur les faits d'actualité.
 

Internet constitue un mode de communication pour 75% des internautes


Autre point marquant de l'enquête québécoise, Internet y est désormais le 2e mode de communication, derrière le téléphone fixe.
Le courriel est le mode de communication électronique le plus usité, que ce soit dans un cadre professionnel ou personnel.
Concernant les réseaux sociaux, un internaute sur deux les utilise pour échanger.


Sources :

NETendances 2012 : Internet comme source d'information et mode de communication / CEFRIO. Mis en ligne le 20 /03/2013.

ICT Facts and Figures : The World in 2013 / Union internationale des télécommunications. Mis en ligne le 20/02/2013