jeudi 30 mai 2013

Du "search" au "data intelligence", les moteurs de recherche présentés par leurs éditeurs

L'INTD organise aujourd'hui, 29 mai 2013, une journée de rencontres avec des éditeurs autour des moteurs de recherche. Cette journée intitulée, "Vision 360°" des moteurs de recherche d'entreprise et Data Intelligence, est co-organisée par Maryse Carmes, responsable du titre 1 Chef de projet en ingénierie Documentaire et Eric Debonne, fondateur de Taligentia.

Eric Debonne résume la problématique actuelle par "rechercher du sens à un ensemble d'information".

Le réseau social d'entreprise avec la société Jamespot

Alain Garnier, a travaillé dans la sémantique et est actuellement PDG de la société Jamespot[1]. Cette entreprise édite une solution de RSE métier (Réseau Social d'Entreprise) adaptable facilement par paramétrage, sans avoir recours à des informaticiens. Alain Garnier pense que le point d'entrée aux données sera, dans le futur, les réseaux sociaux d'entreprise car ce sont les humains qui produisent des données et du sens. Les RSE sont des générateurs naturels de données non structurées auxquelles les personnes donnent du sens.

Il présente un projet en Rhônes-Alpes et ses usages principaux :

  • Travail collaboratif 
  • Communication
  •  Multi-sites
  •  Veille collaborative
  •  Talents
  •  Travail en mobilité
  •  Evènements
  •  Association
  •  Co-création
  •  Connaissances

Le web sémantique avec la société Mondeca

Alexander Polonsky présente l'offre de la société Mondeca[2] à travers le projet Smart Content Factory pour @data.gouv.fr.

Le but est de rendre les contenus plus intelligents pour :

  • Accroitre la valeur pour les utilisateurs avec un accès plus efficace et personnalisé, une lecture et analyse facilitées et une précision dans l’accès à l’information. 
  • Accroitre les revenus par la consommation grâce à la visibilité et la réutilisation.
Cela demande d'améliorer les processus génériques par la connaissance métier et d'interconnecter les contenus structurés et non structuré. En se basant sur la sémantique, les données sont présentées de façon complémentaire.

Le Linked Entreprise Data par Antidot

Pierre Col présente l'offre d'Antidot[3] pour sortir du système des silos grâce au Linked Entreprise Data. L'idée est d'appliquer les fondements du web de données et des standards du W3C aux données publiées par les entreprises. Pour cela il faut que les données soient suffisamment décrites pour qu'une machine puisse en récupérer le sens et naviguer entre elles pour faire émerger l'implicite.

L'offre se présente sous forme de briques à assembler, là aussi sans besoin d'informaticien.  La mise en place dans une agence publique a permis de répondre aux besoins suivants :

  • Faciliter la recherche d’information transversaleProposer une visibilité analytique et synthétique de l’info
  • Naviguer facilement sur les données
  • Consolider l’information
  • Fédérer la recherche sur plusieurs sources internes et externes

Le moteur de recherche Open Source Elastic Search

David Pilato présente le moteur de recherche sa société basée, Elastic Search[4], sur la technologie Apache Lucene. Le but du moteur de recherche est d'être capable d'indexer des données rapidement avec une recherche distribuée et de présenter les réponses de façon conviviale avec une présentation en facette. Le conseil de David Pilato pour commencer : "oublier le concept de relations entre les tables et penser document".
Cette solution, très regardée dans le monde Java, ne permet cependant pas de rechercher facilement des documents de nature différente sans un travail important de préparation de données.Il n'y a pas de travail sur les métadonnées des documents.

Les applications de recherche métiers avec Polyspot

Gilles André présente l'offre de solutions de la société Polyspot[5] : des applications de recherche métiers. Son offre se base également sur des développements open source, avec notamment le moteur de recherche Solr. Pour lui, le big data va révolutionner la gestion de l'information. Il représente l'opportunité offerte à une entreprise d'utiliser l'océan de données qu'elle a elle-même produite. Cela se fera autour de trois dimensions, les fameux 3 V pour variété, vélocité et volumétrie. La vélocité s'illustre par le fait qu'on ne sait plus dans quelle application se trouve l'information recherchée. On tend à rechercher et consulter via des moteurs de recherche transverses les documents produits ailleurs. On devient "information-centrique".

Polyspot offre des fonctionnalités métiers complétant des technologies open-source complexes. 

Le rapprochement de données avec Taligentia et le Ministère de l'enseignement supérieur et de la recherche

Eric Debonne clôture cette journée en présentant un projet de sa société Taligentia[6] avec son partenaire du Ministère autour du rapprochement de données pour la construction d’un référentiel.

[1] Jamespot www.jamespot.com
[2] Mondeca www.mondeca.com
[3] Antidot www.antidot.net
[4] Elastic Search www.elasticsearch.org
[5] Polyspot www.polyspot.com
[6] Taligentia www.taligentia.com

mercredi 22 mai 2013

Elsevier- Mendeley : pour quel avenir ?

Le 9 avril dernier, ce qui n'était qu'une rumeur de début d'année, se concrétise en acte de rachat. Le géant de l'édition Elsevier s'offre le logiciel libre Mendeley pour une somme de 53 M€.[1] Après indignation des utilisateurs du logiciel dans leur ensemble favorables à l'open access, Elsevier s'est mis dans la posture de celui qui rassure en précisant que "Mendeley fournit le chaînon manquant ... et amène Elsevier au plus près de ces clients".[2] Avec persuasion, sûrement ; Avec succès, l'avenir le dira ; Cette première étape de justification ne fait pas perdre de vue les interrogations quant au projet d'évolution de cette acquisition.

Mendeley : un outil en faveur de l'open access


De nombreux logiciels de gestion de références bibliographiques existent, EndNote (payant), Zotero (gratuit). Convenant parfaitement aux  chercheurs pour des fonctions collaboratives et de mise en réseau, Mendeley est un logiciel de gestion bibliographique, et de partage exemplaire, favorisant la politique du libre accès. Les utilisateurs peuvent  conserver et échanger des données. Né à Londres en 2007, composé d'un logiciel gratuit de bureautique, et d'un réseau web, Mendeley  fait partie de ces outils dont la prise en main est intuitive. Un point fort non négligeable, il « réussit le pari de centraliser l’information et est une partie de la cure aux problèmes d’infobésité. »"[3]

Elsevier : une position boycottée par de nombreux universitaires


Très connu pour sa plateforme ScienceDirect et sa base de données Scopus, Elsevier est un des plus grands éditeurs mondiaux de revues scientifiques. Une place enviable mais critiquée. « Plus de 10 000 universitaires du monde entier ont déjà signé la pétition, "Le coût du savoir". Elle appelle au boycott de Elsevier, le géant hollandais de l'édition qui publie 2 000 revues scientifiques différentes par an. En cause : le prix des abonnements à ces revues que payent les bibliothèques des universités. Elles dépenseraient souvent plus de la moitié de leur budget dans ces achats à trois grands éditeurs commerciaux : Elsevier, Springer et Wiley. » [4]

Mendeley-Elsevier : un duo qui dérange …


L’émergence d’interrogations chez les usagers ne manque pas, même si une certaine confiance dans l’avenir se manifeste chez certains.  « Plusieurs des utilisateurs de Mendeley craignent un glissement de sa mission, alors que d'autres sont heureux de voir arriver un partenaire avec d'aussi grandes ressources, pour enfin permettre à Mendeley de se développer».[5] L’enthousiasme n’est pas général, au regard des données stockées, « Elsevier pourra bientôt connaître toutes les références collectées par les enseignants-chercheurs, quand, comment et avec qui les articles sont partagés. Une quantité gigantesque de données personnelles qui leur servira pour la production de nouveaux services aux clients (universités, chercheurs, bibliothèques) ciblés et facilement monnayables ». [6]

L’utilisation des données se fera à fin utile,  précise Victor Henning, co-fondateur et directeur de Mendeley, « l'analyse des tendances de la recherche et de l'impact scientifique, sans violer la vie privée des utilisateurs Mendeley. C'est ainsi que nous allons le garder dans l'avenir, et cela vaut pour toute utilisation de ces données par Elsevier ou via notre API ouverte ».[7]



Duo à suivre …

[1] VAJOU, Michel,Actualité : Reed Elsevier rachète Mendeley pour 53 millions d'euros,
Information extraite de la Dépêche du GFII. L’ensemble de l’analyse est disponible sur le réseau social du GFII, AMICO, réservé aux membres du GFII, 10 avril 2013.
http://www.gfii.fr/fr/amico/345
[2] VICTOR, Henning, Mendeley and Elsevier – here’s more info, Mendeley Blog, 19 avril 2013.
http://blog.mendeley.com/community-relations/mendeley-and-elsevier-heres-more-info/
[3] GAGNON,Vicky, Collaborer et échanger… avec Mendeley, Tribune Compétences Informationnelles, 22 avril 2013.
http://tribuneci.wordpress.com/author/vgagnon/
[4]  BENJAMIN, Anna, Harvard rejoint les universitaires pour un boycott des éditeurs, Le Monde, 25 avril 2012
http://www.lemonde.fr/sciences/article/2012/04/25/harvard-rejoint-les-universitaires-pour-un-boycott-des-editeurs_1691125_1650684.html
[5] DUGAS, Marie-Eve, Inrs, service de documentation et d'information spécialisées, Mendeley passe aux mains du géant Elsevier, 9 avril 2013
http://sdis.inrs.ca/mendeley-elsevier-acquisition
[6] ALARCON, Nicolas, Mendeley racheté par Elsevier. Le moment de passer à Zotero !, Bibliothèques de l'université, Bibliothèque de la Réunion, 15 avril 2013.
http://blog.univ-reunion.fr/blogpapang/tag/elsevier/
[7] VICTOR, Henning, Mendeley and Elsevier – here’s more info, Mendeley Blog, 19 avril 2013.
http://blog.mendeley.com/community-relations/mendeley-and-elsevier-heres-more-info/






mardi 21 mai 2013

Les Coffres forts Numérique : Une solution adaptée à vos besoins



L’usage des services coffres-forts électroniques a connu un essor significatif au cours de ces dernières années par le grand public. Ces services répondent en effet à des besoins essentiels comme la sécurisation des documents administratifs électroniques, justificatifs numérisés, la préservation du patrimoine numérique familial ou la protection des données à caractère personnel.

 La commission de normalisation 171 de l'AFNOR (CN171) a publié en juin 2012 la norme NF Z42-020 dont le titre est : "Spécifications fonctionnelles d'un composant Coffre-Fort Numérique destiné à la conservation d'informations numériques dans des conditions de nature à en garantir leur intégrité dans le temps". Cette norme est étroitement liée à la norme NF Z42-013.

Selon l'étude de Markess International "Archivage de contenus électroniques à vocation probatoire, approches et perspectives 2014" le marché de l'archivage des contenus numériques pesait 125 millions d'euros. Soit une augmentation de 19% entre 2011 et 2012.
 
Les objectifs :

 Archiver des documents électroniques correspond à l'idée de pérennité de l'information avec la possibilité de la restituer intègre et fidèle, c'est à dire identique en tout point à celle de son origine. Cette opération visant à conserver des informations ayant une valeur probatoire ou des effets juridiques concerne toutes les personnes juridiques sans exception, qu'elles soient physiques, morales, privées ou publiques

Pour les organisations qui le proposent, le coffre-fort numérique grand public permet d’enrichir leurs portails Internet, de favoriser la fidélisation de la clientèle, de proposer de nouveaux services dans la durée et de réduire les coûts de communication.

« Depuis la création de Cecurity il y a plus de 10 ans, nous avons la conviction que le coffre-fort électronique n’est pas uniquement destiné à l’archivage légal des entreprises, mais qu’il est aussi le socle sur lequel doivent se bâtir les applications de dématérialisation à destination des particuliers » affirme Alain Borghesi, Président directeur général de Cecurity. « Le nombre de coffres-forts numériques ouverts par l’ensemble de nos clients nous incite à poursuivre nos investissements, notamment pour faire évoluer les interfaces et pour faciliter les usages via les mobiles et les tablettes ».


 Pour aller plus loin :

http://www.archimag.com/article/coffres-forts-%C3%A9lectroniques-diff%C3%A9rents-choix-de-blindage

http://www.primobox.com/archivage_electronique.html?_kk=coffre fort electroniqu

http://www.cecurity.com/site/Documentation/Presse/2013/PRESSE_Communique_Projet_UnMillionCFE_Cecurity_130319.pdf

http://www.markess.fr/home.php

 






mercredi 15 mai 2013

Sexiste, Wikipédia ?



Selon Jimmy Wales, le co-fondateur de Wikipédia, « il n’y a pas eu de décision systématique par les administrateurs ni les utilisateurs réguliers » en ce qui concerne le déplacement de femmes écrivains depuis la catégorie Romanciers américains vers une nouvelle sous-catégorie Romancières américaines.

Bibliomancienne attire notre attention vers cette récente déclaration concernant des allégations de sexisme par Wikipédia. Les déclarations de Jimmy Wales nous rappellent d’abord la confusion qui peut encore exister dans l’esprit des gens en ce qui concerne la nature collaborative du site. Il reconnaît ensuite la « manière aléatoire dont les catégories sont gérées » chez Wikipédia.

Pour comprendre l’histoire il faut se référer à un article du New York Times par l'écrivaine américaine Amanda Filipacchi paru le 24 avril dernier. Elle décrit le déplacement des femmes écrivains et l’utilisation de cette nouvelle sous-catégorie. En revanche, une  catégorie correspondante romanciers américains masculins n’a pas été créée.

Le point de départ de la création de la sous-catégorie aurait été un constat que la liste d'auteurs mixte était trop longue. Le titre de l’article Le sexisme de Wikipédia envers les romancières ne laisse pas de doute : selon l'auteur « l’intention serait de créer une liste de Romanciers américains sur Wikipédia qui serait composé presque entièrement d’hommes » avec les conséquences néfastes que cela pourrait avoir pour la reconnaissance et l'appréciation du travail des femmes.

La parution de l’article a rapidement provoqué des réactions dans la blogosphère, sur Twitter et parmi les éditeurs de Wikipédia. En effet, le sujet attire des réactions de bibliothécaires, féministes et Wikipédiens pour ne citer que les plus évidents. D'une part, on a ceux qui sont d'accord avec Amanda Filipacchi pour dire que le choix est sexiste ; d'autre part on a ceux qui trouvent qu'il s'agit, au contraire, de mettre en valeur les écrivains féminins et de faciliter les recherches des utilisateurs. Par ailleurs, nous trouvons ceux qui estiment que de toute façon les journalistes ne comprennent pas le fonctionnement de Wikipédia, notamment la nature évolutive de son contenu et son système de collaboration.

Tous ces sentiments apparaissent également dans les échanges des éditeurs de Wikipédia à ce sujet - un débat intense et plutôt féroce qui a eu lieu entre le 24 avril et le 2 mai. Au final, le créateur de la sous-catégorie met lui-même en cause son « manque de rigueur » pour ne pas avoir créer une sous-catégorie pour hommes en même temps que la sous-catégorie pour femmes. Enfin, la décision a été prise de remettre les auteurs femmes dans la catégorie Romanciers américains « en gardant la sous-catégorie Romancières américaines car c'est un domaine d’étude littéraire reconnu  ».

Alors que cette histoire semble être bouclée, elle nous rappelle néanmoins les réels soucis auxquels Wikipédia fait face en ce qui concerne :
1) la problématique de création des catégories. Pour certains, créer des sous-catégories apporte des précisions en ce qui concerne le genre, la race, la sexualité, etc. des personnalités ; pour d'autres cela ne représentent qu'une « ghettoïsation »  des ces personnes ; et
2) la faible contribution par les femmes à Wikipédia : moins de 15 % selon une enquête en 2010 par UNU-MERIT de l'université des Nations unies...

Pour aller plus loin :

Une nouvelle façon d'apprendre


Jeudi 30 mai 2013, un workshop sera organisé de 9h à 18h, à l'Université Paris Diderot, sur les MOOC. Il sera décomposé en quatre parties, celles couvrant les différentes dimensions des MOOC.

 

Ce nouvel acronyme signifie Massive Open Online Courses (MOOC), n'ayant pas de sigle français normalisé, il est traduit par enseignement de masse ouvert en ligne.
Les MOOC sont apparus aux Etats Unis en 2008 avec l'utilisation massive d'Internet et une consultation croissante des cours en ligne. C'est en 2012 qu'ils sont réellement entrés dans l’ère du nouvel enseignement par la création d'une start up fondée par Harvard et le MIT, Edx.
Quelle est la différence entre un cours en ligne et les MOOC ?
Les cours des meilleures universités américaines, espagnoles, françaises-Polytechnique va mettre en ligne trois cours en mathématiques, mathématiques appliquées et informatique de septembre à décembre 2013- sont accessibles en ligne et gratuitement. Cela permet aux personnes qui décident d'aller jusqu'au bout des cours, de rendre les travaux et d'avoir des notes, d'obtenir non pas le diplôme mais un certificat qui celui-ci est payant.
Cette nouvelle forme d’accès à la connaissance remet en question le modèle économique classique de l'enseignement supérieur, le rôle des enseignants. Les aspects technologiques et  les retours d'expérience d'entreprises et d'écoles françaises seront également abordés lors du workshop.

Sources consultées le 15/05/2013
Programme du workshop http://workshop.lemooc.com/fr/programme/
Les MOOCs à l’assaut du Mammouth.,.LE MONDE,

Pour en savoir plus
L’École polytechnique fait peau neuve ! : entretien avec Marion Guillou, sa présidente, et Yves Demay, son directeur général 
http://orientation.blog.lemonde.fr/2013/05/15/lecole-polytechnique-fait-peau-neuve-entretien-avec-marion-guillou-sa-presidente-et-yves-demay-son-directeur-general/
Wikipédia
 http://fr.wikipedia.org/wiki/Cours_en_ligne_ouvert_et_massif





mardi 14 mai 2013

L'illectronisme, un enjeu de taille

«Nous vivons à l’ère de la révolution de l’information. C’est une révolution qui offre beaucoup de liberté, un peu de fraternité et aucune égalité», déclarait en 2004 Shashi Tharoor, sous-secrétaire général des Nations unies pour les communications et l'information publique jusqu’en 2007.

Selon Wikipedia, "L'illectronisme est un néologisme, traduction de information-illiteracy, qui transpose le concept d’illettrisme dans le domaine de l’information électronique : il s’agit d’un manque de connaissance des clés nécessaires à l’utilisation des ressources électroniques". Alors que la lutte contre l’illettrisme est déclarée Grande cause nationale 2013, plusieurs médias s'interrogent sur les difficultés qu'éprouvent un certain nombre de nos concitoyens face aux ordinateurs, tablettes et autres smartphones. 

Un handicap social


Ce mal moderne toucherait environ 15% de la population selon Bernard Benhamou, délégué aux usages de l’Internet pour le Ministère de la Recherche et de l’Economie numérique. Or, «tout est mis en œuvre pour inciter les gens à utiliser de plus en plus les services numériques ce qui accentue davantage encore le sentiment d’exclusion», observe-t-on à l’association Education & Formation.

De plus en plus de services sont proposés sur la toile, notamment dans l’administration. Gérard Valenduc, codirecteur du centre de recherche " Travail et technologies", interrogé par Atlantico, détaille : "L’illectronisme entraîne un phénomène d’exclusion sociale ou de marginalisation sociale dans plusieurs domaines : l’emploi et la formation principalement. Mais il est également handicapant dans la communication avec les autres (courriels, réseaux sociaux), dans l'accès à l’information en ligne (culturelle, sportive, journaux, voyage...)"

Parmi les 8 compétences clés nécessaires à chaque individu dans nos sociétés, l'UE compte "la compétence numérique qui implique l'usage sûr et critique des technologies de la société de l'information (TSI) et, donc, la maîtrise des technologies de l'information et de communication (TIC)." 

L'ergonomie au centre des enjeux


Dans un article du Bulletin des bibliothèque de France, datant de 2000, la reflexion était déjà lancée autour de ces questions : "L’appropriation de nouveaux moyens de recherche de l’information, tel qu’un catalogue informatisé par exemple, par les usagers, n’est pas une évidence : il peut exister des handicaps d’ordre pratique – la manipulation des outils informatiques –, mais aussi des obstacles venant du contenu, et notamment de la structuration de l’information spécifique à ces supports."

Elie Maroun, chargé de mission à l’Agence nationale de lutte contre l’illettrisme, précise le champ couvert par l'illectronisme : «Une difficulté qui peut se traduire autant par la manipulation de ces nouveaux outils —computer illiteracy— que par une incapacité à accéder aux contenus de l’information numérique et à les comprendre —information illiteracy».

Les métiers de l'infodoc sont au cœur de ces problématiques. La structuration des contenus, leur lisibilité, leur pertinence font partie du travail quotidien du documentaliste. Il s'agit pour les professionnels de prendre en compte l'illectronisme non seulement lorsqu'il pousse les informations et les contenus vers le public, mais aussi comme un sujet dans lequel ses compétences pourraient être valorisées.

 «Il s’agit d’une machine qui change de configuration en permanence. Contrairement à un toaster ou un fer à repasser, où un bouton est égal à une fonction, sur Internet un bouton correspond à une multitude de fonctions», détaille ainsi Bernard Benhamou. "L’ergonomie sera un des principes de démocratie de nos sociétés numériques.»

Sources :

HADOPI enterrée ?


François Hollande, lors de sa candidature aux présidentielles de 2012, parlait de supprimer la Haute Autorité pour la diffusion des oeuvres et la protection des droits sur internet (HADOPI). Et la remplacer par une législation ciblant les fabricants de matériels et les fournisseurs d'accès.
Le projet est en cours puisque hier, Pierre Lescure, ancien patron de Canal+, a donné au chef de l'Etat, un rapport de 80 propositions pour la fin d'HADOPI.

Retour sur cette Haute Autorité
 
Ses missions ont été définies lors de la loi création et internet en 2009 :
  • Promouvoir le développement de l’offre légale et observer l’utilisation licite et illicite des œuvres sur Internet.
  • Protéger les œuvres à l’égard des atteintes aux droits qui leur sont attachés dans le cadre de la réponse graduée.
  • Réguler l’usage des mesures techniques de protection.
La réponse graduée comptait 1,7 millions de messages d'avertissements envoyés aux internautes ayant utilisé des oeuvres protégées depuis octobre 2010. Mais le constat est là : il n'y a aucun d'avantage économique à l'utilisation de cette risposte.
II fallait ainsi passer à autre chose...c'est écrit dans le rapport de Pierre Lescure. 

La mission "Acte II de l'Exception Culturelle" fait ses propositions, quelques exemples

  • De l'usage de la copie privée ou comment mieux l'encadrer avec un nombre minimal de copies.
  • Des tatouages numériques remplaceraient les DRM bloquants. Et le CSA veillerait à l'interopérabilité des mesures techniques de protection.
  • Un dispositif qui risque de faire grincer des dents les fabricants et distributeurs d'ordinateurs, smartphones, tablettes, téléviseurs connectés et consoles : une taxe pour compenser le transfert de valeur des contenus.
  • Des oeuvres en ligne  laissées disponibles dans une offre légale. Offre qui selon le blog S.I. Lex, est dangereuse car elle rend plus puissants les géants du net, Amazon et Apple. 


Plus de contrôle sur les internautes ?


La probable disparition d'HADOPI n'empêcheront pas l'interdiction du partage sur internet et la répression de la contrefaçon. Et comme il faut de toute façon une autorité de contrôle du piratage, le CSA deviendrait le régulateur de l'offre numérique.

Rien n'est fait pour le moment, ce ne sont que des avis préalables, il faut attendre les réactions du gouvernement...

En savoir plus : 

 

Site officiel HADOPI

Télécharger le rapport Lescure

Articles numériques