mardi 31 mai 2011

Perspectives de l'e-G8


Perspectives électroniques du G8

Une réunion voulue.

Ce billet fait un bilan du sommet sur le plan de l'internet. En effet à côté du G8,
s'est tenu l'e-G8.Cette réunion voulue par le président français visait à combler le
fossé entre les peuples et les dirigeants.
Dans son mot d'accueil au forum e-G8, le président de la République a réaffirmé
son attachement aux valeurs des Lumières et fait d'internet leur successeur. Il a
insisté sur la promotion de la liberté d'expression permise grâce à internet.

Des enjeux de politique intérieure.

C'est en effet un enjeu politique pour tout chef de l'Etat de prouver sa
compréhension des enjeux du virtuel. L'entrepreneur comme base électorale
semble se substituer à l'agriculteur.Plus largement à l'e-G8 c'est la société civile
qui était invitée avec l'idée d'influer sur le G8. Cette attention visait à
contrebalancer les critiques portant sur le manque de démocratie de la
mondialisation.
Mais le discours présidentiel va plus loin pour rassembler technologies et écologie
autour de l'éco-système. Il souligne aussi le poids des échanges de 8000 milliards
d'euros chaque année. C'est la dématérialisation dont il souligne le poids.

Des résultats décevants.

La fin du sommet, mercredi 25 mai, n'a pas satisfait toutes les attentes. Ainsi
l'harmonisation fiscale n'a pas progressé alors qu'elle est essentielle pour les
européens au niveau politique et pour les entrepreneurs au niveau économique.
Or, la déclaration finale du G8 encourage les Etats à légiférer alors que les
participants à e-G8 souhaitaient des législations plus légères.
Ce qui est central, c'est la gouvernance de l'internet.
Quelle place a accorder à l'internaute dans la répartition des pouvoirs entre sphère publique et sphère privé?


Open Jukebox

L'utilisation des données publiques agite la place et fait grand débat. Qu'on pense aux enjeux soulevés (économiques, dans un premier temps) ou aux dérives à encadrer (par exemple pour la réutilisation des données personnelles), il y a, en effet, bien du travail. Pourtant, quel formidable potentiel!

Et la culture alors?

En France, la difficile articulation du droit d'auteur avec la loi de réutilisation des informations publiques (Loi n°78-753 du 17 juillet 1978, article 11) laisse les données culturelles à part. Pas tout à fait comme les autres, mais pas complètement exceptionnelles, elles doivent rester réutilisables pour ce qu'elles ont de meilleur à offrir et auquel chacun a droit, dans le respect de la propriété intellectuelle et des données personnelles qu'elles peuvent contenir... Plus facile à dire qu'à faire: entre imbroglio, vide juridique et latitude d'interprétation des textes, la route est large et la destination incertaine.

Dans ces moments de découragement, il peut être réconfortant de jeter un oeil (et une oreille) chez les autres. Car oui, certains arrivent à tirer le meilleur des possibilités de l'"open data" pour la diffusion de leur patrimoine culturel.
Plusieurs initiatives ont vu le jour, de la Grande Bretagne (3 millions de notices bibliographiques de la British Library disponibles en licence CCO -"no rights reserved" en licence Creative Commons) à l'Australie (participation des bibliothèques et archives au portail national de données publiques australien, www.data.gov.au), en passant par les Etats-Unis.

Un monde, une époque, à découvrir en quelques clics


La Library of Congress (Washington, USA) vient de partager gratuitement, avec l'aide de Sony music, la "Largest Collection of Historical Recordings Ever Made Publically Available Online". Plus de 10.000 titres datant de 1901 à 1925 (produits, entre autres, par Columbia Records, OKeh, et Victor Talking Machine Co.) et appartenant à plusieurs genres (musique populaire, musique pour danser, opera, early jazz, discours célèbres, poésie et humour) sont à écouter en ligne sur le National Jukebox (www.loc.gov/jukebox/).

Les oeuvres sont sous une licence spécifique qui donne à la LOC le droit de les rendre accessibles gratuitement (en streaming); Sony, propriétaire des labels utilisés, se réserve la possibilité de retirer certains titres dans l'avenir pour en faire une utilisation commerciale.
Bien sûr, on peut penser que ces 10.000 titres disponibles sur les 3 millions que contient le fonds d'enregistrements sonores de la LOB ne sont qu'une goutte d'eau dans un océan. Bien sûr, il faudra voir si le succès des premiers jours se maintient (248.000 titres écoutés en moins de 48 heures selon le Los Angeles Times du 12 mai 2011). Peut-être que ce succès est tout relatif.

L'espoir qu'il donne, lui, est bien réel, et parfois il n'en faut pas plus pour se remettre au travail et envisager vraiment de résoudre les problèmes. Parfois.



SOURCES:

- Données publiques, données personnelles, données culturelles:

Et si la culture s'ouvrait à l'open data?, Calimaq, 25-05-11
http://owni.fr/2011/05/25/et-si-la-culture-souvrait-a-lopendata/

Réutiliser les données des archives publiques, un droit gazeux, Michèle Battisti, Paralipomènes, 20-03-11
http://paralipomenes.net/wordpress/archives/4110

L'ouverture des informations publiques : un enjeu pour le développement de l'économie numérique, 20-05-10
(Dans le cadre du cycle de séminaires organisé par le GFII "Economie numérique : le nouveau partage de la valeur")
http://www.gfii.asso.fr/fr/document/l-ouverture-des-informations-publiques-un-enjeu-pour-le-developpement-de-l-economie-numerique?symfony=nv3j3dc2rkfbh4kpsvn0v379c4

- National Jukebox:

La bibliothèque du Congrès ouvre un jukebox patrimonial, Christelle Di Pietro, ENSSIB, 13-05-11
http://www.enssib.fr/breves/2011/05/13/la-bibliotheque-du-congres-ouvre-un-jukebox-patrimonial

National Jukebox website logs 1 million page views, 250,000 streams in under 48 hours, LA Times, 12-05-11
http://latimesblogs.latimes.com/music_blog/2011/05/national-jukebox-library-congress-sony-music-1.html

News from the Library of Congress, 10-05-11
http://www.loc.gov/today/pr/2011/11-087.html

mardi 24 mai 2011

eG8 Paris, capitale de l'internet ! du mardi 24 - mercredi 25 mai 2011

A la veille de l'année 2012, année butoir pour l'objectif du "Tout Numérique" en France (Rapport Besson), Paris devient terre d'accueil pour deux jours du Tout Internet à deux pas du Palais du Louvre, au coeur du Jardin des Tuileries ! Voulu par le Président de la République française, cette grande messe réunissant les grands noms de l'Internet mondial, est destinée à nourrir les réflexions sur Internet des Etats du G8, qui doivent se réunir quelques jours plus tard à Deauville (27-28 mai). Court délai pour assimiler autant d'informations et d'idées (de qualité n'en doutons pas !) mais nous faisons confiance aux grands de ce monde pour n'en retenir que le meilleur !

En effet, le thème est vaste s'il s'agit d'aborder tous les domaines touchés par le phénomène Internet : impact sur la croissance, éducation, propriété intellectuelle, 'innovation, mobilité, liberté d'expression, fiscalité, développement des infrastructures de réseaux, droit des individus, droits de reproduction des oeuvres... cette liste ne peut prétendre à l'exhaustivité.

La question comment réguler et surtout contrôler Internet à l'heure où chaque internaute a la possibilité de créer son propre espace et de s'exprimer sans connaître forcément les règles de droit à respecter : droit des individus, de la propriété intellectuelle ... Toutes ces règles qui ont été établies bien avant la création et la diffusion d'Internet mais qui ne sont pas appliquées de la même façon partout dans le monde... Contrôler certes mais ne bridons pas non plus la créativité et le partage, des notions positives qui se dégagent également.

Donc la question peut-on réellement encore contrôler Internet ?

Beaucoup d'enjeux économiques également autour d'Internet puisque pour citer le Président de la République :
"En quelques années, vous avez bouleversé les fondements même de l'économie mondiale dont vous êtes devenus des acteurs majeurs. Aujourd'hui ce sont plus de 8000 milliards d'euros qui sont échangés en une année par le biais du e-commerce.
La contribution de ce fantastique outil technologique qui balbutiait encore il y a dix ans à peine pèse aujourd'hui près de 3% du PIB mondial. Soit un poids supérieur à celui de l'agriculture ou de l'énergie. Sa contribution à la croissance mondiale serait même aujourd'hui de 20%."

Beaucoup de questions et d'enjeux auxquels il semble difficile de répondre en seulement quatre jours !


Tout savoir sur l'eG8
http://www.eg8forum.com/fr/

Retrouvez le discours du Président de la République :
Ressources (non exhaustives)
http://www.lefigaro.fr/hightech/2011/05/24/01007-20110524ARTFIG00445-internet-un-poids-croissant-dans-l-economie.php
http://lexpansion.lexpress.fr/high-tech/ce-qu-il-faut-savoir-sur-l-eg8_255965.html?p=2

I-Expo : un salon plein de ressources !

L'édition 2011 du salon I-Expo s'est déroulé au ViParis à la Porte de Versailles les 18 et 19 mai dernier.

Ce salon, dédié aux professionnels de l'information, a fait le point sur les "i" !

Avec plus de 130 exposants les sujets portaient sur l'Information numérique, l'Innovation, l'Intelligence individuelle et collective...

De nombreux ateliers (payants malheureusement) proposaient des retours d'expériences très riches, notamment dans le domaine des archives et de la gestion des connaissances, les pratiques de veille en entreprise ou encore sur l'ouverture des données publiques dans les collectivités locales.

Heureusement les conférences plénières était en accès libre et là encore, les constats et retours d'expériences ont été forts ! Quelques exemples de sujets, tout aussi intéressants les uns que les autres : Mobilité du grand public vers l'entreprise ; Confidentiel entreprise : quelles protections pour les informations stratégiques ? ou encore Réseaux sociaux : quels enjeux pour les services d'information dans les organisation ?

Bien sûr, il était possible de se rendre sur les stands en rapport avec nos projets personnels et un panel très diversifié de professionnels s'offrait à nous :
- Editeurs de presse économiques, professionnelles et spécialisées (Documentaliste : SI, Archimag ; l'Informaticien, Stratégies, Le Moci, l'OCDE, ....),
- Editeurs de BDD (Kompass, Cairn Info, ...) ;
- Editeurs de solutions des gestions et/ou d'accès à l'information et de systèmes de veille (Ixxo, Digimind, Ami software....).

Etaient présents également des associations et organismes de renom comme le GFII, l'ADBS, le CNRS, l'INPI, l'ADIJ, Questel, sans oublier les écoles spécialisées dans notre secteur.

Tous les sujets y étaient : communication marketing, document numérique, gestion des connaissances, informations juridiques, économiques et financières, les sciences et techniques, l'intelligence économique et la veille, les réseaux sociaux, la valorisation et le management de l'information...

Pour tous ceux qui n'ont pas pu venir, allez vite sur le site de I-Expo !
Vous pourrez vous y procurer les coordonnées de tous les professionnels présents. et prochainement un certain nombre d'interventions seront mises également en ligne.

Un beau petit trésor de contacts et d'informations pratiques à ne pas rater en attendant le prochain salon !

http://www.i-expo.net/fr/

lundi 23 mai 2011

« Les archives ouvertes en 2011 », journée d’études organisée par l’ADBS

Quelques rappels pour comprendre les enjeux

« Le terme archive ouverte désigne un réservoir où sont déposées des données issues de la recherche scientifique et de l’enseignement et dont l’accès se veut ouvert, c’est-à-dire sans barrière. Cette ouverture est rendue possible par l’utilisation de protocoles communs qui facilitent l’accessibilité de contenus provenant de plusieurs entrepôts maintenus par différents fournisseurs de données.

Une archive institutionnelle relève d’une institution (université, grande école, organisme de recherche, association professionnelle) et a pour objectif de contenir, valoriser et conserver l’ensemble de la production scientifique de celle-ci.

Un entrepôt OAI est une base de données, constituée par un fournisseur de données, qui supporte le protocole OAI-PMH. Cet entrepôt contient des métadonnées qui sont disponibles dans différents formats afin de répondre à différents types de demandes. » [1]

L’importance de ces archives est liée aussi à l’évaluation des équipes de chercheurs. Parmi les indicateurs bibliométriques « le facteur H » est l’indice permettant d’évaluer le chercheur : il est corrélé à la quantité d’articles produits ainsi que la qualité (nombre de citations). Publier, être vu, être lu le plus possible est devenu impératif pour la notoriété et le classement.

L’AERES (Agence d’évaluation de la Recherche et de l’Enseignement Supérieur), créée en 2007, est une Autorité administrative indépendante. Elle est chargée de l’évaluation des établissements d'enseignement supérieur et de recherche, des organismes de recherche et de leurs unités, des formations et diplômes d’enseignement supérieur, ainsi que de la validation des procédures d’évaluation de leurs personnels.

Le CCSD (Centre pour la Communication Scientifique Directe) est une unité du CNRS dédiée à la réalisation d’archives ouvertes.

« Présentation de la politique INRA de dépôt dans l’archive ouverte Prod’INRA ».
L’INRA est un EPST (Etablissement Public à caractère Scientifique et Technique) qui disposait, bien avant la création de l’archive ouverte pluridisciplinaire HAL de sa propre archive institutionnelle ProdINRA. La création de ProdINRA2 (prévue pour 2012) doit faciliter le dépôt des travaux par les chercheurs, mettre en place un nouveau Workflow, faciliter la réutilisation des données et permettra des statistiques sur la production scientifique de l’INRA. Pour s’assurer de la complétude des archives, les incitations à déposer (tous les travaux, sauf les articles) passent par les départements. La dissémination des données entreposées est prévue vers des portails (HAL entre autres), mais aussi vers d’autres archives ouvertes nationales et internationales par moissonnage OAI.

« L’archive ouverte institutionnelle CemOA, un dispositif original » concerne l’archive du CEMAGREF. Pour cet établissement, le dépôt est obligatoire pour tout ce qui est produit, l’évaluation portant uniquement sur ces dépôts, l’incitation est forte. Le dépôt par les chercheurs est très simplifié ; ce sont les documentalistes qui rajoutent et complètent les champs spécifiques pour l’archive HAL et traitent le document. La dissémination se fait par moissonnage OIA vers des portails partenaires.
De nombreux services sont proposés aux chercheurs et aux animateurs scientifiques pour les aider à connaitre leurs positionnement, à publier dans des revues hors de leurs champs habituels de publication, les accompagner dans leurs rapports avec les éditeurs…

« Le projet PETALE : les thèses et les mémoires des universités de Lorraine en ligne » avait pour objectif de valoriser la production scientifique des universités de Lorraine, sous forme numérique, en offrant un point d’accès unique dans le cadre de la fusion en cours de 4 universités. Les objectifs en étaient la valorisation des travaux, la diffusion en open access, le recensement en vue d’évaluations par l’AERES. Après une analyse de l’existant (pratiques heureusement homogènes dans les différentes universités), le travail a porté sur la définition d’un workflow unique et simple, les métadonnées et le choix de l’outil de référencement ORI-OAI. Les anciennes thèses ont été numérisées, ce qui n’a pas été sans problèmes quant à l’aspect juridique : les thèses dont les auteurs n’ont pas été retrouvés sont diffusées uniquement sur l’Intranet. Au-delà des thèses de doctorat, ce sont les thèses d’exercice et les mémoires qui sont visés par ce projet de création d’archive ouverte connectée à HAL.

Le retour d’expérience avec « Les corrections des métadonnées dans l’archive ouverte de l’INRIA » a nuancé l’enthousiasme dont pouvaient être porteurs ces grands projets d’archives ouvertes. Les ressources doivent être propres et fiables. Le travail de recherche de doublons et d’élimination de données incohérentes dans l’archive ouverte se fait par l’intermédiaire d’un outil spécifique : HALTOOLS. La question qui se pose lors des corrections est la suivante : quand doit-on s’arrêter ? Ce travail profite certes à toute la communauté, mais il suffit qu’une personne ne remplisse pas correctement l’un des champs de référencement au moment du dépôt pour créer un doublon. Un travail de sensibilisation est mené dans les services pour tenter de limiter ces incohérences dont la correction est chronophage et qui nuisent à la visibilité du travail des chercheurs.

"Le projet HELOISE : un accord éditeurs/CCSD pour connaitre la politique des éditeurs francophones en matière de dépôt dans les archives ouvertes." Un groupe de travail du GFII créé en septembre 2007 consacré au libre accès réunit des représentants d’instituts de recherche, des éditeurs scientifiques, des représentants de l’Open Access. Plus que la politique des éditeurs, c’est la politique par matières ou par revue qui définit la politique d’embargo des éditeurs sur les écrits, avant le libre accès. Bientôt en ligne sur le portail du CCSD, le système Héloïse permettra de définir les droits de diffusion des revues sur différents supports (archives ouvertes, sites personnels, intranet).

"Le point sur des initiatives internationales" a permis de découvrir :
  • · Les archives ouvertes internationales E-LIS soutenues par Le CIEPI concernent le domaine des sciences de l’information documentation.
  • · VOA3R , projet européen concernant les bibliothèques numériques en accès ouvert dans le domaine de l’agriculture et de l’aquaculture.
  • · OpenAIRE , autre projet européen dont le but est d’accompagner l’obligation de dépôt en accès libre en application des décisions de la Commission Européenne et du Conseil Européen de la Recherche (ERC).

Conclusions, toutes personnelles
L’accès facilité aux archives ouvertes, dans un contexte de restrictions budgétaires semble délicat.
Les problèmes à résoudre sont de nature techniques (référentiels, propreté et fiabilité, choix des métadonnées, complétude des archives, interopérabilité..), humains (réduction des équipes infodoc, formation au dépôt par les auteurs, services...), économiques (place de l’Open Access par rapport aux éditeurs...).
Dans le même temps, ces projets passionnants sont soutenus par des acteurs institutionnels et portés par des professionnels très volontaires et enthousiastes.

G.Lu

Les diapositives ayant servi de supports aux différentes conférences seront très prochainement sur le site de l’ADBS, à la rubrique « Se former et s’informer / manifestations ADBS

Quelques signets








[1] Définitions d'après le site «Libre accès à l’information scientifique et technique » http://openaccess.inist.fr/spip.php?page=glossaire consulté le 22 mai 2010.

La réu­ti­li­sa­tion des don­nées publi­ques : quels défis pour les archi­ves ?

Une journée de débat organisée le 11 mars dernier par AAF Association des Archivistes Français.

L'origine de cette journée de débat est triple : 
la loi du du 17 juillet 1978 concernant le droit d'accès à l'information permet à toute personne d'obtenir l'accès aux informations créées dans le cadre d'une mission de service public, adapté à la directive 2003/98/CE du parlement européen et du Conseil du 14 novembre 2003 relative à l'utilisation des informations du secteur public et complétée en droit français par l'ordonnance 2005/650 du 6 juin 2005 et par le décret n° 2005/1755 du 30 décembre 2005. 
Elle stipule que : “Les informations publiques, non nominatives, provenant d'organismes publics ou d'entreprises privées exploitant un service public doivent pouvoir être rendues accessibles et réutilisées à des fins commerciales ou non, d'une manière non discriminatoire et non exclusive, et à des coûts qui n'excèdent pas leur coût de production.” Mais les archives publiques bénéficiaient d'un régime dérogatoire, article 11 de la loi du 17 juillet 1978.
une société commerciale de généalogie a approché de manière individuelle et systématique toutes les archives départementales pour récupérer les documents numérisés en leur possession en vue de les indexer et de les mettre en ligne sur un site payant. Ce qui donna lieu à une lettre ouverte de l'AAF sur les risques pour les libertés individuelles de la création d'un fichier nationale de données sensibles obligeant la CADA et la CNIL à plancher sur le problème.
Enfin la parution du rapport "partageons notre patrimoine" commandé par le ministère de la Culture à Bruno Ory-Lavollé fini de mettre au coeur du débat la problématique de la mise à disposition des données publique ste de leur utilisations à des fins commerciales au non.

La journée du 11 mars 2011 a mis en présence plusieurs acteurs autour de deux thèmes :

Enjeux sociaux et économiques :
réutilisation des données publiques, Quelles relations entre secteur public, secteur privé et « tiers secteur » ?
Enjeux éthiques et juridiques :
La question des données personnelles, Quelle politique de valorisation dans un environnement numérique ?

De l'avis général il n'est pas question d'interdire la réutilisation des données mais cela ne soit pas se faire sans cadre et donc construire des règlements et des licences, sans perdre de vue que le réutilisation est par définition à d'autres fins que celles pour lesquelles le documents a été produit à l'origine. Cette réutilisation est aussi l'opportunité pour les d'une visibilité et d'une valorisation forte pour les centre d'archives au delà de leurs propres sites.

Cette journée a été aussi l'occasion de mettre en valeur des initiatives :
Celle de le ville de Rennes qui a mis en ligne toutes ses données publiques et lancer un concours de développement de services et d'applications qui a donné naissance à http://www.handimap.org/index.html générateur d'itinéraire pour personnes en situation de handicap.
Celle des archives départementales du Cantal qui propose aux internaute sans identification préalable de participer a une folksonomie et reçoit ainsi 600 à 700 indexations collaboratives par jour. ce centre d'archives a reçu pour cette innovation le prix Territoria d'or 2010, catégorie valorisation du patrimoine.

Cette journée a mis en évidence que les centre d'archives ne pouvait faire l'économie d'une présence forte sur la toile y compris avec l'aide d'acteurs privés mais que dans la phase actuelle il est important pour soulager les tensions de trouver un nouveau partage des responsabilités juridiques, des risques et une réflexion autour de la créativité.

Dans la même problématique nous suivrons avec intérêt le blog


mercredi 18 mai 2011

La cybercriminalité , un problème universel

Le vol de données sur internet concerne autant les individus que les entreprises. Cela inclut non seulement la question de la protection des données personnelles mais aussi, au niveau des entreprises, la question de la protection des données professionnelles. Le cas de Sony illustre bien cette double problématique. La société japonaise a subi mi-avril et début mai une double attaque de pirates informatiques. Ses réseaux Playstation Network (PSN) et Sony Online Entertainment sont alors touchés. Le vols de données concerne plus de cent millions de joueurs. Dans le détail, il s'agit de mots de passe, de coordonnées bancaires et de coordonnées de carte de paiement.
Ainsi, cet événements jette le discrédit sur la société japonaise et modifie la position des entreprises sur l'utilisation du cloud computing. Les projets de migration des données dans les sociétés tendent à se ralentir.
Plus généralement, les entreprises font appel à des spécialistes de la fraude sur internet pour "nettoyer" leurs réseaux. Nombre de sociétés se sont spécialisées dans le domaines de la cybersécurité. Sony a ainsi fait appel à Data Forte, un cabinet dirigé par un ancien de la NCIS, et à des enquêteurs spécialisés dans la cybercriminialité.
Dans un article du Figaro du 4 mai 2011, Laurence Ifrah, cybercriminologue fait le constat amer du "pillage" des données dans les entreprises françaises. Le vol d' informations se fait dans un moment clé. Lors des appels d'offre, la concurrence met en place des dispositifs pour capter les innovations. Laurence Ifrah parle de "transfert" de technologie à bas coût.

Cet article rappelle que le problème est avant tout humain et les fuites viennent souvent de l'intérieur. L'information dans les entreprises serait trop accessible dès lors le vol de données serait le résultat de différends humain. Selon l'entreprise de sécurité informatique Verizon, 20 % des vols sont causés par des salariés.

Les solutions technologiques ne font pas tout. Il faudrait réfléchir, en amont, à la diffusion des données personnelles ou professionnelles sur internet.


Finkle Jim, Baker Liana B., Les ennuis de Sony, un nuage dans le ciel du "cloud computing", Reuters, L'Usine Nouvelle, 9 mai 2011.
http://www.usinenouvelle.com/article/les-ennuis-de-sony-un-nuage-dans-le-ciel-du-cloud-computing.N151521

Finkle Jim, Baker Liana B., Après les cyberattaques, Sony recrute des enquêteurs extérieurs, Reuters, L'Usine Nouvelle, 4 mai 2011.
http://www.usinenouvelle.com/article/apres-les-cyberattaques-sony-recrute-des-enqueteurs-exterieurs.N151211

Gabizon Cécilia, Le Galès Yann, Les firmes françaises très vulnérables, Le Figaro, 4 mai 2011.
http://www.lefigaro.fr/actualite-france/2011/04/10/01016-20110410ARTFIG00210-les-firmes-francaises-tres-vulnerables.php