jeudi 18 novembre 2010

L'archivage du web: focus sur le consortium IIPC

Avec 250 millions de sites (source: Le Monde du 17/11/2010) le web est devenu le principal vecteur et support d'informations. Ce média génère de nouvelles formes d'expressions publiques, reflet d'une culture savante ou populaire. Or ces données -immatérielles et mouvantes- risquent de disparaître si rien n'est entrepris. Comment conserver la mémoire du web?

En France, la mission historique du dépôt légal institué en 1537 pour tous les imprimés est étendue depuis 2006 aux "publications" de l'Internet (loi DADVSI). A la BNF, la Direction des services et des réseaux -dans laquelle a été établi le service Dépôt légal numérique en charge entre autre du dépôt légal du web- collecte via des crawlers les sites français et assure leur conservation. Pour des raisons juridiques (protection du droit personnel), l'accès aux archives du net est très restreint, contrepartie d'une législation permissive (possibilité de collecter les fichiers sans demander la permission aux auteurs). Les limites d'un tel archivage sont nombreuses, à la fois techniques (comment faire face à la croissance exponentielle des données, comment archiver le web profond, le web social puis le web de données), juridiques et... financières.

Forte de son expérience, la BNF est impliquée dans le pilotage du consortium l'IIPC (International Internet Preservation consortium).
Fondé en 2003 à l'initiative de bibliothèques nationales d'Europe, d'Australie et d'Amérique du nord - et d'Internet Archive, pionnier américain de l'archivage du web- , ses objectifs sont multiples :
- promouvoir, grâce à des outils open source, l'archivage du web dans le monde, et construire des collections interopérables ;
- œuvrer à la "consultation et la préservation à long terme du patrimoine de l’internet" ;
- être une force de lobbying et de "dissémination";

Après avoir pris de l'envergure en s'élargissant à l'Europe de l'Est et à l'Asie, le consortium se recentre désormais sur sa mission première: continuer le développement informatique afin de suivre les évolutions / mutations du web.

Et devant la percée de nouvelles applications mobiles (sur des smartphones, iphones...), la conservation d'une mémoire universelle du web apparaît désormais comme une urgence.


Sources:
- site internet de IIPC
- Présentation de Gildas Illien organisée le 16 novembre par l'ADBS (secteur coopération et développement)


Aucun commentaire: