mercredi 16 juin 2021

Le vrac numérique : comment le gérer ?

Le phénomène de l'entassement croissant des documents sur les serveurs des entreprises touche les entreprises comme les administrations. Pour ce faire, nous allons essayer de montrer l'origine du vrac numérique, comment il se manifeste et donner des solutions pour le gérer. 


Le vrac numérique désigne "un ensemble de documents bureautiques très hétérogènes se caractérisant par une absence fréquente de règles de classement et de nommage, l'utilisation de caractères susceptibles de poser des problèmes, un stockage aléatoire et une arborescence construite sans logique prédéfinie." [1]

En effet, au rythme actuel de la croissance des volumes d'information, presque toutes les organisations sont confrontées au problème de dispersion de leur fichiers documentaires. Parmi les causes du vrac documentaire : des serveurs organisés en silos, des applications dispersées sur lesquelles les salariés produisent et partagent leurs documents de travail, le manque de cohérence, etc. Et à cela s'ajoutent des fléaux documentaires comme les doublons, les triplons, les fichiers périmés, le nommage approximatif, les versions redondantes, etc.[2]

Noureddine Lamriri (Everteam) souligne : "Ce déluge informationnel provoque de multiples désordres : perte de temps, risque de disparition des fichiers, redondance, conservation d'information inutile ou obsolète." [3] Et cette perte de temps, s'ajoutent les enjeux juridiques sur la protection des données personnelles liées au RGPD. 

Outils permettant à gérer le vrac numérique :

Ces outils procèdent à l’analyse du serveur via un connecteur, puis produisent un graphique des fichiers détectés (format, poids, date de création…). Ils peuvent aussi détecter les entités nommées (noms de personnes, d’entreprises…). Il existe aussi des outils qui sont capables d'identifier des doublons

Il y a aussi le moteur de recherche fédérée qui permet d’accéder à des contenus hétérogènes qu’ils soient structurés ou non. Il est capable de trouver des informations localisées sur des applications métiers de type CRM (logiciel de gestion de relation client) ou ERP (ou PGI, progiciel de gestion intégré).

Certains logiciels sont capables de traiter des volumes colossaux (jusqu’au plusieurs téraoctets.)

Dans le secteur juridique, en cas de litige par exemple, la justice peut demander la suspension provisoire du traitement normal ou de la destruction de documents d’archives. L’outil e-discovery est capable de procéder à une suspension légale tout en assurant la conservation des documents quelle que soit leur forme.

Aussi, Alfresco propose des solutions de gestion de contenu. [4]

Les solutions open source :

- Octave, développée par le service interministériel des archives de France (SIAF).

- Archifiltre, développé par la mission des archives du ministère des affaires sociales.

- Resip, développé par les Archives Nationales.

Les solutions propriétaires :

Everteam, par exemple, est orienté sur l’enrichissement du vrac numérique par les métadonnées.  

Selon Marie Jenner (Serda Conseil), il faut se poser les bonnes questions avant de se lancer dans le traitement d'un vrac numérique : 

Choisir les bons outils pour gérer le vrac numérique en fonction de la volumétrie du vrac.

Connaître la proportion et la nature des documents concernés.

Connaître la structure du vrac.

Identifier les versions provisoires et les doublons que l’on pourra éliminer tout de suite. [5]


Sources : 

[1] : Bruno Texier, Vrac numérique: comment mettre de l'ordre, Archimag n°342 mars 2021, p. 15-16.

[2] : Ibid.

[3] : Intervention de Noureddine Lamriri à l'édition 2020 du salon Documentation, cité dans l'article de Bruno Texier, Archimag n°342, p.15

[4] : Michel Remize, Outils : cerner le vrac numérique, Archimag n°342 mars 2021, p. 20-21.

[5] : Bruno Texier, Traiter un vrac numérique, mode d'emploi, interview avec Marie Jenner (Serda Conseil), Archimag n°342 mars 2021, p. 15-16.



Aucun commentaire: