Le phénomène de l'entassement croissant des documents sur les serveurs des entreprises touche les entreprises comme les administrations. Pour ce faire, nous allons essayer de montrer l'origine du vrac numérique, comment il se manifeste et donner des solutions pour le gérer.
Outils permettant à gérer
le vrac numérique :
Ces outils procèdent à l’analyse
du serveur via un connecteur, puis produisent un graphique des fichiers
détectés (format, poids, date de création…). Ils peuvent aussi détecter les
entités nommées (noms de personnes, d’entreprises…). Il existe aussi des outils qui sont capables d'identifier des doublons
Il y a aussi le moteur de
recherche fédérée qui permet d’accéder à des contenus hétérogènes qu’ils soient
structurés ou non. Il est capable de trouver des informations localisées sur
des applications métiers de type CRM (logiciel de gestion de relation client)
ou ERP (ou PGI, progiciel de gestion intégré).
Certains logiciels sont
capables de traiter des volumes colossaux (jusqu’au plusieurs téraoctets.)
Dans le secteur juridique, en cas de litige par exemple, la justice peut demander la suspension provisoire du traitement normal ou de la destruction de documents d’archives. L’outil e-discovery est capable de procéder à une suspension légale tout en assurant la conservation des documents quelle que soit leur forme.
Aussi, Alfresco propose des solutions de gestion de contenu. [4]
Les solutions open source :
- Octave, développée par le
service interministériel des archives de France (SIAF).
- Archifiltre, développé
par la mission des archives du ministère des affaires sociales.
- Resip, développé par les
Archives Nationales.
Les solutions
propriétaires :
Everteam, par exemple, est orienté
sur l’enrichissement du vrac numérique par les métadonnées.
Selon Marie Jenner (Serda Conseil), il faut se poser les bonnes questions avant de se lancer dans le traitement d'un vrac numérique :
Choisir les bons outils
pour gérer le vrac numérique en fonction de la volumétrie du vrac.
Connaître la proportion
et la nature des documents concernés.
Connaître la structure du
vrac.
Identifier les versions
provisoires et les doublons que l’on pourra éliminer tout de suite. [5]
Sources :
[1] : Bruno Texier, Vrac numérique: comment mettre de l'ordre, Archimag n°342 mars 2021, p. 15-16.
[2] : Ibid.
[3] : Intervention de Noureddine Lamriri à l'édition 2020 du salon Documentation, cité dans l'article de Bruno Texier, Archimag n°342, p.15