jeudi 4 mars 2021

La numérisation documentaire : technologies et enjeux

Sur quels critères reposent la qualité ou la pertinence d'une numérisation ? Numériser un texte dactylographié ou une facture permet de sauvegarder le document mais la facilité de l'exploitation numérique du document en question dépend du format documentaire et de la technologie de numérisation employée. Pouvoir sélectionner le texte d'un livre numérisé plutôt que d'avoir seulement une image du texte fait une différence pour le lecteur ou le gestionnaire de l'information. Pour mieux le comprendre, nous allons définir la numérisation et décrire les technologies sur lesquelles cette dernière repose.


1. Définition et intérêt de la numérisation

La numérisation est un "processus de conversion d'un signal analogique en un signal numérique. Cette technique permet de stocker des documents, quels qu'en soient la nature ou le support, sous une forme électronique (Anglais : digitalization)." [1]

La numérisation concerne majoritairement les documents papier mais concerne aussi les anciens livres [2], bandes audio [3] et pellicules de films. Prendre un objet d'art en photo numérique, ou filmer une conférence pour la rendre accessible en rediffusion à la demande sur internet, peuvent être qualifiées de démarches de numérisation.

L'intérêt de la numérisation est de sauvegarder, compiler et diffuser de l'information de manière fluide et en grande quantité. Elle joue un rôle déterminant dans la mise à disposition d'archives et dans le gain de temps et de facilité de gestion documentaire en entreprise. Elle amplifie l'accès à l'information, voire l'information elle-même. Les images issues de la numérisation ainsi que les métadonnées associées aux documents numérisés facilitent la navigation et les liens entre documents au sein des portails d'information. [4]

2. Numérisation et dématérialisation

La numérisation ne doit pas être confondue avec la dématérialisation. La numérisation part d'un document physique, non numérique, alors que la dématérialisation concerne les processus de gestion documentaire. La dématérialisation fait appel à la numérisation mais englobe aussi des workfows et la création de documents directement au format numérique. La numérisation documentaire représente une partie de la dématérialisation des processus, en se limitant au début du chemin emprunté par le document au sein du système d'information de l'entreprise. L'enjeu de la numérisation réside dans la capacité des technologies à interpréter et restituer de manière automatique le contenu informationnel des documents. La dématérialisation reposant en partie sur la numérisation, plus la numérisation des documents papier est qualitative, plus la gestion automatisée (indexation, ajout de métadonnées, envoi, notification...) des documents a les moyens d'être efficace. [5] [6]

 3. Les technologies de la numérisation 

La numérisation documentaire repose sur plusieurs fonctions de logiciel : OCR, RAD et LAD.

L'OCR pour "Optical Character Recognition", permet d'obtenir un document textuel exploitable comme tel, plutôt que de se contenter d'une photo. La démarche OCR est "une conversion électronique d’images textuelles dactylographiées, manuscrites ou imprimées. Ce texte est encodé par une machine dans un fichier de format texte." [7]

La RAD pour "Reconnaissance Automatique de Documents", permet de reconnaître la nature du document numérisé (texte simple, devis, facture, compte-rendu...) en le comparant aux formats structurés ou semi-structurés, propres à l'entreprise. [8]

La LAD pour "Lecture Automatique de Documents", permet d'extraire les informations de base relatives au document. Elle constitue un enjeux dans l'automatisation du traitement documentaire. Plus elle est efficace, mieux l'identité du document sera renseignée dans la liste des métadonnées de la GED d'entreprise. La LAD résulte de l'OCR et de la RAD. Ces étapes s'enchaînent pour donner un document numérique le mieux identifié et le plus exploitable possible. [9]
 

4. Développement des technologies et perspectives

La technologie ICR pour "Intelligent Character Recognition" est un OCR amélioré prenant mieux en compte les variations typographiques des formes des caractères. Elle est utile à l'amélioration de la LAD et nécessaire pour numériser au format texte des documents manuscrits [10]. En effet, à partir d'un document manuscrit, obtenir un format texte reste difficile. Le problème rencontré est explicité par Kenneth M. Sayre dans le paradoxe dit de la segmentation (la distinction des lettres entre elles) : « Pour reconnaître les lettres, il faut les segmenter et pour les segmenter, il faut les reconnaître ». La segmentation se fait soit avant la reconnaissance de la lettre soit simultanément mais des confusions persistent. [11]

La dictée vocale, qui transcrit la parole humaine en texte dactylographie, est une forme de numérisation de la voix. La technologie sur laquelle repose la dictée vocale est la Reconnaissance Automatique de la Parole (RAP). "Aujourd’hui, les meilleures solutions avoisinent les 90 % de fiabilité dans la retranscription.". [12] Par exemple, le cabinet Parisien de conseil, Axys Consultants, présente son système RAP sur son blog où l'on trouve un audio et sa transcription. [13] [14] [15]

 

5. Conclusion

Finalement, la numérisation est sollicitée à des fins d'automatisation de la :
- reconnaissance de documents
- lecture de documents
- transcription la parole
- reconnaissance de l'écriture manuscrite

Les enjeux de la numérisation croissent proportionnellement aux technologies sur lesquelles elle repose. La sauvegarde documentaire via la numérisation n'est pas une fin en soi. Au-delà, il s'agit d'exploiter le document pour l'indexer et le diffuser à ses utilisateurs finaux.
 

 

SOURCES

[1] ACCART Jean-Philippe. « Glossaire », dans : , Le Métier de Documentaliste. avec la collaboration de Réthy Marie-Pierre. Paris, Éditions du Cercle de la Librairie, « Métiers », 2015, p. 357-386.Consulté le 04/03/2021 [en ligne]. Disponible à l'adresse suivante : <https://www-cairn-info.proxybib-pp.cnam.fr/le-metier-de-documentaliste--9782765414612-page-357.htm>

[2] CNUM. Conservatoire numérique des Arts et Métiers. Bibliothèque numérique en histoire des sciences et des techniques. Consulté le 04/03/2021 [en ligne]. Disponible à l'adresse suivante : <http://cnum.cnam.fr/>

[3] FRANCE CULTURE. Ecoutez l'un des plus vieux sons enregistrés : Ernest Renan par Gustave Eiffel en 1891. Consulté le 03/03/2021 [en ligne]. Disponible à l'adresse suivante : <https://www.franceculture.fr/histoire/ecoutez-lun-des-plus-vieux-sons-ernest-renan-enregistre-par-gustave-eiffel-en-1891>

[4] CHUPIN Lisa. Enjeux de la numérisation des herbiers pour l'information et la communication scientifiques : de la transformation des matières documentaires à l'évolution des pratiques, in Les Enjeux de l'information et de la communication, 2015/2 (n° 16/2), p. 69-82.  Consulté le 03/03/2021 [en ligne]. Disponible à l'adresse suivante : < https://www-cairn-info.proxybib-pp.cnam.fr/revue-les-enjeux-de-l-information-et-de-la-communication-2015-2-page-69.htm>

[5] LOCARCHIVES.Qu'est-ce que la dématérialisation ?. Consulté le 04/03/2021 [en ligne]. Disponible à l'adresse suivante : <https://locarchives.fr/faq/quest-ce-que-la-dematerialisation/>

[6] ACCART Jean-Philippe, « 17. La numérisation », dans : , Le Métier de Documentaliste. avec la collaboration de Réthy Marie-Pierre. Paris, Éditions du Cercle de la Librairie, « Métiers », 2015, p. 289-295. Consulté le 04/03/2021 [en ligne]. Disponible à l'adresse suivante : <https://www-cairn-info.proxybib-pp.cnam.fr/le-metier-de-documentaliste--9782765414612-page-289.ht>

[7] MOOV AI. Un guide facile pour comprendre la reconnaissance optique de caractères (OCR). Consulté le 03/03/2021 [en ligne]. Disponible à l'adresse suivante : <https://moov.ai/fr/blog/reconnaissance-optique-de-caracteres-ocr/>

[8] ibid note [6]

[9] LOCARCHIVES. LAD RAD OCR : De quoi parle-t-on ?. Consulté le 04/03/2021 [en ligne]. Disponible à l'adresse suivante : <https://locarchives.fr/faq/lad-rad-ocr-de-quoi-parle-t-on/>

[10] ibid note [9]

[11] ABAYNARH Mohammed, EL FADILI Hakim, ZENKOUAR Lahbib. « Reconnaissance optique de documents amazighes : approches et évaluation des performances », Études et Documents Berbères, 2015/1 (N° 34), p. 189-198. Consulté le 04/03/2021 [en ligne]. Disponible à l'adresse suivante <https://www-cairn-info.proxybib-pp.cnam.fr/revue-etudes-et-documents-berberes-2015-1-page-189.htm>

[12] PONTLEVÉ Pierre. Archimag, Article, Reconnaissance automatique de la parole : tout commence par la voix. Consulté le 04/03/2021 [en ligne]. Disponible à l'adresse suivante <https://www.archimag.com/vie-numerique/2019/02/06/reconnaissance-automatique-parole-commence-par-voix>

[13] AXYS CONSULTANTS. Recherche sur la reconnaissance de la parole. Consulté le 03/03/2021 [en ligne]. Disponible à l'adresse suivante <https://www.axys-consultants.com/actualites/soirees-de-l-ia>

[14] AXYS CONSULTANTS. Podcast épisode 17 : L’évaluation des systèmes de reconnaissance vocale. Consulté le 03/03/2021 [en ligne]. Disponible à l'adresse suivante <https://www.axys-consultants.com/blog/lab-ia/podcast-episode-17-levaluation-systemes-de-reconnaissance-vocale>

[15] AXYS CONSULTANTS. Texte du podcast 17 retranscrit automatiquement. Consulté le 03/03/2021 [en ligne]. Disponible à l'adresse suivante <https://go.axys-consultants.com/LabPod-17-Evalutation.pdf>


Aucun commentaire: