mercredi 28 janvier 2015

Bientôt tous journalistes ?

Une équipe de chercheurs américains et portugais a mis au point un algorithme permettant de vérifier automatiquement des informations en ligne.


L'étude porte sur de simples faits, issus de la toile, constitués d'un sujet, d'un verbe et d'un complément. Exemples de phrases testées :
Barack Obama est musulman.
Rome est la capitale de l'Inde.
Les chercheurs ont utilisé les knowledge graph (graphiques de connaissances) et ont analysé les nœuds de ces graphes. Un tel graphe est constitué d'un ensemble complexe de nœuds.
L'algorithme repère les phrases simples (sujet, verbe, complément) parmi ces nœuds et quantifie le lien qui unit un sujet à son complément.
Les chercheurs se sont basés sur des dizaines de milliers de knowledge graph issus de Wikipedia pour démontrer leur algorithme [1].


Principe 

Dans cette méthode, un sujet qui est relié par différents nœuds adjacents à son complément s'avère être une information véridique. En revanche si le chemin qui relie un sujet à son complément n'est pas composé de nœuds adjacents, l'information sera mise en doute. Cela revient à calculer la proximité sémantique de ces deux entités. L'algorithme recherche le plus court chemin entre les deux entités et évalue cette proximité.

Un deuxième calcul est effectué, il porte sur l'unicité : plus le chemin est unique entre un sujet et son complément et plus le fait sera véridique. En effet, si de multiples chemins sont possibles pour un même fait, on peut en conclure que ce fait n'est pas une information spécifique et notable.

Chemin le plus court entre "Barack Obama" et "musulman", source : arvix.org.
Dans cet exemple le chemin comporte 8 nœuds et l'algorithme lui a assigné une faible valeur de vérité.

 

Applications possibles

Selon les chercheurs, cette nouvelle méthode de vérification pourrait être utilisée par Wikipedia pour vérifier tous les nouveaux faits introduits dans l'encyclopédie.

Certains imaginent déjà une extension qui serait intégrée à nos navigateurs et qui permettrait de vérifier directement les informations trouvées sur le web [2].

Le gain de temps ne serait pas négligeable pour les journalistes qui ont une quantité importante d'informations à vérifier. La fonction même de journaliste pourrait être remise en cause [3].

L'algorithme est encore en cours de développement, son taux de réussite est significatif mais pas encore suffisant. Et il ne détecte pas encore les effets de langage comme l'ironie.

Cette vérification automatique de l'information viendrait s'ajouter au crowdchecking (la foule apporte la preuve d'une information) déjà existant.
Son potentiel est important. En effet, cette automatisation pourrait permettre de démolir rapidement certaines théories (théorie du complot par exemple) ou d'arrêter la propagation de la désinformation, aujourd'hui très rapide sur les médias sociaux.

Sources
[1] Collectif - Computational fact checking from knowledge networks - Arvix.org - 14/01/2015 - http://arxiv.org/pdf/1501.03471v1.pdf
[2] Michael Byrne - Yes, Please: An Algorithm for Fact Checking the Internet - Motherboard - 25/01/2015 - http://motherboard.vice.com/read/an-algorithm-for-fact-checking
[3] Guillaume Scifo - Automatiser la vérification de l’information avec un algorithme - Atelier.net - 27/01/2015 - http://www.atelier.net/trends/articles/automatiser-verification-de-information-un-algorithme_433337?utm_source=atelier&utm_medium=rss&utm_campaign=atelier


Aucun commentaire: