mercredi 12 octobre 2011

Qu'est-ce que le Web sémantique ?

Le Web - est-il besoin de le rappeler à la mémoire du lecteur de ce billet, internaute averti qui en vaut deux - est une application d'Internet permettant de consulter des documents (pages de sites) via un navigateur selon un système hypertexte. Le Web 1.0 conçu en 1989 par Tim Berners-Lee et publicisé dès 1993, est donc un Web "documentaire".

Si son architecture demeure la même sur le principe (URLs, protocole HTTP, langage HTML), le Web sémantique diffère de ces prédécesseurs quant à son contenu : il contient des documents non pas en langage naturel mais en "métadonnées" répondant à des standards développés par le W3C et destinées à être traitées par des logiciels. Pas évident pour le profane de se représenter les implications d'une telle "révolution". Pour mieux les saisir, posons-nous donc la question de ses applications.
On a entendu çà et là qu'il pourrait à terme permettre le développement de la recherche dite par "entités nommées" via l'utilisation de moteur de recherche, par le biais de la génération d'algorithmes et de l'établissement de relations sémantiques entre des données (bon, c'est toujours compliqué) : concrètement, au lieu d'utiliser des combinaisons de termes, l'utilisateur pose simplement sa question comme il l'exposerait oralement. Par exemple, si l'on recherche un lieu pour sortir à Paris le soir même, là où l'on inscrivait "sortir Paris [date du jour]", en affinant ensuite la recherche par activité (théâtre, concert, etc), il deviendra possible d'écrire simplement "où sortir à Paris ce soir". Ré-vo-lu-tion. En vérité, il n'en serait rien.
Tim Berners-Lee est en effet revenu sur ces spéculations, les tenant pour déraisonnables. Il s'agissait simplement, selon lui, de se doter d'un autre langage que le langage naturel pour représenter des ressources (note : est une ressource "tout ce qui est identifié par une URL" générant sa "représentation", par opposition au document qui, lui, existe). Ce langage est le RDF, qui permet de créer des identifiants de ressources et de les associer de manière libre. En résulte un enrichissement non négligeable des communications entre données sur le Web : chacun peut relier deux ressources via une troisième là où le lien n'existait pas auparavant. Pour son inventeur, le Web sémantique pourrait tout aussi bien s'appeler "Web de données". Là où il apparaît finalement comme révolutionnaire, c'est que les notions de vérité ou de fausseté n'ont pas lieu d'être avec le RDF : l'agencement des notions tel qu'il le permet est libre et écarte de fait toute imposition d'une ontologie universelle. Liberté d'expression pure et simple. Mais limitée à la mise à disposition sur Internet de données enfermées dans des bases. Une de ces illustrations est notamment le mouvement de l'Open Data (ouverture des archives de diverses administrations).

Certains parlent déjà de Web 3.0, définissant ainsi a posteriori le Web 2.0 comme celui qui, dépassé, aura reposé sur la contribution des internautes : le Web social et ses forums, réseaux , etc. Ce serait être quelque peu réducteur : est-il envisageable désormais de se passer des échanges permis par le Web d'aujourd'hui ? Qui sait, peut-être le "lecteur averti" aura-t-il envie de partager son idée sur la question à l'occasion d'un commentaire...

Sources :
http://cblog.culture.fr/2011/09/07/web-semantique-iri-opendat
http://www.clubic.com/internet/actualite-391340-retour-enjeux-web-semantique.html
http://fr.wikipedia.org/wiki/Web_s%C3%A9mantique

Aucun commentaire: