Gargantext[2] est une plateforme web collaborative, développée en open source par l'Institut des Systèmes Complexes Paris Ile de France (ISC-PIF). Elle permet l'exploration de gros volumes de documents non structurés à partir de son moteur de traitement automatique des langues et de puissants outils de visualisation de données.
Gargantext a été créé au sein de l'ISC-PIF[3], par une équipe réunie autour d'un noyau de chercheurs et de développeurs tels que David Chavalarias directeur de l'ISC-PIF, le sociologue/développeur Alexandre Delanoë[4] et le développeur Simon Murail. L'initiative associe l'ISC-PIF et le Centre d'Analyse des Mathématiques Sociales. Elle est financée par École des Hautes Études en Sciences Sociales, l’École des Mines, ParisTech, l'Institut Pasteur, et l'Institut Mines Telecom[5].
Curieuse discipline que celle de l'étude des systèmes complexes. Un article paru dans la revue Hermès en 2011 et cosigné par des chercheurs de l'Institut des Systèmes Complexes de Lyon, Éric Bertin, Guillaume Beslon, Olivier Gandrillon, Sébastian Grauwin, Pablo Jensen et Nicolas Schabanel, définit la raison d'être de leur institut de la manière suivante:
« Nous appellerons « complexe » une approche qui vise à comprendre comment la dynamique d'interaction entre des entités micro parvient à créer une unité à un autre niveau d'observation macro. […] Nous défendons l'idée qu'une bonne pratique des « approches complexes » ne peut se faire que dans le cadre d'une interdisciplinarité équilibrée. Or, si l'interdisciplinarité est souvent invoquée par les politiques scientifiques, force est de constater que, dans les faits, les conditions de sa mise en pratique sont loin d'être réunies ; probablement parce que les difficultés de l'interdisciplinarité sont souvent sous-estimées. Au-delà de l'imprécation classique « l'interdisciplinarité passe par la définition d'un langage commun », ce sont l'ensemble des pratiques culturelles qui diffèrent d'une discipline à l'autre.[6] » .
« Nous appellerons « complexe » une approche qui vise à comprendre comment la dynamique d'interaction entre des entités micro parvient à créer une unité à un autre niveau d'observation macro. […] Nous défendons l'idée qu'une bonne pratique des « approches complexes » ne peut se faire que dans le cadre d'une interdisciplinarité équilibrée. Or, si l'interdisciplinarité est souvent invoquée par les politiques scientifiques, force est de constater que, dans les faits, les conditions de sa mise en pratique sont loin d'être réunies ; probablement parce que les difficultés de l'interdisciplinarité sont souvent sous-estimées. Au-delà de l'imprécation classique « l'interdisciplinarité passe par la définition d'un langage commun », ce sont l'ensemble des pratiques culturelles qui diffèrent d'une discipline à l'autre.[6] » .
Cet accent sur l'interdisciplinarité se retrouve aussi dans la présentation de l'ISC-PIF : « Crée en 2005, L’ISC-PIF est une unité de service et de recherche du CNRS dédiée au développement inter-institutionnel et inter-disciplinaire de la recherche sur les systèmes complexes[7] ».
L'utilisation d'outils cartographiques en adéquation avec l'approche micro/macro, facilite donc l'interdisciplinarité. Elle présente sans distinction de spécialités un ensemble de plus de 6500 études sur les coronavirus, parues depuis les années 2000, classées par thèmes et occurrences retrouvés par les outils de text mining et de natural language processing de Gargantext. David Chavalarias explique ainsi que :
« En montrant explicitement les liens qui existent entre des termes utilisés par des communautés différentes, ces visualisations peuvent pousser les scientifiques à échanger leurs idées pour avancer. C'est d'ailleurs souvent à l'intersection entre les spécialités que se font les découvertes importantes. Dans ce sens, j'ai réalisé le 5 avril, à partir de près de 17 000 articles publiés là aussi sur les vingt dernières années, une autre carte qui synthétise la recherche sur les antiviraux de manière large. Sur cette carte, le coronavirus est un domaine parmi d'autres et l'idée est de visualiser les recherches qui se font ailleurs (herpès, cancer...) pour éventuellement trouver des réponses propres au Covid-19 [8]».
L'utilisation d'outils cartographiques en adéquation avec l'approche micro/macro, facilite donc l'interdisciplinarité. Elle présente sans distinction de spécialités un ensemble de plus de 6500 études sur les coronavirus, parues depuis les années 2000, classées par thèmes et occurrences retrouvés par les outils de text mining et de natural language processing de Gargantext. David Chavalarias explique ainsi que :
« En montrant explicitement les liens qui existent entre des termes utilisés par des communautés différentes, ces visualisations peuvent pousser les scientifiques à échanger leurs idées pour avancer. C'est d'ailleurs souvent à l'intersection entre les spécialités que se font les découvertes importantes. Dans ce sens, j'ai réalisé le 5 avril, à partir de près de 17 000 articles publiés là aussi sur les vingt dernières années, une autre carte qui synthétise la recherche sur les antiviraux de manière large. Sur cette carte, le coronavirus est un domaine parmi d'autres et l'idée est de visualiser les recherches qui se font ailleurs (herpès, cancer...) pour éventuellement trouver des réponses propres au Covid-19 [8]».
Outil de travail bibliographique pour le chercheur, cette carte met en valeur les communautés thématiques des recherches sur le coronavirus. Elle est construite à partir des occurrences de thèmes communs aux différents textes. La taille des points est proportionnelle à la fréquence d'apparition de termes représentatifs du corpus.
Cartographie des recherches liées aux Coronavirus. Crédit: David Chavalarias |
Les personnes intéressées par Gargantext pourront trouver ici une présentation de l'outil pour la veille, l'analyse de données brutes et leur organisation sous forme de cartes sémantiques : https://www.istex.fr/wp-content/uploads/2018/12/Pr%C3%A9sentation-de-Gargantext-Mylene.pdf [9].
On trouvera de même, à cette page, un tutoriel pour une utilisation sur les bases de données linguistiques du Crisco : http://crisco.unicaen.fr/dictionnaire-electronique-des-synonymes/actualites-des/lettre-d-actualites-n-7-du-des-novembre-2019--995922.kjsp?RH=1530619460865 [10].
On trouvera de même, à cette page, un tutoriel pour une utilisation sur les bases de données linguistiques du Crisco : http://crisco.unicaen.fr/dictionnaire-electronique-des-synonymes/actualites-des/lettre-d-actualites-n-7-du-des-novembre-2019--995922.kjsp?RH=1530619460865 [10].
[1] Cartographie des connaissances liées au coronavirus – David Chavalarias Homepage, https://iscpif.fr/chavalarias/?p=1712, consulté le 12 juillet 2020.
[2] Gargantext – Text analytics software from ISC-PIF CNRS, https://iscpif.fr/gargantext/, consulté le 12 juillet 2020.
[3] Institut des Systèmes Complexes de Paris Île-de-France, https://iscpif.fr/, consulté le 12 juillet 2020.
[4] Delanoë Alexandre, 25 novembre 2016, Vidéo : Des outils pour un état de l’art, https://iscpif.fr/2016/11/11543/, consulté le 12 juillet 2020.
[5] Institut des Systèmes Complexes de Paris Île-de-France, About – Gargantext, https://iscpif.fr/gargantext/about/, consulté le 12 juillet 2020.
[6] Bertin Éric, Gandrillon Olivier, Beslon Guillaume, Grauwin Sebastian, Jensen Pablo et Schabanel Nicolas, 2011, « Les complexités : point de vue d’un institut des systèmes complexes », Hermes, La Revue, 2011, n° 60, no 2, p. 145‑150.
[7] Institut des Systèmes Complexes de Paris Île-de-France – Un Institut par et pour les chercheurs, https://iscpif.fr/, consulté le 12 juillet 2020.
[8] Bourdet Julien, 2020, Visualiser la recherche sur le coronavirus en un coup d’œil, https://lejournal.cnrs.fr/articles/visualiser-la-recherche-sur-le-coronavirus-en-un-coup-doeil , 22 avril 2020, consulté le 12 juillet 2020.
La cartographie des essais cliniques est visible à cette page : Chavalarias David, Mapping of Coronavirus Clinical Trials, http://maps.gargantext.org/maps/clinicaltrials/, consulté le 12 juillet 2020.
[9] Leitzelman Mylène, Présentation de Gargantext, https://www.istex.fr/wp-content/uploads/2018/12/Pr%C3%A9sentation-de-Gargantext-Mylene.pdf, consulté le 12 juillet 2020.