lundi 1 mars 2021

Partie 2 : Health Data Hub et protection des données personnelles, la sauvegarde d'une ambition française.

 

https://fondationrechercheaphp.fr/wp-content/uploads/2017/09/big-data-visualization-with-dna-helix-and-medical-icons-vector-id1139674670-360x270.jpg
©Aphp.fr "Big-data", 2020

Mis en service en décembre 2019, le Health Data Hub est un projet de stockage unifié des données médicales et administratives de tous les assurés sociaux en France. Il s'agit de "Recourir au numérique pour mieux soigner" et pour cela  de donner aux chercheurs l'accès à un pool inédit de data. Prévu dans le cadre du projet de loi "Ma Santé 2022" de transition au numérique, les objectifs présentés par Emmanuel Macron dans le "Discours du Président de la République sur l'intelligence artificielle" au Collège de France en 2018[1], ont permis à la France de devenir une pionnière dans ce domaine, une position qu'il s'agit maintenant de tenir.

Le programme du Health Data Hub est exposé au Sénat en février 2019. Le député Cédric Villani et le sénateur Gérard Longuet [2] le présentent dans un rapport intitulé "l'intelligence artificielle et les données de santé". Le but de la transition numérique des services administratifs de santé est leur évolution vers un nouveau modèle technique. Deux ans plus tard, l'objectif pratique est déjà en partie atteint : le machine-learning assiste bel et bien le chercheur dans le traitement d'un capital de données pour y déceler des signaux fins, sinon ignorés [3].

L'expérience acquise par le Health Data Hub fait par ailleurs œuvre de référence. La plateforme française est  reconnue à l'échelle européenne pour son fonctionnement et ses travaux. Le 11 juin 2020, le Health Data Hub a été nommé autorité compétente pour contribuer à l'élaboration du "European Health Data Space", et a fournir à ses recommandations à la Commission européenne [4(26)]. Le 1 février 2021, le Health Data Hub a annoncé dans un communiqué le lancement du TEHDaS qui sera désormais un "espace européen des données de santé"[5], son nom signifie Towards the European Health  DAta Space.

Il faut cependant noter que le Health Data Hub fait également face à de nombreuses interrogations liées aux risques que présente l'hébergement de données à caractère personnel. C'est Microsoft qui, jusqu'à présent, a fourni ses outils aux Health Data Hub. Or, Microsoft est une entreprise privée américaine, ce qui est  problématique. La Cour de justice de l'union européenne a invalidé, le 16 juillet 2020, un accord avec les Etats-unis, le "Privacy Shield" ou "Bouclier de protection des données"[6]. Celui-ci empêchait tout transfert de data vers les Etats Unis. En 2018, la loi fédérale américaine a elle même évolué dans ce sens avec le "CLOUD act" qui permet un accès sans restriction aux données de puissances étrangères clientes d'entreprises américaines. 

En plus de cette question globale sur la souveraineté de l'accès aux données françaises, s'ajoute une échelle fine sur la protection de l'identité des individus représentés dans les data de la plateforme. Dès son lancement en 2019, la Commission Nationale Informatique et Liberté (la CNIL)[7] et le Conseil National de l'Ordre de Médecins [8] ont alerté à ce sujet. Le Sénat répond : les données hébergées ne peuvent pas être totalement anonymisées[9].

La raison est explicitée par Interhop une association technico-juridique dans une analyse détaillée : pour être accessibles et manipulables les données subissent un chiffrement au moment de la requête [10]. Ce chiffrement n'est pas très fort car les clefs peuvent être retrouvées facilement dans le cache des serveurs. La pseudonymisation est elle aussi limitée et la récupération d’identités facile à effectuer, comme l'ont démontré par l'expérience deux chercheur en juillet 2015[11].

A l'heure des projets européens le Health Data Hub garde le rôle de leader dans le domaine. Cependant les garanties sur la protection des données et des individus reste au centre du paysage de cette évolution technologique. Les évolutions réglementaires et techniques sont à poursuivre.


Références:

[1]M. le Président de la République, Emmanuel Macron. Discours du Président de la république sur l'intelligence artificielle. elysee.fr Publié le 29/03/2020 [En ligne] Disponible à l'adresse: <https://elysee.fr/emmanuel-macron/20218/03/29/discours-du-president-de-la-republique-sur--lintelligence-artificielle>

[2] LONGUET, Gérard ; VILLANI,Cédric. Rapport n°401 (2018-2019) "Sur l'intelligence artificielle et les données de santé".senat.fr Déposé le 21 mars 2019 [En ligne]. Disponible à l'adresse:<http://www.senat.fr/rap/r18-401/r18-401.html>

[3] Health Data Hub : page "tous les projets " : https://www.health-data-hub.fr/projets

[4] Health Data Hub. Kick-off officiel de l'action conjointe "espace européen des données de santé". <https://www.health-data-hub.fr/actualites/kick-officiel-de-laction-conjointe-espace-europeen-des-donnees-de-sante>

[5] Commission Européenne Santé en ligne : "Espace européen des données de santé"ec.europa.eu Publié le 18/11/2020 [En ligne] Disponible à l'adresse : <https://ec.europa.eu/health/ehealth/dataspace_fr>

[6] Cour de Justice de l'Union Européenne. C-311/18 The Court of Justice Invalidates Decision 2016/1250 on the adequacy of the protection provided by the EU-US Data Protection Shield. curia.europa.eu Publié le 16/07/2020 [Téléchargement] Diponible à l'adresse : <https://tinyurl.com/curia-c31118>

[7]CNIL Plateforme des données de santé : le Conseil d'Etat confie à la CNIL la mission d'expertiser la robustesse des mesures de pseudonymisation. cnil.fr Publié le 19/06/2020 [En ligne]Disponible à l'adresse :<https://www.cnil.fr/fr/plateforme-des-donnees-de-sante-le-conseil-detat-confie-la-cnil-la-mission-dexpertiser-la-robustesse>

[8]Conseil National de l'Ordre des Médecins. Le Health Data Hub. conseil-national.medecin.fr Publié le 16/05/2019 [En ligne]. Consulté le 16/10/2020. Disponible à l'adresse : <https://www.conseil-national.medecin.fr/lordre-medecins/conseil-national-lordre/sante/donnees-personnelles-sante/health-data-hub>

[9]JO Sénat Q.n°14130 de Claude Reynal.Modalités de stockage du "health data hub". senat.fr Publié le 13/02/2020.[En ligne] Disponible à l'adresse : <http://senat.fr/questions/base/2020/qSEQ200114130.html>

[10]InterHop. Pourquoi le Health Data Hub travestit la réalité sur le chiffrement des données de santé sur Microsoft Azure. interhop.org Publié le 15/06/2020.  <https://interhop.org/2020/06/15/healthdatahub-travestit-le-chiffrement-des-donnees> 

[11]Controverses Mines ParisTech Ouverture des données de santé : Anonymisation ou pseudonymisation des données de santé. <https://controverses.minesparis.psl.eu/public/promo16/promo16_G13/www.controverses-minesparistech-3.fr/_groupe13/anonymisation-ou-pseudonymisation-des-donnees-de-sante/index.html>



Aucun commentaire: