WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Intelligence artificielle et mise en oeuvre des principes de privacy by design et privacy by default


par Julie Morin Richard
Ulco - Master 2 Droit des affaires 2020
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Chapitre 1 : Les principes directeurs du RGPD, des principes limités

L'usage de l'intelligence artificielle lors du traitement de données à caractère personnel révèle les zones d'ombres du RGPD tant dans ses définitions (Section 1) que ses principes directeurs (Section 2). Les principes de privacy by design et de privacy by default peuvent alors servir de balance pour une réglementation efficace (Section 3).

Section 1 : La remise en question des définitions par l'intelligence artificielle

L'intelligence artificielle questionne tant la définition de donnée à caractère personnel (§1) que la possibilité de ré-identifier des personnes concernées (§2).

§1. La distinction entre données à caractère personnel, données pseudonymes, données anonymes

Le RGPD s'applique dès lors qu'un traitement cible des données à caractère personnel (art. 2.1 RGPD). Une donnée à caractère personnel est une donnée qui permet d'identifier directement ou indirectement une personne (art. 4.1 RGPD). Par conséquent, les données anonymes ne sont pas des données à caractère personnel. Elles sont définies au considérant (26) du Règlement comme les « informations ne concernant pas une personne physique identifiée ou identifiable ». En revanche, les données pseudonymes sont des données à caractère

- 24 -

L'application des principes de protection des données à caractère personnel à l'intelligence artificielle

personnel143. Elles ne permettent pas de ré-identifier des personnes concernées directement, mais indirectement via des mécanismes tels que des clés de ré-identification par une technique de hachage144, ou de stockage sur des espaces distincts.

Données anonymes

Données à caractère personnel

 

Autres données

Identification impossible

Personnes identifiables
indirectement

Personnes identifiables directement

Non soumises au RGPD

Soumises aux dispositions du RGPD

 

Une donnée anonyme peut l'être soit par nature, soit en faisant l'objet d'un processus d'anonymisation. L'anonymisation empêche la ré-identification de la personne concernée de manière définitive145. Dans un avis146 de 2014, le Groupe de travail « article 29 » sur la protection des données (G29) considère qu'une donnée est anonymisée si et seulement si aucun des trois critères suivants n'est rempli. Si un de ces critères est rempli, les données ne sont pas anonymes.

· L'individualisation : Est-il toujours possible d'isoler un individu ?

Il s'agit de la « possibilitéì d'isoler une partie ou la totalitéì des enregistrements identifiant un individu dans l'ensemble de données »147.

· La corrélation : est-il toujours possible de relier entre eux les enregistrements relatifs à un individu ?

Cela consiste en « la capacitéì de relier entre elles, au moins, deux enregistrements se rapportant àÌ la même personne concernée ou à un groupe de personnes concernées (soit dans la même base de données, soit dans deux bases de données différentes) ».

· L'inférence : peut-on déduire des informations concernant un individu ?

Il s'agit de « la possibilitéì de déduire, avec un degré de probabilité élevé, la valeur d'un attribut à partir des valeurs d'un ensemble d'autres attributs. »

Par ailleurs, le G29 insiste sur le fait que les techniques du numérique évoluent et qu'il faut donc s'adapter à l'état de l'art, c'est-à-dire à l'évolution technique de chaque innovation148 : « Les éléments contextuels ont leur importance : il faut prendre en considération «l'ensemble»

143 Art. 4.5 RGPD

144 La fonction de hachage permet de transformer une donnée en une suite définie de chiffres et de lettres.

145 Conseil d'État, décision n° 393174, RJDA 5/17 n° 386, 8 février 2017

146 G 29, Avis 05/2014 sur les Techniques d'anonymisation, 0829/14/FR WP216, 2014 p.3

147 Ibid., p.13

148 Ibid., p.7

- 25 -

L'application des principes de protection des données à caractère personnel à l'intelligence artificielle

des moyens «susceptibles» d'être «raisonnablement» utilisés à des fins d'identification par le responsable du traitement ou par des tiers, en prêtant une attention particulière aux moyens que l'état actuel de la technologie a rendu récemment «susceptibles» d'être «raisonnablement» mis en oeuvre (compte tenu de l'évolution de la puissance de calcul et des outils disponibles). »

Le Conseil d'État149, dans sa décision JCDecaux du 8 février 2017 statuant en appel150 sur la notion d'anonymisation, s'inspire des critères du G29, même si cet avis est dépourvu d'une valeur normative. Il considère les données comme anonymisées lorsque « l'identification de la personne concernée, directement ou indirectement, devient impossible que ce soit par le responsable du traitement ou par un tiers. Tel n'est pas le cas lorsqu'il demeure possible d'individualiser une personne ou de relier entre elles des données résultant de deux enregistrements qui la concernent. » En l'espèce, le Conseil d'État considère que les données traitées sont des données pseudonymes et non anonymes. Le procédé utilisé est un processus de hachage, irréversible, mais les données hachées peuvent encore contenir des indices de singularisation pouvant être retrouvés par les techniques d'inférence et de corrélation. Comme le résument151 R. Perray et J. Uzan-Naulin, le Conseil d'État s'inspire ici implicitement du droit souple du G29. Les critères des procédés d'anonymisation prennent ainsi une valeur normative de droit dur.

On pourra donc considérer des données comme anonymes dès lors qu'aucun des trois critères du G29 (individualisation, corrélation, inférence) ne sont remplis et que l'état de la technique ne permet pas de ré-identifier ces données.

§2. Le risque de ré-identification à l'heure du big data

Dès lors, quel est l'état de l'art à l'heure du big data ? Le développement de nouveaux usages tels que l'open data et l'internet des objets posent de nouvelles contraintes aux processus de pseudonymisation et d'anonymisation. L'open data offre la possibilité de regrouper des bases et ainsi de ré-identifier directement ou indirectement des personnes. Ainsi, de nombreuses études confirment scientifiquement152 l'impossibilité de rendre des données totalement anonymes. C'est pour ces raisons qu'une grande majorité de la doctrine à l'instar de A. Jomni153 et R. Perray et J. Uzan-naulin154 s'interroge sur la notion même de données à caractère

149 Ibid., p.7

150 CNIL, Délib. n°2015-255,16 juillet 2015

151 R. Perray, J. Uzan-Naulin, « Existe-t-il encore des données non personnelles ? Observations sous Conseil d'État, 8 février 2017, n° 393714, Société JCDecaux », Dalloz IP/IT, 2017, p. 286

152 A. Narayanan, V. Shmatikov, «Robust De-anonymization of Large Sparse Datasets», IEEE Symposium on Security and Privacy, 2008, p.111-125

153 A. Jomni, « RGPD : un atout ou un frein pour la sécurité ? », Dalloz IP/IT, p.352, Juin 2019

154 R. Perray, J. Uzan-Naulin, Existe-t-il encore des données non personnelles ? op. cit.

- 26 -

L'application des principes de protection des données à caractère personnel à l'intelligence artificielle

personnel. Cette idée est reprise dans le rapport Villani155, qui démontre en s'appuyant sur les travaux d'H. Nissenbaum que les données sont par essence contextuelles et peuvent fournir des informations sur un ou plusieurs individus. Par conséquent, dans le cadre de l'apprentissage automatique non supervisé, le traitement à grande échelle peut permettre d'effectuer des corrélations entre des individus. L'institut Montaigne partage156 cette même approche, en considérant que les métadonnées telles que le nombre de clics peuvent se transformer en données à caractère personnel à partir du moment où il révèle des informations sur nos humeurs ou notre état de santé. Dans cette perspective, la distinction classique entre données personnelles et données anonymes n'est plus pertinente.

De plus, l'usage du big data et de l'intelligence artificielle permet de transformer des données brutes en données identifiantes par regroupement a posteriori. Or, le Règlement s'applique dès que la donnée collectée est une donnée à caractère personnel, donc a priori. Cependant, avec le big data, la donnée devient une donnée à caractère personnel lors du traitement alors qu'elle ne l'était pas lors de la collecte. C'est pourquoi ce prérequis de donnée à caractère personnel n'est plus pertinent157.

Malgré les limites techniques du processus d'anonymisation et sous réserve d'une documentation détaillée, les critères du G29 permettent néanmoins de justifier d'un processus d'anonymisation juridiquement conforme. Le RGPD impose en effet une obligation de moyens et non de résultat à cet égard158. Le procédé d'anonymisation demeure donc légal en l'état de la réglementation et permet ainsi de ne plus être soumis au RGPD.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Des chercheurs qui cherchent on en trouve, des chercheurs qui trouvent, on en cherche !"   Charles de Gaulle