Blog Données personnelles

Quels critères pour garantir l’efficacité d’une solution d’anonymisation ?

A l’occasion de la consultation en ligne organisée par la CNIL et la CADA sur leur Guide pratique sur l’Open data élaboré en concertation avec les services d’Etalab, (« De la publication en ligne et de la réutilisation des données publiques  »), une définition et une explication du process permettant d’aboutir à l’anonymisation de données à caractère personnel est apportée.

Une solution d’anonymisation ne peut être générique. Elle doit être adaptée au cas par cas mais doit respecter deux principes :

  • Transformer les données pour qu’elles ne se réfèrent plus à une personne réelle en éliminant par exemple tout élément relatif à son nom ou à un numéro d’identification.
  • Généraliser les données afin qu’elles deviennent communes à un ensemble de personnes et non plus spécifiques à une personne, par exemple en appauvrissant les éléments susceptibles d’individualiser une personne (le département plutôt que le code postal exact, tranches d’âge plutôt que les dates de naissance).

Reprenant les critères définis dans l’avis 05/2014 du Groupe de travail de l’ancien Article 29 sur les Techniques d’anonymisation adopté le 10 avril 2014, la CNIL rappelle qu’une solution d’anonymisation efficace repose sur les notions d’individualisation, de corrélation et d’interférence.

Est-il toujours possible d’isoler une personne au sein d’un ensemble de données ? Des ensembles de données rapprochés entre eux peuvent-ils permettre d’identifier une personne ? Peut-on déduire de l’information dont on dispose une information sur un individu ?

Une analyse détaillée des risques de ré-identification devra être menée si au moins une réponse négative est apportée aux questions précitées. Sinon, la solution pourra être considérée comme assurant une réelle anonymisation.