Accéder au contenu.
Menu Sympa

educ - Re: [EDUC] Problème d'anonymisation

Objet : Liste de discussion du groupe de travail Éducation et logiciels libres de l'April (liste à inscription publique)

Archives de la liste

Re: [EDUC] Problème d'anonymisation


Chronologique Discussions 
  • From: Christophe Gragnic <christophegragnic AT gmail.com>
  • To: educ AT april.org
  • Subject: Re: [EDUC] Problème d'anonymisation
  • Date: Fri, 9 Feb 2018 16:01:46 +0100
  • Authentication-results: vip.april.org; dkim=pass (2048-bit key; unprotected) header.d=gmail.com header.i= AT gmail.com header.b="fN7HlHdw"; dkim-atps=neutral

2018-02-09 15:13 GMT+01:00 Marie-Odile Morandi <mbottoli AT mailarchi.it>:
> Bonjour,

Bonjour,

> J'ai commencé la transcription d'un exposé de Gilles Dowek intitulé «
> Éthique et algorithmes ».
>
> C'est ici :
> https://wiki.april.org/w/%C3%89thique_et_algorithmes_-_Gilles_Dowek

Merci pour ce travail.

> Sur la vidéo, 3 minutes, quelqu'un disposant de quelques minutes pourrait
> m'expliquer l'exemple :
> Gilles Dowek : « En fait, ce n’est pas tout à fait le cas, parce que si vous
> multipliez 2 par 30 0000, par 100 000, vous obtenez 9 milliards ; ça veut
> dire qu’il y a 9 milliards de combinaisons de trois informations qui sont le
> genre d’une personne, sa date de naissance et son code postal.

Attention il y a peut-être un zéro de trop, j’imagine que c’est 30 000
(trente mille).

Il faut s’imaginer parcourir un chemin (ça fonctionne bien aussi avec
un arbre avec des branches qui se séparent). Sur ce chemin, on va
nous donner trois choix à faire.

Arrivé à un premier «Y», disons à gauche vers «féminin» et à droite
vers «masculin», nous avons deux possibilités.

Imaginons que plus loin, sur chacun de ces deux chemins, nous ayons
30000 possibilités pour continuer notre chemin, un carrefour avec le
chemin d’où l’on vient (on ne le compte pas, on ne retournee pas sur
nos pas), et 30000 autres pour continuer notre parcours.
La multiplication 2×30000 nous permet de dénombrer le nombre de
chemins possibles: 60000 jusqu’ici.
30000 est une approximation du nombre de jours dans un siècle,
qui peut être assez proche du nombre de dates de naissances des
personnes vivantes à ce jour:
30 jours par mois, 10 mois par ans et 100 ans en approximation de la
durée de vie.

En ajoutant au bout de chacun de ces chemins un embranchement qui nous
donne à choisir entre 100 000 possibilités, il faut encore multiplier
par 100 000
pour avoir le nombre total de destinations possibles après ces trois
embranchements.
100000 étant une approximation du nombre de code postaux en france.

2 × 30 000 × 100 000 vaut bien 6 000 000 000 (j’ai recompté les zéros !)

> Et comme nous
> sommes 60 millions de personnes vivant en France, nous sommes 100 fois moins
> de personnes que de combinaisons. Donc la plupart d’entre nous sont
> identifiés exactement par ces trois informations, leur genre, leur date de
> naissance et leur code postal. »

En comparant le nombre d’identifiants avec le nombre de personnes, on voit
qu’il y a statistiquement peu de collisions possibles.
Cela reste un raisonnement «à la louche», mais qui donne une idée des
ordres de grandeur en jeu.

J’espère que ça aide.


chri



Archives gérées par MHonArc 2.6.19+.

Haut de le page