9 juillet 2020

Intelligence Artificielle prédictive : une data bienveillante ?

par Elodie Joly

Plus si loin de la science fiction, l’intelligence artificielle prédictive est aujourd’hui partout. Médecine, marchés financiers, assureurs… mais aussi criminalité. S’il fascine, l’outil connaît encore une marge de développement dans certains domaines et n’est pas à mettre entre toutes les mains. Décryptage.

 

Aujourd’hui, chaque entreprise bien placée y va de son avancée dans l’IA, reine des marqueurs d’innovation et de modernité. Qu’il s’agisse d’Hitachi dont la technologie permet aux utilisateurs d’une banque polonaise de s’identifier grâce à leurs informations biométriques (en l’occurrence le réseau veineux) ou de Néoface qui scanne les visages des clients de taxis pour leur proposer des publicités ciblées au Japon, l’IA est partout et se base sur une seule et unique chose : la data.

 

« Vous constituez un ensemble d’entraînement »

 

Julien Ah-Pine, universitaire, spécialiste des statistiques et ancien employé de Thalès explique comment fonctionne cette technologie à travers l’exemple de l’assurance : « quand on vous parle de score, on prend plein d’informations (la data) sur le client, on combine ces variables et à la fin on aura une note qui va nous indiquer ce que l’on veut – ici, est-ce qu’on peut faire confiance au client. Là on fait de la prédiction. » nous explique le statisticien. Cela semble simple mais on peut ajouter différentes variables pour complexifier le tout : « Ensuite on généralise pour tout ce qu’on veut. On peut mettre n’importe quelles informations à la base : des images, du son… ce sont des données complexes. » Cela illustre, par exemple le fonctionnement de Siri ou encore Shazam qui détectent des sons et les identifient. C’est également le cas des images Facebook : « quand vous identifiez des personnes sur Facebook, que vous les ‘’taguez’’ vous constituez ce qu’on appelle un ensemble d’entraînement, ici la tâche c’est « je vous donne une image, dites-moi ce qu’il y a dedans. » » C’est ainsi grâce à nous et à notre temps donné gracieusement à ces entreprises que la machine ‘’apprend’’. Les ingénieurs eux travaillent en amont pour dire à la machine ce qu’il faut apprendre et comment. Comme le résume Julien Ah-Pine, « toute innovation est un outil, son usage dépend de la main qui l’utilise et de ses intentions. »

 

« C’est tout simplement des statistiques ! »

 

Par exemple, en médecine prédictive, les chercheurs vont cumuler un ensemble d’informations sur votre passé médical (une sorte de dossier médical numérique) qui sera analysé par une IA pour faire ressortir ce qui intéresse les chercheurs : vos potentielles futures maladies. Ainsi le logiciel est programmé en amont puis nourri de data avant de pouvoir combiner les variables et en faire ressortir une potentialité. « C’est tout simplement des statistiques ! » résume Julien Ah-Pine.

 

La ré-identification personnelle : une faille dans le programme

 

Avez-vous déjà cherché votre nom sur Internet ? Si oui, peut-être y repenserez-vous à deux fois la prochaine fois en ayant lu ce qui suit. Devant tant de données accumulées, une question se pose : celle de la protection de l’intimité des utilisateurs. Il s’agit notamment d’une problématique soulevée par l’Open data : nos données sont majoritairement récupérées et beaucoup d’entre elles sont publiques et libres de droit. Ce sont notamment ce genre de données que les IA utilisent. Or, l’anonymisation de toute cette data n’est pas toujours très efficace et les différents systèmes pour rendre les données d’une personne complètement anonymisées sont faillibles. On parle de ré-identification personnelle lorsqu’on arrive à déceler l’identité d’une personne pourtant anonymisée.

En 2006, AOL – ancien fournisseur d’accès internet – a publié une vaste base de données rassemblant 20 millions de recherches effectuées sur son site par 650 000 utilisateurs. Il a pris soin d’anonymiser chaque personne en leur attribuant des pseudonymes. Problème : leur historique de recherche dévoilait leur identité. Comment ? Il se trouve que la plupart des personnes répertoriées avaient cherché leur nom sur internet afin de consulter un page qui les concerne comme par exemple leur page Facebook… révélant au passage qui ils étaient et toutes les données qui leur étaient attachées au monde entier.

Laisser un commentaire

*

*

0

Your Cart