La NSA exploite les images sur Internet pour la reconnaissance faciale

On savait que la NSA et son homologue anglais GCHQ interceptaient les flux vidéo des webcams, notamment de services de messagerie instantanée de Yahoo, pour stocker à intervalles réguliers des photos, parfois sexuellement explicites.

Des documents de 2010 et de 2011 montrent que la National Security Agency exploite à grande échelle les images sur Internet pour compléter sa base de données d’images de reconnaissance faciale : dans les courriels, sur les sites sociaux (comme Facebook et Twitter), les programmes de vidéoconférences et bien d’autres sources.

Elle collecterait des millions d’images par jour, dont 50 000 de qualité suffisante pour la reconnaissance faciale d’après un document de 2011 issu du dénonciateur Edward Snowden.

« Nous ne nous intéressons pas qu’aux communications traditionnelles : nous utilisons l’arsenal de complet de moyens pour exploiter numériquement les indices qu’une cible laisse derrière elle dans ses activités régulières sur Internet pour compiler ces informations biographiques et biométriques » qui aident à « mettre en œuvre un ciblage fin».

Une présentation Powerpoint montre des exemples de reconnaissance médiocres, comme celle d’une photographie d’Osama Ben Laden qui retourne aussi des images de barbus avec peu de ressemblance. À l’inverse, l’algorithme de la NSA est parfois étonnamment efficace, reconnaissant un homme sur des douzaines d’images, tantôt rasé tantôt barbu, avec des habits et dans des endroits différents.

Quand on sait les progrès réguliers en reconnaissance faciale, un domaine de recherche en vogue, on peut imaginer que les programmes de la NSA ont été nettement améliorés depuis, et il est difficile d’imaginer des entreprises avec des collections d’images si exhaustives.

La force de la NSA ne s’arrête pas là.
Elle effectue des recherches sur plusieurs bases de données à la fois, dont des bases externes. En 2010, pour la première fois, elle reconnaît des visages d’images issues à la fois de sa base de données Pinwale, et de la base de données du gouvernement sur les terroristes, appelées Tide.

Depuis l’élection du président Obama, le programme s’est intensifié, et la NSA exploite les bases de données de cartes d’identité à l’étranger – contrairement au FBI, elle n’a pas accès aux bases de données américaines comme celle des permis de conduire – et n’hésite pas à pirater les bases de données de pays comme l’Iran, le Pakistan ou l’Arabie Saoudite.

L’agence de renseignements travaille aussi avec la CIA et le département d’État (l’équivalent américain de notre ministère des affaires étrangères) sur le programme Pisces, pour collecter des informations biométriques aux frontières internationales.

Elle peut aussi reconnaître des lieux, en utilisant son imagerie satellite. Dans un exemple, une photo de vacances montrant des hommes devant un embarcadère est recoupée avec des images satellites de la même époque et géolocalise l’endroit comme un centre d’entraînement militaire au Pakistan.

Et la NSA ne se contente pas de la reconnaissance faciale. Elle peut recouper les informations avec de nombreuses bases de données, comme celle des passagers interdits de vols, celle des visas, des terroristes, des notes d’information d’analystes du renseignement, des empreintes digitales et d’autres identifiants.

La reconnaissance faciale peut poser des problèmes de protection de la vie privée, car elle est un outil très puissant d’identification et de renseignement. Aujourd’hui, elle profite d’un vide juridique qui ne limite presque pas ses usages par des organismes gouvernementaux ou des entreprises comme Facebook. Les progrès des algorithmes utilisés, les capacités de calcul et de stockage toujours plus grandes et toujours moins chères, le nombre de caméras publiques et privées qui explose (ordinateurs, smartphones, Google Glass) rendront la reconnaissance faciale plus fiable et partout, et une menace croissante pour la protection de la vie privée si elle n’est pas mieux encadrée.