L’empreinte digitale est l’un des piliers de la médecine légale, mais malgré ce que nous voyons à la télévision et au cinéma, l’analyse et la correspondance des impressions latentes est une entreprise difficile et toujours réservée aux experts. Mais maintenant, les scientifiques de l’Institut national des normes et de la technologie (NIST) et de l’Université d’état du Michigan utilisent des algorithmes et de l’apprentissage machine pour automatiser le processus et rendre les correspondances des empreintes digitales plus efficaces.
Avec les lecteurs d’empreintes digitales intégrés aux smartphones, il semble que fabriquer un analyseur automatisé des empreintes digitales pour les médecins légistes serait facile. Certes, si vous pouvez obtenir des impressions claires, propres et entières, vous pouvez en comparer deux avec un rétroprojecteur et quelques diapositives. Le problème est que les criminels ne sont pas très « participatifs » et les empreintes digitales des scènes du crime sont généralement incomplètes, déformées, tachées ou laissées sur des surfaces à motifs comme des billets de banque, ce qui les rendent difficiles à lire, à analyser et à faire correspondre.
En raison de cela, l’analyse de l’empreinte digitale est une occupation très humaine et subjective avec des experts qui examinent les empreintes digitales pour les combiner non seulement avec celles des fichiers de police, mais même pour déterminer s’il existe suffisamment d’informations pour rechercher une correspondance.
Les systèmes informatiques actuels peuvent gérer les empreintes digitales collectées dans des conditions contrôlées à partir des 10 doigts, mais ils ne fonctionnent pas trop bien dans le monde réel. Il existe le système automatisé d’identification des empreintes digitales (AFIS), mais si les empreintes digitales ne sont pas correctement vérifiées pour leur potentiel de fournir des informations, les chances de récupérer des correspondances erronées augmentent considérablement.
Pour l’équipe NIST / Michigan, l’étape consistant à déterminer si cela valait la peine de faire correspondre des empreintes, semblait la plus prometteuse à automatiser avec l’espoir d’accélérer le processus et de réduire les arriérés. Pour ce faire, les chercheurs se sont tournés vers 31 experts en empreinte digitale qui ont analysé 100 empreintes latentes chacune. Les empreintes ont chacune été marquées sur une échelle de 1 à 5 en termes de qualité et ont ensuite été utilisées pour former l’algorithme en utilisant l’apprentissage machine.
La performance du système a ensuite été testée face à une nouvelle série d’empreintes dont les chercheurs connaissaient déjà les correspondances. Les empreintes notées ont été soumises à l’AFIS, qui a été connecté à une base de données de plus de 250 000 empreintes. Les résultats de ces recherches ont été marqués par des correspondances correctes par rapport aux scores de qualité du système. Pour dissiper les problèmes de confidentialité, les empreintes de la base de données de la police de Michigan State ont été dépouillés de toutes les informations personnelles.
Selon l’équipe, il y avait une corrélation cohérente entre la qualité et la précision, avec des impressions notées de mauvaise qualité produisant des résultats plus erronés. En outre, l’algorithme de notation a légèrement amélioré les experts humains. Ensuite, l’équipe va essayer d’améliorer l’algorithme et de mesurer plus précisément son taux d’erreur en utilisant un plus grand ensemble de données.
«Nous avons fait fonctionner notre algorithme avec une base de données de 250 000 empreintes, mais nous devons le faire fonctionner avec des millions», explique Elham Tabassi, ingénieur en informatique au NIST. « Un algorithme comme celui-ci doit être extrêmement fiable, car les vies et la liberté sont en jeu ».
http://ieeexplore.ieee.org/document/7961274/