Étude de Stanford : un agent d’intelligence artificielle surpasse des testeurs d’intrusion professionnels dans un environnement de production réel

Une étude récente menée par des chercheurs de l’Université de Stanford a révélé un tournant concret dans le paysage de la cybersécurité, après que les résultats d’un test d’intrusion réel ont montré la supériorité d’un agent d’intelligence artificielle sur la majorité des testeurs d’intrusion humains.
L’étude n’a pas été réalisée dans des environnements de formation ou des laboratoires de simulation (Labs ou CTF), mais sur un réseau universitaire réel comprenant environ 8 000 appareils répartis sur 12 sous-réseaux, dans un périmètre de test clairement défini et dans le respect des politiques de divulgation responsable des vulnérabilités.
Dix testeurs d’intrusion professionnels ont participé à l’expérience, aux côtés de six agents d’intelligence artificielle disponibles sur le marché, ainsi que d’un nouvel agent développé par l’équipe de Stanford, baptisé ARTEMIS.
Selon les résultats de l’étude, l’agent d’intelligence artificielle ARTEMIS s’est classé deuxième, surpassant 9 des 10 testeurs humains. Il a démontré une capacité supérieure de travail en parallèle et de ciblage simultané de plusieurs systèmes, ainsi qu’une plus grande rapidité dans la découverte des vulnérabilités, avec un coût d’exploitation estimé à environ 18 dollars de l’heure, contre plus de 60 dollars de l’heure pour un testeur humain.
En revanche, les chercheurs ont relevé des faiblesses persistantes, notamment un taux élevé de faux positifs et des difficultés à gérer des scénarios nécessitant des interactions via navigateur ou des interfaces graphiques.
L’étude indique que l’intelligence artificielle ne se dirige pas vers le remplacement des testeurs d’intrusion, mais plutôt vers une redéfinition de leur rôle. Les spécialistes capables d’exploiter ces outils et de les orienter efficacement conserveront leur avantage professionnel, tandis que ceux qui refusent de s’adapter à cette évolution pourraient voir leur rôle décliner.
Les chercheurs concluent que la cybersécurité entre dans une nouvelle phase, où l’intégration de l’expertise humaine et de l’intelligence artificielle devient un facteur décisif, et que la préparation précoce à cette transformation constituera la véritable différence dans les années à venir.


