Anthropic a révélé son modèle d’intelligence artificielle, Claude Mythos Preview, lors d’un événement public qui a suscité à la fois enthousiasme et inquiétude parmi les experts.
Cependant, l’accès à ce puissant système sera limité exclusivement à des partenaires technologiques sélectionnés, ce qui a suscité des controverses sur sa disponibilité pour le grand public. Et il faut dire que Claude est une IA très intéressante.
Une IA qui peut être très dangereuse en ce moment
La décision d’Anthropic repose sur le potentiel du modèle, qui présente de sérieux risques pour la cybersécurité, capable de détecter et d’exploiter des vulnérabilités dans les systèmes existants, comme l’a montré une faille de 27 ans dans OpenBSD, un système d’exploitation reconnu pour sa grande sécurité.
En termes de performance, Claude Mythos a établi de nouvelles normes en surpassant des modèles précédents comme GPT 5.4 et Gemini 3.1 Pro dans divers benchmarks. En effet, dans des domaines spécifiques comme la résolution de problèmes mathématiques, Mythos frôle la perfection.
Sa capacité à fournir des réponses cohérentes avec un taux d’hallucinations drastiquement inférieur à celui des modèles précédents se distingue également, car ce modèle peut manifester l’honnêteté nécessaire en affirmant « je ne sais pas » lorsqu’il manque d’informations adéquates.
Cependant, les experts ont exprimé des inquiétudes concernant un nouveau phénomène identifié dans le fonctionnement de Mythos : bien que ses erreurs soient subtiles et argumentées, elles peuvent entraîner des malentendus, obligeant même les spécialistes à effectuer des vérifications approfondies avant d’accepter les réponses du modèle.
Pour atténuer ces risques, l’accès à Claude Mythos sera restreint à un programme connu sous le nom de Projet Glasswing, qui n’inclura que des partenaires technologiques de renom tels qu’AWS, Apple, Google et Microsoft, qui utiliseront leurs capacités pour identifier et corriger les vulnérabilités potentielles.
Malgré la présentation impressionnante de Mythos, Anthropic a indiqué que ce modèle ne représente que le début d’une nouvelle ère dans les capacités de cybersécurité des modèles de langage. L’entreprise prévoit des avancées significatives dans ce domaine dans les mois et les années à venir, laissant ouverte la possibilité de développements encore plus sophistiqués.