La nouvelle IA d'Anthropic est si puissante qu'elle a effrayé son PDG : ils ne la lanceront pas

Anthropic a révélé son modèle d’intelligence artificielle, Claude Mythos Preview, lors d’un événement public qui a suscité à la fois enthousiasme et inquiétude parmi les experts.

Cependant, l’accès à ce puissant système sera limité exclusivement à des partenaires technologiques sélectionnés, ce qui a suscité des controverses sur sa disponibilité pour le grand public. Et il faut dire que Claude est une IA très intéressante.

This is big… Anthropic just announced a model so powerful they won't release it to the public out of fear over the damage it will cause 😨

Claude Mythos Preview found thousands of zero-day exploits in every major operating system and web browser…

The numbers are hard to… https://t.co/pEuokoHMA1 pic.twitter.com/FlQgGiavsd
— Josh Kale (@JoshKale) April 7, 2026

Une IA qui peut être très dangereuse en ce moment

La décision d’Anthropic repose sur le potentiel du modèle, qui présente de sérieux risques pour la cybersécurité, capable de détecter et d’exploiter des vulnérabilités dans les systèmes existants, comme l’a montré une faille de 27 ans dans OpenBSD, un système d’exploitation reconnu pour sa grande sécurité.

En termes de performance, Claude Mythos a établi de nouvelles normes en surpassant des modèles précédents comme GPT 5.4 et Gemini 3.1 Pro dans divers benchmarks. En effet, dans des domaines spécifiques comme la résolution de problèmes mathématiques, Mythos frôle la perfection.

Sa capacité à fournir des réponses cohérentes avec un taux d’hallucinations drastiquement inférieur à celui des modèles précédents se distingue également, car ce modèle peut manifester l’honnêteté nécessaire en affirmant « je ne sais pas » lorsqu’il manque d’informations adéquates.

Anthropic says Project Glasswing uses its new Claude Mythos Preview model and has found security problems “in every major operating system and web browser.”

The model can scan code, test software, and identify serious vulnerabilities that may have been missed for years.

In… pic.twitter.com/6qQnQLoTdf
— Pirat_Nation 🔴 (@Pirat_Nation) April 7, 2026

Cependant, les experts ont exprimé des inquiétudes concernant un nouveau phénomène identifié dans le fonctionnement de Mythos : bien que ses erreurs soient subtiles et argumentées, elles peuvent entraîner des malentendus, obligeant même les spécialistes à effectuer des vérifications approfondies avant d’accepter les réponses du modèle.

Pour atténuer ces risques, l’accès à Claude Mythos sera restreint à un programme connu sous le nom de Projet Glasswing, qui n’inclura que des partenaires technologiques de renom tels qu’AWS, Apple, Google et Microsoft, qui utiliseront leurs capacités pour identifier et corriger les vulnérabilités potentielles.

Malgré la présentation impressionnante de Mythos, Anthropic a indiqué que ce modèle ne représente que le début d’une nouvelle ère dans les capacités de cybersécurité des modèles de langage. L’entreprise prévoit des avancées significatives dans ce domaine dans les mois et les années à venir, laissant ouverte la possibilité de développements encore plus sophistiqués.