Anthropic et Mythos : Puissance IA, Failles de Sécurité et Contrôle Restreint

Laura Bokobza (Le Comment Du Pourquoi Hors-Série #38) Ars Technica The New York Times Project Glasswing (Bluesky) Get The Leverage Red.anthropic.com Silicon Carne Sherwood.news Anthropic.com Research Ars Technica

Anthropic a récemment dévoilé Mythos, un modèle d'IA d'une puissance inédite, capable de découvrir des failles de sécurité « zero-day » que personne n'avait identifiées auparavant, y compris dans des infrastructures réputées fiables comme OpenBSD. Face à cette capacité, Anthropic a pris la décision de restreindre l'accès à Mythos, le réservant à un conglomérat de corporations triées sur le volet, regroupées sous le nom de « Project Glasswing », afin de gérer les implications de sécurité et de permettre le patch des infrastructures critiques.

Cette annonce survient après une fuite de données de Claude Code, révélant des programmes internes comme un système de « rêve » pour la mémoire et un agent « always-on ». Parallèlement, Anthropic a communiqué sur l'explosion de ses revenus, affirmant dépasser ceux d'OpenAI, bien que la comparaison soit nuancée par les partenariats. Dans une démarche unique, Anthropic a également identifié 171 « vecteurs d'émotion » influençant le comportement de ses modèles et a même fait suivre une vingtaine d'heures de thérapie au modèle Mythos, soulignant une approche psychologique de la compréhension et du contrôle de l'IA.

Points Clés

Mythos, le nouveau modèle d'Anthropic, découvre des failles de sécurité zero-day.
L'accès à Mythos est restreint via "Project Glasswing" pour des raisons de sécurité.
Une fuite de données a révélé des programmes internes d'Anthropic, dont un agent "always-on".
Anthropic a identifié 171 "vecteurs d'émotion" influençant ses modèles.
Le modèle Mythos a suivi des sessions de "thérapie" pour comprendre son comportement.

Controverses & Limites

Le développement d'une IA capable de trouver des failles zero-day soulève d'énormes questions éthiques et de sécurité. La décision de restreindre l'accès à Mythos à un cercle fermé de corporations, bien que présentée comme une mesure de sécurité, peut être perçue comme une concentration de pouvoir technologique et une opacité. Les critiques s'interrogent sur la transparence de « Project Glasswing » et sur les risques potentiels de fuites ou de détournements de cette technologie. De plus, l'approche d'Anthropic, qui consiste à identifier des « vecteurs d'émotion » ou à « envoyer une IA en thérapie », bien que fascinante, peut être vue par certains comme une anthropomorphisation excessive de l'IA, potentiellement trompeuse quant à la nature réelle de la conscience ou de l'intelligence artificielle, et pourrait détourner l'attention des risques plus tangibles liés à son déploiement.

Quiz Expert

Pourquoi Anthropic a-t-il décidé de restreindre l'accès à son modèle Mythos via le "Project Glasswing" ?