Anthropic met en garde contre le fait que l’IA se rapproche de l’auto-optimisation
Anthropic donne aux systèmes d’intelligence artificielle (IA) un rôle croissant dans le développement de ses nouveaux modèles, une tendance que l’entreprise considère comme les premiers signes d’un rapprochement avec le concept d' »auto-optimisation itérative ».
Selon des données internes, plus de 80 % du code des produits actuels de l’entreprise a été écrit par Claude, et la quantité de code produite par ingénieur au cours du deuxième trimestre était huit fois plus élevée qu’en 2024.
Marina Favaro, directrice de l’Anthropic Institute, et Jack Clark, cofondateur de l’entreprise, ont écrit que la poursuite de cette tendance, avec une puissance de calcul suffisante, pourrait conduire à un système capable de « concevoir et développer son successeur de manière totalement autonome ».
Le point de non-retour n’a pas encore été atteint et l’auto-amélioration itérative n’est pas inévitable, mais elle pourrait se produire avant que la plupart des organisations ne soient prêtes à y faire face.
Le développement rapide de Claude
Les données d’Anthropic indiquent qu’en avril, Claude a réalisé plus de 800 patchs, un exploit qu’un ingénieur superviseur a estimé à l’équivalent de quatre années de travail humain.
Dans les missions ouvertes, le taux de réussite des sessions de Claude était de 76 % en mai 2026, soit une augmentation de 50 points de pourcentage en seulement six mois.
La durée des tâches que l’IA peut exécuter de manière fiable et autonome double à peu près tous les quatre mois, contre sept mois auparavant.
Lors d’un test visant à accélérer la formation d’un petit modèle d’IA, Claude Opus 4 a obtenu une augmentation de la vitesse d’environ trois fois en mai 2025, tandis que Mythos Preview a obtenu une augmentation d’environ 52 fois en avril 2026.
Progrès dans la recherche sur la sécurité de l’IA
Des tests internes ont montré que Mythos Preview est capable de résoudre les problèmes de recherche liés à la sécurité de l’IA.
En 800 heures de travail, un groupe d’agents intelligents a pu combler 97 % des lacunes identifiées lors de l’expérience, alors que deux chercheurs humains n’ont accompli que 23 % de la charge de travail en une semaine.
Ces résultats suggèrent que les modèles d’IA ne se limitent plus à l’écriture de codes ou à l’exécution de tâches techniques limitées, mais qu’ils commencent à entrer dans des domaines de recherche plus complexes.
Le rôle de l’homme passe de la programmation à la vérification
Malgré les progrès significatifs en matière de codage, Anthropic affirme que les humains conservent un avantage en matière de « réflexion sur la recherche » et de définition d’objectifs stratégiques.
L’entreprise estime que le rôle des développeurs pourrait bientôt passer de l’écriture de lignes de code à l’analyse et à la validation des résultats des modèles neuronaux.
Selon Anthropic, l’examen humain pourrait devenir le principal obstacle à l’accélération du développement de nouveaux modèles, car la capacité de production de l’IA pourrait dépasser la capacité de contrôle et d’évaluation des humains.
Appel à ralentir le développement de modèles avancés
Anthropic a émis l’hypothèse qu’à un moment donné, le monde pourrait avoir besoin de la capacité de ralentir ou de suspendre temporairement le développement des systèmes d’IA les plus avancés.
L’objectif est de donner aux entreprises sociales et aux chercheurs en adaptation de l’IA suffisamment de temps pour suivre le rythme des progrès technologiques.
Dans le même temps, l’entreprise a toutefois prévenu que tout ralentissement unilatéral pourrait se retourner contre l’adoptant, car des parties moins prudentes pourraient profiter de l’occasion pour combler l’écart.
En l’absence d’un mécanisme d’harmonisation mondial clair, les décisions en matière de sécurité de l’IA continueront d’être soumises à la pression de la concurrence commerciale et à des considérations géopolitiques.



