Anthropic chiede una pausa coordinata: «Rischiamo di perdere il controllo sull'IA»

 

Il 4 giugno 2026 Anthropic ha pubblicato un lungo post sul proprio blog che ha fatto rapidamente il giro del settore: la società creatrice di Claude chiede ai principali laboratori di intelligenza artificiale di prepararsi a un possibile rallentamento coordinato e verificabile dello sviluppo dei modelli frontier. Il motivo è un campanello d'allarme che non si sentiva con questa intensità almeno dal 2023: i sistemi di IA potrebbero presto essere in grado di migliorarsi da soli, più velocemente di quanto la società riesca a gestirne i rischi.

Il nodo del «miglioramento ricorsivo»

Secondo Anthropic, la capacità dell'IA di portare a termine compiti in autonomia raddoppia circa ogni quattro mesi, e la traiettoria attuale sta puntando verso quella che in gergo tecnico viene chiamata recursive self-improvement: il punto in cui la tecnologia è in grado di migliorare se stessa senza intervento umano.

A firmare il post sono il co-fondatore Jack Clark e la responsabile dell'Anthropic Institute Marina Favaro, che scrivono esplicitamente del rischio di «perdita del controllo umano sui sistemi di IA», in un contesto in cui Claude sta avvicinandosi alla capacità di progettare autonomamente il proprio successore senza contributi umani. «Questo si chiama miglioramento ricorsivo», scrivono. «Non ci siamo ancora, e il miglioramento ricorsivo non è inevitabile. Ma potrebbe arrivare prima di quanto la maggior parte delle istituzioni sia pronta ad affrontare.»

Se il miglioramento ricorsivo rappresenterebbe un traguardo tecnologico epocale con benefici in molti campi, Anthropic sottolinea che potrebbe anche aumentare sensibilmente i rischi di perdita del controllo umano sui sistemi di IA.

La proposta: un meccanismo globale verificabile

Anthropic propone che le principali aziende del settore elaborino un meccanismo coordinato per sospendere temporaneamente lo sviluppo dei sistemi di IA avanzati. Non si tratta di uno stop unilaterale, ma di un'architettura di governance che renda la pausa credibile a livello internazionale.

Il coordinamento proposto consentirebbe ai laboratori avanzati di verificare che i rivali globali abbiano effettivamente rallentato o interrotto il proprio lavoro, in modo che un attore malintenzionato non possa approfittare di un rallentamento coordinato per avanzare di nascosto.

Il ragionamento è pragmatico: senza un meccanismo globale, un rallentamento unilaterale rischierebbe di avvantaggiare i protagonisti «meno cauti», aumentando la pressione su aziende e governi alle prese con scelte difficili in materia di sicurezza dell'IA. La pausa servirebbe a permettere alle strutture sociali e alla ricerca sull'allineamento di recuperare terreno rispetto ai progressi tecnologici.

Il contesto: Mythos, il Pentagono e la Casa Bianca

La presa di posizione di Anthropic arriva in un momento di pressioni incrociate. Il modello Mythos di Anthropic ha già scosso settori come quello bancario e del software per la sua capacità di individuare vulnerabilità nel codice esistente. Ma sul fronte regolatorio la risposta istituzionale appare ancora fragile: un ordine esecutivo dell'amministrazione Trump ha messo l'onere sui laboratori stessi, chiedendo loro di sottoporre volontariamente i modelli più avanzati a test di sicurezza informatica governativi prima del rilascio pubblico.

Sul versante militare, Anthropic ha rifiutato di mettere i propri modelli a disposizione dell'esercito statunitense per la sorveglianza interna e per armi completamente autonome, subendo contraccolpi dal governo che l'ha inserita in una lista nera della sicurezza nazionale.

Non è la prima volta che il settore discute di pause. Elon Musk, proprietario del laboratorio xAI, fu tra i sostenitori di un appello lanciato nel 2023 dalla non-profit Future of Life Institute per bloccare lo sviluppo dell'IA per sei mesi al fine di costruire adeguate misure di sicurezza. Quell'iniziativa non ebbe successo.

OpenAI risponde: la governance spetta ai governi democratici

La proposta di Anthropic non trova consenso unanime tra i colossi del settore. OpenAI ha sostenuto un approccio diverso in un report pubblicato il giorno precedente, affermando che «i governi democratici - e non le aziende private che agiscono da sole - devono in ultima analisi determinare» il percorso dello sviluppo dell'IA.

La divergenza è significativa: dove Anthropic propone un'autoregolazione coordinata tra laboratori, OpenAI rimanda la responsabilità alla sfera pubblica istituzionale. Due visioni non necessariamente incompatibili, ma che riflettono culture aziendali e strategie di posizionamento molto diverse.

Una voce che arriva dall'interno

Quello che rende insolita la dichiarazione di Anthropic non è il contenuto - il dibattito sul controllo dell'IA è vecchio quanto il settore stesso - ma la provenienza. È Anthropic stessa, creatrice di Claude, a chiedere che i laboratori al vertice dello sviluppo siano pronti a rallentare. È, in altri termini, una delle aziende che spinge più forte sull'acceleratore a premere anche sul freno, almeno a parole.

L'Anthropic Institute si impegna a esplorare la questione in collaborazione con altri attori e a intraprendere azioni concrete per costruire i sistemi necessari a rendere credibile un eventuale rallentamento o pausa, senza però specificarne i dettagli operativi.

Il dibattito è aperto. Le prossime settimane diranno se questa proposta seguirà la stessa sorte dell'appello del 2023 - archivio polveroso di buone intenzioni - oppure darà impulso a una conversazione istituzionale più concreta.

Nuova Vecchia

Contattami