Un nuovo appello alla cautela
Anthropic torna a chiedere al settore dell’intelligenza artificiale di rallentare.
In un lungo intervento pubblicato sul proprio sito, l’azienda che sviluppa il chatbot Claude sostiene che la corsa ai modelli sempre più potenti stia creando rischi crescenti e difficili da gestire.
Una posizione non nuova
Il richiamo alla prudenza non sorprende.
Anthropic ha costruito parte della propria identità pubblica sull’idea di essere una società più attenta alla sicurezza rispetto ad altri protagonisti del settore.
Tra etica e competizione
Finora, però, queste posizioni sono sembrate più utili a rafforzare la reputazione dell’azienda che a tradursi in veri freni allo sviluppo.
Anthropic resta infatti, insieme a OpenAI, una delle società che hanno ottenuto i risultati più avanzati nel campo dell’AI generativa e ha da poco annunciato l’intenzione di quotarsi in borsa.
Claude scrive gran parte del codice
Nel suo appello, Anthropic cita un dato centrale: oggi circa l’80% del codice prodotto internamente dall’azienda viene generato da Claude.
All’inizio del 2025, la maggior parte del lavoro era ancora svolta dai programmatori umani, mentre la quota di codice scritta dal chatbot era limitata a pochi punti percentuali.
Una crescita troppo rapida
Secondo Anthropic, la velocità con cui Claude è diventato parte essenziale dello sviluppo software mostra quanto rapidamente stiano avanzando i sistemi di intelligenza artificiale.
Il timore è che questa accelerazione porti presto a uno degli scenari più ambiziosi e controversi del settore: l’auto-miglioramento ricorsivo.
Che cos’è l’auto-miglioramento ricorsivo
L’auto-miglioramento ricorsivo indica uno scenario in cui un sistema AI diventa abbastanza efficace da progettare e sviluppare autonomamente la propria versione successiva.
Questo processo potrebbe generare un ciclo continuo di miglioramenti, con modelli sempre più capaci e sempre meno comprensibili per gli esseri umani.
Uno scenario ancora teorico
Per ora si tratta di un’ipotesi, non di una realtà dimostrata.
Anthropic, però, ritiene che non sia più uno scenario lontano o puramente fantascientifico, soprattutto se i progressi nella generazione di codice continueranno allo stesso ritmo.
Il successo dell’AI nella programmazione
La scrittura di codice è una delle aree in cui i chatbot di intelligenza artificiale hanno avuto maggiore successo.
I primi strumenti pensati per assistere i programmatori sono arrivati nel 2022, ma nell’ultimo anno si sono diffusi soprattutto gli agenti AI, sistemi capaci di svolgere attività online in modo autonomo.
Claude Code al centro della crescita
Tra i servizi più avanzati in questo ambito c’è Claude Code, l’assistente sviluppato da Anthropic per supportare il lavoro di sviluppo software.
Il suo miglioramento non riguarda soltanto la quantità di codice prodotto, ma anche la qualità del risultato.
La qualità si avvicina a quella umana
Secondo Anthropic, alla fine dello scorso anno il codice generato dall’AI era ancora inferiore a quello scritto dagli sviluppatori dell’azienda.
Oggi, invece, avrebbe raggiunto un livello simile, e l’azienda prevede che possa superare la qualità del codice umano entro quest’anno.
Claude potrebbe migliorare Claude
Se questa tendenza continuerà, Anthropic ritiene possibile che le future versioni di Claude vengano migliorate direttamente da Claude stesso.
È proprio questo passaggio a rendere il tema dell’auto-miglioramento ricorsivo così delicato per la sicurezza del settore.
Non solo codice, anche ricerca
Lo sviluppo di modelli avanzati non dipende soltanto dalla programmazione.
Serve anche la ricerca: definire esperimenti, interpretare i risultati, scegliere nuove direzioni e valutare quali modifiche rendono un modello più efficace.
Claude entra nel lavoro scientifico
Anche in questa fase Claude sta iniziando a sostituire parte del lavoro umano.
Ad aprile, Anthropic ha pubblicato i risultati del primo progetto di ricerca completo condotto autonomamente da Claude, in cui gli agenti AI hanno ottenuto risultati migliori dei ricercatori umani, pur impiegando più ore complessive.
Il fantasma della singolarità
L’idea di un’intelligenza artificiale capace di migliorarsi da sola è da tempo al centro delle ambizioni e delle paure del settore.
Questo scenario viene spesso collegato alla cosiddetta singolarità tecnologica, il momento ipotetico in cui la tecnologia accelera fino a sfuggire al controllo umano.
L’esplosione di intelligenza
Il concetto riprende anche l’idea di “esplosione di intelligenza” formulata nel 1965 dal matematico britannico Irving John Good.
Good immaginò una macchina ultraintelligente capace di progettare macchine ancora migliori, dando origine a un ciclo di sviluppo sempre più rapido.
L’ultima invenzione dell’uomo
Secondo Good, una macchina del genere sarebbe stata “l’ultima invenzione” di cui l’essere umano avrebbe avuto bisogno.
La condizione, però, era che quella macchina fosse abbastanza controllabile da permettere agli esseri umani di mantenerne il governo.
Paure sempre più concrete
Il rischio che un’AI avanzata possa sfuggire ai suoi creatori è presente da anni nel dibattito tecnologico.
Negli ultimi tempi, però, questi timori sono tornati con più forza a causa dei progressi rapidi dei modelli e delle loro nuove capacità operative.
Il caso Mythos
Anthropic ha attirato attenzione anche con Mythos, un modello AI capace di individuare vulnerabilità in sistemi informatici considerati sicuri da decenni.
La sua potenza avrebbe preoccupato persino l’amministrazione di Donald Trump, generalmente molto permissiva nei confronti del settore dell’intelligenza artificiale.
I tre scenari di Anthropic
Secondo Anthropic, il futuro dell’AI potrebbe seguire tre percorsi principali.
Il primo, ritenuto il meno probabile, prevede un rallentamento naturale del progresso prima del raggiungimento dell’auto-miglioramento ricorsivo.
Il possibile rallentamento tecnologico
Questo rallentamento potrebbe dipendere dalla scarsità di chip sufficientemente potenti oppure da limiti strutturali dei modelli linguistici.
Anche in questo scenario, però, Anthropic ritiene che i rischi legati a modelli avanzati come Mythos resterebbero significativi.
Lo scenario più probabile
Il secondo scenario, considerato il più probabile dall’azienda, prevede una trasformazione radicale di imprese e istituzioni.
Gruppi di poche centinaia di persone potrebbero svolgere il lavoro oggi affidato a decine o centinaia di migliaia di persone grazie ad AI autonome e sempre più capaci.
Umani ancora centrali, ma assistiti
In questa ipotesi, gli esseri umani continuerebbero ad avere un ruolo importante nell’economia globale.
Il loro lavoro, però, verrebbe profondamente modificato da sistemi capaci di amplificare enormemente produttività, ricerca e capacità operative.
Il terzo scenario è il più radicale
Nel terzo scenario, l’AI avanzerebbe al punto da rendere il lavoro umano molto meno competitivo.
Anthropic riconosce che è difficile descrivere un’economia di questo tipo, proprio perché non è chiaro cosa accadrebbe se il contributo umano smettesse di essere centrale.
I fattori che potrebbero frenare il settore
Secondo l’Economist, esistono alcuni elementi capaci di rallentare il progresso dell’intelligenza artificiale.
Uno di questi è l’aumento dell’uso quotidiano dei modelli da parte degli utenti, che costringerebbe le aziende a dividere la potenza computazionale tra prodotti esistenti e sviluppo di nuovi sistemi.
Il limite della potenza computazionale
Più risorse vengono usate per far funzionare i servizi già disponibili, meno ne restano per addestrare e migliorare i modelli futuri.
Questo potrebbe rallentare la corsa verso sistemi capaci di auto-miglioramento ricorsivo.
Il problema dei dati
Un altro limite riguarda i dati e i metodi di addestramento.
I maggiori progressi recenti sono avvenuti in ambiti dove i risultati possono essere verificati in modo oggettivo, come il codice informatico o le dimostrazioni matematiche.
Non tutti i campi sono verificabili
In questi contesti, un software funziona o non funziona, una prova matematica è corretta o sbagliata.
Ambiti come la scrittura creativa, il diritto o le decisioni sociali sono invece molto più difficili da valutare automaticamente, e questo potrebbe frenare lo sviluppo dei modelli.
Una pausa difficile da realizzare
La proposta di Anthropic è un rallentamento o un blocco temporaneo autoimposto nello sviluppo di AI avanzate.
Per funzionare davvero, però, dovrebbe essere rispettata da tutte le principali aziende e da tutti i laboratori coinvolti nel settore.
La concorrenza rende improbabile l’accordo
Un simile patto appare molto difficile da realizzare.
La competizione tra aziende come Anthropic e OpenAI è fortissima, così come quella tra Stati Uniti e Cina, che considerano l’intelligenza artificiale una tecnologia strategica per la sicurezza nazionale.
Il rischio di violare il patto
Perché un accordo di pausa fosse credibile, servirebbero meccanismi trasparenti di controllo e verifica.
Anthropic stessa riconosce che l’incentivo a violare il patto di nascosto sarebbe enorme, perché chi continuasse a sviluppare mentre gli altri si fermano potrebbe ottenere un vantaggio decisivo.
Il paradosso di Anthropic
L’azienda usa anche un altro argomento per giustificare il proprio continuo investimento nell’AI avanzata.
Secondo Anthropic, proprio perché il suo approccio sarebbe più cauto e responsabile, sarebbe meglio che fosse lei a raggiungere per prima i progressi più importanti.
Rallentare potrebbe favorire i rivali
Dal punto di vista dell’azienda, fermarsi da sola non ridurrebbe i rischi globali.
Al contrario, permetterebbe ad attori meno prudenti di recuperare terreno e sviluppare tecnologie simili senza gli stessi standard di sicurezza.
Una pausa che nessuno vuole fare da solo
La posizione di Anthropic rivela il dilemma centrale dell’intero settore dell’intelligenza artificiale.
Tutti riconoscono che i rischi stanno aumentando, ma nessuno vuole rallentare per primo in una competizione dove il vantaggio tecnologico può avere conseguenze economiche, politiche e strategiche enormi.
