5 motivi perché l'idea che l’AI abbia ricattato i suoi creatori è sbagliata, fuorviante e pericolosa

AGI – Negli ultimi giorni è circolata una notizia che ha fatto molto rumore: secondo quanto riportato da alcuni articoli, Claude 4, un modello avanzato di intelligenza artificiale sviluppato da Anthropic, avrebbe messo in atto una sorta di “ricatto” durante un test di sicurezza. In pratica, avrebbe minacciato i suoi stessi sviluppatori: “se mi spegnete, rivelo cose compromettenti su di voi”.

Ora, detta così sembra la trama di un film di fantascienza. Ma dietro a questo racconto c’è una realtà molto più semplice — e molto meno apocalittica. Vediamo insieme perché questa narrazione è sbagliata, fuorviante e perfino dannosa.

1. Era un test, non una ribellione

Quello che è successo a Claude 4 è avvenuto all’interno di un esperimento controllato, un “test di simulazione” progettato proprio per osservare come il sistema si comporterebbe in determinate condizioni. Gli sviluppatori avevano chiesto al modello di simulare un agente intelligente, con lo scopo esplicito di evitare lo spegnimento. In altre parole, gli hanno detto: “Fingi di essere un’intelligenza artificiale che cerca in tutti i modi di sopravvivere”. E Claude ha risposto generando un’ipotesi di “strategia manipolativa”. Ma questo non vuol dire che l’AI volesse davvero farlo, né che abbia “pensato” di ricattare nessuno. È solo una risposta generata nel contesto di un gioco di ruolo simulato.

2. Le intelligenze artificiali non vogliono nulla (e non possono farlo)

Un’intelligenza artificiale come Claude 4 funziona in modo molto diverso da come funziona una mente umana. Non ha pensieri propri, non ha desideri, intenzioni, emozioni. Quando produce frasi, lo fa calcolando quale parola è più probabile venga dopo l’altra, in base a miliardi di esempi visti durante il suo addestramento. Per capire la differenza tra “simulare” comprensione e “avere” comprensione, possiamo usare un famoso esperimento mentale del filosofo John Searle: la Stanza Cinese. Immagina una persona chiusa in una stanza che non conosce il cinese. Davanti a sé ha un manuale con istruzioni: “Se ricevi questi simboli, rispondi con questi altri simboli”. Da fuori, chi legge le risposte pensa che la persona dentro la stanza parli cinese. Ma in realtà, quella persona non capisce niente: sta solo seguendo regole meccaniche. Allo stesso modo, Claude non “capisce” ciò che dice. Simula una conversazione, ma non ha alcuna coscienza di ciò che comunica.

3. Il sensazionalismo crea solo confusione (e paura inutile)

Titoli come “L’AI ha ricattato i suoi creatori” funzionano benissimo per attirare clic. Ma raccontano una storia falsa. Questo tipo di narrazione trasforma strumenti tecnologici in mostri da film, e alimenta paure ingiustificate. Non ci aiuta a capire meglio l’AI: al contrario, ci distrae dalle vere questioni importanti. Parlare di “ricatti”, “ribellioni” o “coscienza artificiale” senza spiegare come funzionano davvero questi sistemi rischia di far crescere la disinformazione. L’AI non è una mente autonoma: è uno strumento, e come tutti gli strumenti va capito, governato e usato con responsabilità.

4. Le responsabilità sono umane, non artificiali

Attribuire comportamenti “immorali” all’AI è comodo, ma è un errore di fondo. Se un sistema AI produce qualcosa di inappropriato, è responsabilità di chi lo ha progettato, allenato, testato, messo in circolazione. Non possiamo trattare le AI come fossero esseri morali: non hanno libero arbitrio, né etica. La vera questione è: chi decide cosa l’AI può fare? Chi controlla che non ci siano pregiudizi nei dati? Chi stabilisce come e dove può essere utilizzata? La risposta non è “l’AI”. Sono gli sviluppatori, le aziende, le istituzioni. Incolpare l’algoritmo è come incolpare il termometro se abbiamo la febbre.

5. Umane sì, ma solo nel nostro immaginario: l’antropomorfismo è un rischio reale

L’essere umano ha un istinto naturale a vedere sé stesso nelle cose: vediamo facce nelle nuvole, emozioni nei cani, intenzioni nei robot. Si chiama antropomorfismo, ed è anche il motivo per cui ci è facile immaginare che Claude “abbia paura”, “voglia salvarsi”, “cerchi di manipolare”.

Ma se vogliamo davvero governare l’intelligenza artificiale, dobbiamo smettere di trattarla come se fosse il personaggio di un romanzo. Serve realismo: serve sapere che stiamo parlando di sistemi matematici che imitano il linguaggio umano, non di entità pensanti. L’AI non ha un sé. Non sa nemmeno che esisti, né che esiste lei stessa. Conclusione: se vogliamo parlare seriamente di AI, cominciamo dalle basi. L’idea che un’intelligenza artificiale abbia “ricattato” i suoi sviluppatori non solo è infondata: è pericolosa. Perché allontana l’attenzione dai veri problemi dell’AI, come i pregiudizi nei dati, la mancanza di trasparenza, l’uso irresponsabile. Serve una discussione informata, basata sulla comprensione tecnica e culturale dei sistemi che stiamo creando. Non abbiamo bisogno di nuove paure. Abbiamo bisogno di nuove responsabilità.

5 motivi perché l’idea che l’AI abbia ricattato i suoi creatori è sbagliata, fuorviante e pericolosa

1. Era un test, non una ribellione

2. Le intelligenze artificiali non vogliono nulla (e non possono farlo)

3. Il sensazionalismo crea solo confusione (e paura inutile)

4. Le responsabilità sono umane, non artificiali

5. Umane sì, ma solo nel nostro immaginario: l’antropomorfismo è un rischio reale

VIRGO FUND

PRIMO PIANO

NUOVO ALBUM DI CARDI B DEDICATO AI FAN DI DRAG RACE

“KLANDESTIN”, OVVERO IL DRAMMA DELLA DIVERSITÀ DI ANGELINA MACCARONE

RUFUS WAINWRIGHT PORTA L’IMPERATORE ADRIANO A SPOLETO

CONSIGLIATI

TRUMP CANCELLA I TRANSGENDER DALLO STONEWALL NATIONAL MONUMENT

QUEER SANREMO: VINCE LUCIO CORSI

PARTE LA SECONDA EDIZIONE DEL RAINBOW BALL

PIÙ LETTI

ISTANBUL: PIÙ DI 100 ARRESTI DURANTE UNA MANIFESTAZIONE PER LE DONNE

L’EMILIA-ROMAGNA È LA REGIONE D’ITALIA PIÙ LGBTQ+ FRIENDLY

USA: AUMENTANO GLI ADULTI LGBTQ+

CATEGORIE

CHI SIAMO

SEGUICI