robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

salvini vannacci zaia fedriga fontana

DAGOREPORT – CHE FINE FARA' MATTEO SALVINI? QUANTE CHANCE HA IL SEGRETARIO DELLA LEGA DI SOPRAVVIVERE AL TRADIMENTO DEL FASCIO-GENERALISSIMO VANNACCI? - TUTTI ASPETTANO L’OFFENSIVA DI ATTILIO FONTANA, MASSIMILIANO FEDRIGA E LUCA ZAIA (MA IL REGISTA È MASSIMILIANO ROMEO, POTENTE SEGRETARIO DELLA LEGA LOMBARDA) - LA DECISIONE SULLO SFANCULAMENTO DEL CAPITONE RUOTA, COME IN FORZA ITALIA PER IL CASO TAJANI-BARELLI-GASPARRI, SULL'ESITO DEL REFERENDUM SULLA GIUSTIZIA DEL 23 MARZO, CHE SI È TRASFORMATO, COM'ERA INEVITABILE, IN UN VOTO POLITICO SULL'ARMATA BRANCA-MELONI - SE DALLE URNE USCISSE LA VITTORIA DEL "SÌ", SALVINI RESTERÀ AL SUO POSTO E AL TRIO FEDRIGA-FONTANA-ZAIA NON RESTERÀ ALTRO CHE PROVARE A FAR RINSAVIRE L’EX “TRUCE DEL PAPEETE” E RIPOSIZIONARE IL PARTITO SUI BINARI DEL PRAGMATISMO NORDISTA. BASTA CON LA LEGA NAZIONALE: CHISSENEFREGA DEL PONTE SULLO STRETTO, PIÙ FEDERALISMO E PADANIA. VICEVERSA, PER MATTEO SALVINI SCOCCHEREBBE L'ORA FATALE DEL DE PROFUNDIS...

giorgia meloni giustizia referendum magistrati

DAGOREPORT -  ARIANNA MELONI E I CAPOCCIONI DI FRATELLI D’ITALIA POSSONO RIPETERE A PAPPAGALLO CHE IL REFERENDUM SULLA RIFORMA DELLA GIUSTIZIA "NON È UN VOTO SU GIORGIA", MA MENTONO SAPENDO DI MENTIRE. IL VOTO DEL 23 MARZO SARÀ INEVITABILMENTE UN PLEBISCITO POLITICO SULLA STATISTA DELLA SGARBATELLA - CON LA CRESCENTE RIMONTA DEL "NO", NON BASTA PIU' ATTACCARE I MAGISTRATI (DAGLI SCONTRI DI TORINO AL FATTACCIO DI ROGOREDO), ORA LA MELONI SA CHE NON POTRA' FARE A MENO DI METTERCI LA FACCIA - UNA PERSONALIZZAZIONE CHE FINO A IERI HA TENTATO IN OGNI MODO DI EVITARE RICORDANDOSI CHE FU UNA SCONFITTA REFERENDARIA A TRASCINARE IL GOVERNO DI MATTEONZO RENZI DALL’ALTARE ALLA POLVERE) - MA ORA LA RIMONTA DEL"NO" METTE PAURA E NON PUO' PIU' NASCONDERSI ALZANDO I SOLITI POLVERONI DI PROPAGANDA: SOLO LEI HA LA LEADERSHIP PER TRASCINARE LA GALASSIA DEGLI ASTENUTI A VOTARE ''SI'" (SONDAGGI RISERVATI VALUTANO IL BRAND GIORGIA MELONI 2/3 DEI CONSENSI DI FDI) - MA TUTTI PARTITI SONO APPESI ALL'ESITO DEL REFERENDUM: DALLA RESA DEI CONTI DELLA LEGA CON SALVINI ALLA SFIDA IN FORZA ITALIA TRA TAJANI E I FIGLI DI BERLUSCONI - UNA VITTORIA DEL "NO" POTREBBE INVECE RINGALLUZZIRE UN’OPPOSIZIONE DILANIATA DALL'EGOLATRIA DI ELLY SCHLEIN E GIUSEPPE CONTE, UN DUELLO DI POTERE CHE HA SEMPRE IMPEDITO DI PROPORRE ALL'ELETTORATO UNA VERA ALTERNATIVA AL MELONISMO...

francesco lollobrigida vino

DAGOREPORT - UNO DEI MISTERI PIÙ INDECIFRABILI DELLE CRONACHE POLITICHE DEGLI ULTIMI GIORNI HA UN NOME, UN COGNOME E UN "RAFFORZINO" IN TESTA: FRANCESCO LOLLOBRIGIDA. L’EX COGNATO D’ITALIA, È TORNATO IN PISTA AL TAVOLO DELLE NOMINE, E MOLTI OSSERVATORI POLITICI SONO RIMASTI SGOMENTI. È PROPRIO “LOLLO”, CHE ERA STATO RELEGATO A MACCHIETTA DI SE STESSO DALLE SORELLE MELONI? QUELLO DELLA “SOSTITUZIONE ETNICA”, DI “GESÙ CHE MOLTIPLICA IL VINO” E CHE FA FERMARE IL FRECCIAROSSA A CIAMPINO? GAFFE A PARTE, LO “STALLONE DI SUBIACO” HA UNA COSA CHE ARIANNA, DONZELLI E RAMPELLI SI SOGNANO: I VOTI – I RAPPORTI CON LA COLDIRETTI E GLI ANNI DI “GAVETTA” TRA VIA DELLA SCROFA E MONTECITORIO

steve bannon giuseppe conte matteo salvini davide casaleggio, gennaro vecchione jeffrey epstein - pietro dettori

DAGOREPORT - FANNO BENISSIMO QUEI SINISTRELLI DI BONELLI E FRATOIANNI A CHIEDERE CONTO A SALVINI DEI SUOI RAPPORTI CON STEVE BANNON. MA PERCHÉ NON FANNO LA STESSA DOMANDA AL LORO ALLEATO, GIUSEPPE CONTE? NEL 2018, IN PIENA EUFORIA GIALLO-VERDE, BANNON CALÒ SU ROMA PER INCONTRARE DAVIDE CASALEGGIO, A CUI SEMBRA ABBIA PROVATO A VENDERE UN SOFTWARE DI PROFILAZIONE – ERANO GLI ANNI FOLLI IN CUI TRUMP CHIAMAVA CONTE “GIUSEPPI”, E A ROMA ARRIVAVA IL MINISTRO DELLA GIUSTIZIA AMERICANO, PER INCONTRARE IL CAPO DEI SERVIZI, GENNARO VECCHIONE – I LEGAMI CON LA LINK UNIVERSITY, IL RUOLO DI PIETRO DETTORI, EX GURU DELLA COMUNICAZIONE GRILLINA ORA RICICLATOSI MELONIANO - TUTTI I MISTERI E LE INQUIETANTI COINCIDENZE CHE NEL 2018 PORTARONO IL SOVRANISMO DELLA LEGA E IL POPULISMO M5S A PALAZZO CHIGI, GOVERNO CONTE-SALVINI...

andrea pucci bocelli giorgia meloni carlo conti sanremo laura pausini

DAGOREPORT – BENVENUTI AL FESTIVAL DI ATREJU! “CI SIAMO PRESI FINALMENTE SANREMO”, GHIGNANO SODDISFATTI I CAPOCCIONI MELONIANI IN RAI: DOPO TRE ANNI E MEZZO DI OCCUPAZIONE FAMELICA DI POSTI DI POTERE, MANCAVA SOLO ESPUGNARE DEL TUTTO QUEL BARACCONE CANTERINO DIVENTATO UN DISTURBO MENTALE DI MASSA – IL CASO PUCCI? L’ENNESIMA ARMA DI DISTRAZIONE DI MASSA: IL COMICO “MARTIRE” SERVE PER COPRIRE LE DERILANTI DISAVVENTURE DEL FRATELLINO D’ITALIA, PATACCA PETRECCA - FINITO L’EFFETTO AMADEUS, CONTI SI RITROVA A SCODELLARE SUL PALCO DELL’ARISTON UN CAST DEBOLE, PIENO ZEPPO DI RELITTI E DI SCONOSCIUTI. BASTERÀ A RISOLLEVARE LO SHARE, MESSO A RISCHIO DA GERRY SCOTTI E DALLE PARTITE DI CHAMPIONS? – AI POVERI TELE-MORENTI SARÀ RIFILATO (DI NUOVO) ANCHE IL “VINCERÒ” DI BOCELLI…

john elkann theodore kyriakou repubblica

DAGOREPORT - COME MAI LA TRATTATIVA TRA JOHN ELKANN E IL MAGNATE GRECO THEO KYRIAKOU PER LA VENDITA DEL GRUPPO GEDI, SI È ARENATA? IL MOTIVO DELL’IMPASSE, CHE HA SPINTO I GIORNALISTI DI “REPUBBLICA” A DUE GIORNI DI SCIOPERO, GIRA PROSAICAMENTE INTORNO AL VALORE DELL'OPERAZIONE, STIMATA INTORNO A 140 MILIONI DI EURO - DOPO OLTRE 6 MESI IN CUI UN PLOTONE DI AVVOCATI E CONTABILI HA ROVESCIATO COME UN CALZINO CONTI, CONTRATTI E PENDENZE LEGALI DEL GRUPPO, IL GRECO ANTENNATO AVREBBE FATTO UN'OFFERTA DI 90 MILIONI - UNA “MISERIA” CHE SAREBBE STATA RIFIUTATA DA ELKANN CHE HA AVREBBE STIMATO SOLO IL POLO RADIOFONICO TRA GLI 86 E I 100 MILIONI, CON RADIO DEEJAY DA SOLA VALUTATA OLTRE I 40 MILIONI - RIUSCIRANNO ELKANN E KYRIAKOU A NEGOZIARE UN ACCORDO? AH, SAPERLO…