robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

rocco basilico - nicoletta zampillo - leonardo maria del vecchio

DAGOREPORT - FERMI TUTTI! COLPO DI SCENA NELLA TRIBOLATISSIMA “SUCCESSION” DEGLI EREDI DEL VECCHIO – DAGOSPIA PUÒ RIVELARE CHE NICOLETTA ZAMPILLO, VEDOVA DEL VECCHIO, CON UNA LETTERA AL BOARD DI DELFIN, HA DECISO DI DISCONOSCERE LA CESSIONE DEL 12,5% DELLE QUOTE DELLA HOLDING AL FIGLIO ROCCO BASILICO, AVUTO DAL MATRIMONIO COL BANCHIERE PAOLO BASILICO, APPOGGIANDO L’ALTRO FIGLIO LEONARDO, AVUTO DALLE SUCCESSIVE NOZZE COL PATRIARCA DI LUXOTTICA: “L’ATTO È STATO DA ME STIPULATO A SOLI TRE GIORNI DALLA MORTE DEL MIO COMPIANTO MARITO, ERA UN MOMENTO NEL QUALE, ANCORA DEVASTATA DAL DOLORE, NON ERO IN GRADO DI VALUTARE LA PORTATA E LE CONSEGUENZE” – LA MOSSA DELLA ZAMPILLO ARRIVA DOPO CHE ROCCO BASILICO HA FATTO RICORSO ALLA CORTE DEL LUSSEMBURGO PER BLOCCARE L’OPERAZIONE CON CUI LEONARDINO HA OTTENUTO L’OK PER PRENDERSI IL 25% DELLE QUOTE DI DELFIN DAI FRATELLI LUCA E PAOLA – NELLA LETTERA LA ZAMPILLO AGGIUNGE: “CON L’AUSILIO DEI MIEI CONSULENTI HO APPRESO CHE LA VALIDITÀ GIURIDICA DI QUELL’ATTO È FORTEMENTE DUBBIA…”

giuseppe del deo andrea pignataro spionaggio dossier

DAGOREPORT - IL MISTERO PIGNATARO S’INGROSSA - LO ZAR DEL GRUPPO ION, COLOSSO GLOBALE NEL SETTORE DEI SOFTWARE, DEI DATI FINANZIARI E DEL FINTECH, HA DATO L’ENNESIMA PROVA DI MANTENERE FEDE ALLA SUA OSSESSIONE PER LA RISERVATEZZA - RULLO DI TAMBURI, FIATO ALLE TROMBE: IL 30 APRILE SCORSO “IL MILIARDARIO OSCURO” HA LIQUIDATO L’EX SPIONE DI STATO, GIUSEPPE DEL DEO, DALLA CARICA DI PRESIDENTE ESECUTIVO DI CERVED SPA, CON UNA LETTERINA INVIATA AI “CLIENTI” (CHE PUBBLICHIAMO) - CERTO, LA SOCIETÀ NON È QUOTATA IN BORSA, COME DEL RESTO TUTTE LE AZIENDE DELL’INTRICATISSIMA RETE GLOBALE DI PIGNATARO, E QUINDI NON HA NESSUN OBBLIGO DI ‘’TRASPARENZA’’ - MA LE POLEMICHE POLITICHE E MEDIATICHE SEGUITE ALLO SBARCO DI DEL DEO ALLA CERVED, IL CUI CORE-BUSINESS È LA RACCOLTA, ELABORAZIONE E DISTRIBUZIONE DI INFORMAZIONI ECONOMICO-FINANZIARIE, UTILIZZATE DA BANCHE, AZIENDE E ISTITUZIONI, BEH, RIENTRAVA PER LO MENO NELLA SFERA DELL’OPPORTUNITÀ DARNE COMUNICAZIONE…

francesco gaetano caltagirone giorgia meloni fabrizio palermo elly schlein roma roberto gualtieri

DAGOREPORT – CALTA QUI, CALTA LÀ! -  DALLE PARTI DI VIA DELLA SCROFA E DI PALAZZO CHIGI CAPITA DI CHIEDERSI: “AHÒ, MA CON 'STO CALTAGIRONE CHE CI ABBIAMO GUADAGNATO? BANCHE? ZERO! ASSICURAZIONI GENERALI? ZERO! CONSENSI? LASCIAMO PERDERE: A PARTE LE PRIME TRE PAGINE DE “IL MESSAGGERO”, TUTTO IL RESTO DEL GIORNALE SUONA LA GRANCASSA PER IL SINDACO DI ROMA, IL PIDDINO ROBERTO GUALTIERI, CHE LASCIA CHE SIA CALTARICCONE, CON IL 5,45% DELLE AZIONI, AD ESPRIMERE LA GUIDA DELLA MUNICIPALIZZATA ACEA (L'AD FABRIZIO PALERMO) - UN FATTO CHE FA ARRICCIARE ANCHE IL NASO AD APRISCATOLE ANCHE DI ELLY SCHLEIN, CUI FA SEGUITO LO SCAZZO ALL'INTERNO DEL PD SULLA REALIZZAZIONE DELL'INCENERITORE ANTI-MONNEZZA DELL'ACEA - I “CONSIGLI” DI GUALTIERI A PALERMO DI USCIRE DAL CDA DI MPS (FATTO) E DA QUELLO DI ASSICURAZIONI GENERALI (LETTERA MORTA) - APPUNTAMENTO ALL'ASSEMBLEA DI ACEA DEL 3 GIUGNO...

andrea martella simone venturini venezia sondaggi

DAGOREPORT - LE PREVISIONI FLOP SU VENEZIA SCOPERCHIANO, PER L'ENNESIMA VOLTA, LA FALLA DEL SISTEMA SONDAGGI – I PICCOLI ISTITUTI CHE HANNO EFFETTUATO RILEVAZIONI LOCALI (I GRANDI COSTANO TROPPO PER ELEZIONI COMUNALI), DAVANO PER VITTORIOSO IL DEMOCRATICO ANDREA MARTELLA, CHE INVECE È STATO SCONFITTO AL PRIMO TURNO DAL DESTRORSO SIMONE VENTURINI – COLPA DEL CAMPIONE TROPPO PICCOLO DI INTERVISTATI, UNITO ALL’ALTA VOLATILITÀ DEL VOTO D'OPINIONE E ALLA GRANDE PERCENTUALE DI INDECISI - PESA MOLTO LA DISTANZA ORMAI SIDERALE TRA POLITICA E TERRITORIO (PRIMA I PARTITI AVEVANO IL “POLSO” DELLA COMUNITÀ GRAZIE ALLE SEZIONI LOCALI E ALLE FESTE A SUON DI SBRACIATE, ORA AL MASSIMO SI ACCONTENTANO DEI LIKE E DI QUALCHE COMMENTO SU INSTAGRAM)

venezia elezioni sindaco simone venturini andrea martella elly schlein

DAGOREPORT - LA TRAGEDIA VENEZIANA È L’ENNESIMA CONFERMA DELL'INADEGUATEZZA (PIETOSO EUFEMISMO) DI ELLY SCHLEIN A GOVERNARE LA POLITICA – LA MINCHIATA, LA PIU' MADORNALE, E' STATA LA SCELTA DEL CANDIDATO ANDREA MARTELLA: A VENEZIA SI DIVIDONO TRA CHI NON LO CONOSCE E CHI NON L’HA MAI VISTO; IN QUANTO SENATORE, STA INFATTI PIÙ A ROMA CHE A MESTRE E DINTORNI – AL RESIDUATO BELLICO DEGLI APPARATI DEL NAZARENO, IL CENTRODESTRA HA OPPOSTO SIMONE VENTURINI: UN ASSESSORE, BRACCIO DESTRO DI BRUGNARO, CHE I VENEZIANI DEI CETI MEDI E BASSI, COSÌ COME LA PARTE PRODUTTIVA, CONOSCONO, E BENE - I CASI VENEZI E BIENNALE NON HANNO SPOSTATO VOTI: SE LA “BACCHETTA NERA” FA GIRARE LE GONDOLE AI 50MILA ABITANTI DI VENEZIA, I RESTANTI 150MILA ELETTORI SONO TRA MARGHERA, MESTRE E FAVERO, NON PROPRIO GENTE CHE VA ALLA FENICE - MENTRE DELLA RUSSIFICAZIONE DEL PADIGLIONE DELLA BIENNALE DA PARTE DI BUTTAFUOCO, AL DI LÀ DELLE ÈLITES, GLI ELETTORI SE NE FOTTONO, AVENDO PROBABILMENTE ALTRI PROBLEMI DA FAR QUADRARE NELLA LORO VITA QUOTIDIANA...