robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

jackie kennedy e gianni agnelli a ravello nel 1962

JOHN KENNEDY E’ STATO IL PIÙ INFEDELE PUTTANIERE DEL XX SECOLO MA SUA MOGLIE JACQUELINE S’ATTACCAVA COME UN’IDROVORA A OGNI AUGELLO A PORTATA DI MANO (DAI DUE COGNATI ROBERT E TED PASSANDO PER SINATRA, BEATTY, MARLON BRANDO E VIA CHIAVANDO) - L’8 AGOSTO 1962, TRE GIORNI DOPO LA MORTE DI MARYLIN MONROE, JACKIE (INCAZZATA PER LE INDISCREZIONI SULLA LIAISON TRA IL MARITO E L’ATTRICE) RAGGIUNSE RAVELLO, SULLA COSTIERA AMALFITANA: FU ACCOLTA COME UNA REGINA DALL’ALLUPATISSIMO GIANNI AGNELLI – PER JACKIE, RAVELLO FECE RIMA CON PISELLO E LA VACANZA DIVENNE UN’ALCOVA ROVENTE (“LA VACANZA PIÙ BELLA DELLA SUA VITA”, RIPETEVA) AL PUNTO DA TRATTENERSI PIU’ DEL PREVISTO FINCHÉ NON PIOMBARONO 007 AMERICANI A PRELEVARLA COME UN ALMASRI QUALUNQUE PER RIPORTARLA A WASHINGTON DAL MARITO CORNUTO E INCAZZATO - LA VORACE JACKIE IMPARÒ A FARE BENE I POMPINI GRAZIE ALL'ATTORE WILLIAM HOLDEN: “ALL'INIZIO ERA RILUTTANTE, MA UNA VOLTA PRESO IL RITMO, NON SI FERMAVA PIÙ” –PER RIPICCA CI FU ANCHE UNA LIASON MARELLA AGNELLI-JOHN KENNEDY (CONFIDENZA DI INFORMATISSIMA SOCIALITE) - VIDEO

edmondo cirielli maria rosaria campitiello paolo di maio

“INUTILE FRUSTARE UN CIUCCIO MORTO, CAMBIA SPACCIATORE” – A PARLARE NON È UN HATER ANONIMO MA UN VICEMINISTRO DELLA REPUBBLICA: EDMONDO CIRIELLI, ESPONENTE DI SPICCO DI FRATELLI D'ITALIA E NUMERO DUE DI TAJANI AGLI ESTERI, CHE SBROCCA SU FACEBOOK E INSULTA IL SINDACO DI NOCERA INFERIORE, PAOLO DI MAIO – A FAR ANDARE FUORI GIRI CIRIELLI È STATO UN POST DEL PRIMO CITTADINO SU ALCUNI INCARICHI DELLA COMPAGNA AL MINISTERO DELLA SALUTE, MARIA ROSARIA CAMPITIELLO – LA VIOLENTISSIMA REPRIMENDA DI CIRIELLI: “NELLA VITA PRIVATA NON HAI MAI FATTO NIENTE DI BUONO" - COME MAI CIRIELLI SE L’È PRESA COSÌ TANTO? FORSE SENTE LA SUA CANDIDATURA A GOVERNATORE DELLA CAMPANIA CHE SI ALLONTANA? O TEME UNA SCONFITTA BRUCIANTE, ASSAI PROBABILE SE IL CENTROSINISTRA RITROVA L’UNITÀ?

igor taruffi elly schlein

DAGOREPORT - QUALCUNO DICA A ELLY SCHLEIN CHE STA AFFONDANDO IL PD! - NON SOLO TOSCANA E UMBRIA, DALLA CAMPANIA ALLA SICILIA FINO ALLA PUGLIA, SI MOLTIPLICANO I PROBLEMI SUI “TERRITORI” - A FINIRE NEL MIRINO LO “SPICCIAFACCENDE” DI ELLY, IGOR TARUFFI, RESPONSABILE ORGANIZZAZIONE DEL NAZARENO. DOVE C’È LUI, C’È CASINO, VISTA LA SUA PROPENSIONE A SALVAGUARDARE I CACICCHI FEDELI ALLA MIGLIORE ALLEATA DEL GOVERNO MELONI - IN SUO SOCCORSO È ARRIVATO ANCHE IL BERSANIANO NICO STUMPO CHE NON RIESCE AD EVITARE I PASTICCI CHE "LO STRATEGA IN VERSIONE PIZZICAGNOLO" TARUFFI COMBINA A CAUSA DELLA SCARSA CONOSCENZA DELLE REGOLE E DELLE DIVERSE REALTA’ LOCALI. E PER LA PRIMA VOLTA…

giorgia meloni ursula von der leyen donald trump dazi matteo salvini

DAGOREPORT – LA LETTERINA DELL’AL CAFONE DELLA CASA BIANCA È UNA PISTOLA PUNTATA ALLA TEMPIA DEI LEADER EUROPEI, CUI È RIMASTA UNA SOLA VIA DI USCITA, QUELLA COSIDDETTA “OMEOPATICA”: RISPONDERE AL MALE CON IL MALE. LINEA DURA, DURISSIMA, ALTRIMENTI, ALLE LEGNATE DI TRUMP, DOMANI, ALL’APERTURA DELLE BORSE, SI AGGIUNGERANNO I CALCI IN CULO DEI MERCATI. LA CINA HA DIMOSTRATO CHE, QUANDO RISPONDI CON LA FORZA, TRUMP FA MARCIA INDIETRO - SE LA “GIORGIA DEI DUE MONDI” ORMAI È RIMASTA L’UNICA A IMPLORARE, SCODINZOLANTE, “IL DIALOGO” COL DAZISTA IN CHIEF, NEMMENO LE CIFRE CATASTROFICHE SULLE RIPERCUSSIONI DELLE TARIFFE USA SULLE  AZIENDE ITALIANE, TANTO CARE ALLA LEGA, HA FERMATO I DEMENZIALI APPLAUSI ALLA LETTERA-RAPINA DA PARTE DI MATTEO SALVINI – ASCOLTATE JOSEPH STIGLITZ, PREMIO NOBEL PER L’ECONOMIA: “TRUMP NON AGISCE SECONDO ALCUN PRINCIPIO ECONOMICO, NON CONOSCE LO STATO DI DIRITTO, È SEMPLICEMENTE UN BULLO CHE USA IL POTERE ECONOMICO COME UNICA LEVA. SE POTESSE, USEREBBE QUELLO MILITARE’’

steve witkoff marco rubio sergei lavrov

RUBIO, IL TAJANI STARS AND STRIPES – IL SEGRETARIO DI STATO AMERICANO NON TOCCA PALLA E SOFFRE IL POTERE DI STEVE WITKOFF, INVIATO DI TRUMP IN MEDIO ORIENTE CHE SE LA COMANDA ANCHE IN UCRAINA. IL MINISTRO DEGLI ESTERI USA PROVA A USCIRE DALL’ANGOLO PARLANDO DI “NUOVA IDEA” DELLA RUSSIA SUI NEGOZIATI IN UCRAINA. MA IL MINISTRO DEGLI ESTERI DI PUTIN, LAVROV, SUBITO VEDE IL BLUFF: “CONFERMIAMO LA NOSTRA POSIZIONE” – TRUMP AVEVA OFFERTO DI TUTTO A WITKOFF, MA L’IMMOBILIARISTA NON HA VOLUTO RUOLI UFFICIALI NELL’AMMINISTRAZIONE. E TE CREDO: HA UN CONFLITTO DI INTERESSE GRANDE QUANTO UN GRATTACIELO...