intelligenza artificiale errori errore

LA POTENZA È NULLA SENZA IL CONTROLLO: LE INTELLIGENZE ARTIFICIALI ANALIZZANO SEMPRE PIÙ DATI MA FANNO ANCHE PIÙ ERRORI – I BOT SI BASANO SU SISTEMI MATEMATICI COMPLESSI CHE PERÒ NON POSSONO DETERMINARE COSA SIA VERO E COSA SIA FALSO. A VOLTE INVENTANO LE COSE: UN FENOMENO CHE I RICERCATORI CHIAMANO “ALLUCINAZIONI” E CHE INVECE CHE DIMINUIRE STA AUMENTANDO. NEI TEST DELLE AI PIÙ RECENTI HA RAGGIUNTO IL 79%...

Traduzione di un estratto dell'articolo di Cade Metz e Karen Weise per il “New York Times”

 

intelligenza artificiale nel lavoro

Il mese scorso, un bot dotato di intelligenza artificiale utilizzato per l’assistenza tecnica di Cursor — un promettente strumento per programmatori — ha avvisato diversi clienti di un presunto cambiamento nella politica aziendale: da quel momento, secondo il bot, sarebbe stato vietato usare Cursor su più di un computer.

 

In numerosi post indignati pubblicati sui forum online, i clienti si sono lamentati. Alcuni hanno cancellato i propri account Cursor. E la rabbia è aumentata quando si sono accorti della verità: il cambiamento di politica non esisteva.

 

«Non abbiamo alcuna politica del genere. Naturalmente siete liberi di usare Cursor su più dispositivi», ha scritto su Reddit il CEO e cofondatore dell’azienda, Michael Truell. «Purtroppo si è trattato di una risposta errata da parte di un bot AI per il supporto di primo livello.»

 

chatgpt - giornalismo

A più di due anni dall’arrivo di ChatGPT, aziende tecnologiche, impiegati e semplici consumatori stanno utilizzando bot dotati di intelligenza artificiale per un numero sempre maggiore di compiti. Tuttavia, non esiste ancora un modo per garantire che questi sistemi producano informazioni accurate.

 

Le tecnologie più recenti e avanzate — i cosiddetti sistemi di ragionamento sviluppati da aziende come OpenAI, Google e la start-up cinese DeepSeek — stanno generando più errori, non meno. Sebbene le loro capacità matematiche siano notevolmente migliorate, la loro padronanza dei fatti è diventata più instabile. Il motivo non è ancora del tutto chiaro.

 

cento uomini contro un gorilla immagine generata dall intelligenza artificiale

I bot AI odierni si basano su sistemi matematici complessi che apprendono le proprie competenze analizzando enormi quantità di dati digitali. Non sono in grado — e non possono esserlo — di determinare cosa sia vero e cosa sia falso. A volte, semplicemente, si inventano le cose: un fenomeno che alcuni ricercatori nel campo dell’intelligenza artificiale chiamano «allucinazioni». In un test, i tassi di allucinazione dei sistemi AI più recenti hanno raggiunto il 79%.

 

Questi sistemi utilizzano probabilità matematiche per indovinare la risposta più probabile, non seguono un insieme rigoroso di regole definite da ingegneri umani. Di conseguenza, commettono inevitabilmente un certo numero di errori. «Nonostante tutti i nostri sforzi, continueranno sempre ad allucinare», ha dichiarato Amr Awadallah, CEO della start-up Vectara — che sviluppa strumenti AI per le aziende — ed ex dirigente di Google. «Questo non scomparirà mai.»

 

CHATGPT 3

Da diversi anni, questo fenomeno solleva preoccupazioni sulla affidabilità di tali sistemi. Sebbene siano utili in alcune situazioni — come scrivere tesine, riassumere documenti di lavoro e generare codice informatico — i loro errori possono causare problemi.

 

I bot dotati di intelligenza artificiale associati ai motori di ricerca come Google e Bing a volte producono risultati talmente errati da risultare ridicoli. Se gli si chiede una buona maratona sulla costa occidentale, potrebbero suggerire una gara a Philadelphia. Se devono fornire il numero di nuclei familiari in Illinois, potrebbero citare una fonte che non include affatto quell’informazione.

 

Tali allucinazioni potrebbero non rappresentare un problema per molti utenti, ma diventano una questione seria per chi utilizza queste tecnologie per documenti legali, informazioni mediche o dati aziendali sensibili.

 

intelligenza artificiale PSICOTERAPIA

«Si finisce per passare molto tempo a cercare di capire quali risposte siano effettivamente fondate e quali no», ha affermato Pratik Verma, cofondatore e CEO di Okahu, un’azienda che aiuta le imprese a gestire il problema delle allucinazioni. «Se non si affrontano correttamente questi errori, si annulla di fatto il valore dei sistemi di intelligenza artificiale, che dovrebbero servire proprio ad automatizzare le attività.»

 

[…]

 

Da oltre due anni, aziende come OpenAI e Google hanno costantemente migliorato i loro sistemi di intelligenza artificiale, riducendo la frequenza di questi errori. Tuttavia, con l’introduzione dei nuovi sistemi di ragionamento, gli errori stanno aumentando. Secondo i test condotti dalla stessa OpenAI, le versioni più recenti dei suoi sistemi producono allucinazioni con una frequenza maggiore rispetto al sistema precedente.

 

risposte senza senso date da chatgpt 5

La società ha rilevato che o3 — il suo sistema più potente — ha generato allucinazioni nel 33% dei casi durante il test benchmark PersonQA, che consiste nel rispondere a domande su personaggi pubblici. Si tratta di un tasso più che doppio rispetto a quello del sistema di ragionamento precedente, chiamato o1. Il nuovo sistema o4-mini ha mostrato un tasso di allucinazioni ancora più elevato: 48%.

 

In un altro test denominato SimpleQA, che prevede domande più generiche, i tassi di allucinazione di o3 e o4-mini sono saliti rispettivamente al 51% e al 79%. Il sistema precedente, o1, aveva un tasso del 44%.

 

In un documento che descrive questi test, OpenAI ha affermato che è necessaria ulteriore ricerca per comprendere le cause di questi risultati. Poiché i sistemi di intelligenza artificiale apprendono da una quantità di dati superiore a quella che un essere umano può comprendere, i tecnologi fanno fatica a spiegare perché tali sistemi si comportino in un certo modo.

 

CHATGPT - ROBOT PER RACCOGLIERE I POMODORI

[…] I test condotti da aziende indipendenti e da ricercatori indicano che i tassi di allucinazione stanno aumentando anche per i modelli di ragionamento sviluppati da società come Google e DeepSeek.

 

[…]

 

Nell’ultimo anno e mezzo, aziende come OpenAI e Google sono riuscite a ridurre tali percentuali all’1-2%. Altre, come la start-up Anthropic di San Francisco, si sono mantenute intorno al 4%. Tuttavia, i tassi di allucinazione in questo test sono tornati a salire con l’arrivo dei modelli di ragionamento. Il sistema R1 di DeepSeek ha allucinato nel 14,3% dei casi. Il modello o3 di OpenAI è salito al 6,8%.

 

[…]

 

intelligenza artificiale nel lavoro

Per anni, aziende come OpenAI si sono basate su un concetto semplice: più dati internet venivano forniti ai loro sistemi di IA, migliori sarebbero stati i risultati. Ma ormai hanno esaurito quasi tutti i testi in inglese disponibili online, e ciò le ha costrette a trovare nuovi modi per migliorare i loro chatbot.

 

Per questo, molte aziende stanno facendo sempre più affidamento su una tecnica nota come “apprendimento per rinforzo”. Con questo metodo, un sistema può apprendere comportamenti attraverso il metodo del tentativo e dell’errore. La tecnica funziona bene in alcuni ambiti, come la matematica e la programmazione informatica, ma si sta rivelando carente in altri.

 

risposte senza senso date da chatgpt 6

[…]

 

Un’altra questione è che i modelli di ragionamento sono progettati per “pensare” ai problemi complessi prima di fornire una risposta. Ma cercando di affrontare un problema passo dopo passo, rischiano di generare errori a ogni passaggio. Gli errori si sommano via via che il sistema “pensa” più a lungo.

 

I bot più recenti mostrano agli utenti ciascun passaggio del processo, il che significa che gli utenti possono anche vedere ogni singolo errore. I ricercatori hanno inoltre scoperto che, in molti casi, i passaggi visualizzati da un bot non hanno alcuna relazione con la risposta finale fornita.

 

«Ciò che il sistema dice di pensare non è necessariamente ciò che realmente pensa», ha affermato Aryo Pradipta Gema, ricercatore di intelligenza artificiale presso l’Università di Edimburgo e borsista presso Anthropic.

CHATGPT risposte senza senso date da chatgpt 4

Ultimi Dagoreport

cdp cassa depositi e prestiti giovanbattista fazzolari fabio barchiesi giorgia meloni giancarlo giorgetti dario scannapieco francesco soro

DAGOREPORT - QUALCOSA DEVE ESSERE SUCCESSO IN QUESTO DISGRAZIATO PAESE. CHE VIRUS HA COLPITO PALAZZO CHIGI PER PASSARE DA AMATO E LETTA A TALE GIOVAMBATTISTA FAZZOLARI, UN TIPINO CHE FINO AL 2018, RICOPRIVA IL RUOLO DI DIRIGENTE DI SECONDA FASCIA ALLA REGIONE LAZIO? - CHE È SUCCESSO A CASSA DEPOSITI E PRESTITI (CDP), HOLDING PUBBLICA CHE GESTISCE I 300 MILIARDI DI RISPARMIO POSTALE DEGLI ITALIANI, PER RITROVARCI VICEDIRETTORE GENERALE, CON AMPIE DELEGHE, DAL PERSONALE E GLI INVESTIMENTI ALLA COMUNICAZIONE, IL 43ENNE FABIO BARCHIESI, CHE ORA ASSUME ANCHE LA CARICA DI AD DI CDP EQUITY, LA PIÙ IMPORTANTE SOCIETÀ DEL GRUPPO? - COME SI FA A RICOPRIRE DI RUOLI NEVRALGICI DI POTERE L’EX FISIOTERAPISTA DI MALAGO' CHE NON HA MAI RICOPERTO IL RUOLO DI AMMINISTRATORE NEMMENO NEL SUO CONDOMINIO, CHE BALBETTA UN INGLESE APPENA SCOLASTICO E HA ALLE SPALLE UNA LAUREA IN ECONOMIA OTTENUTA, PRESSO LA SELETTIVA UNIVERSITÀ TELEMATICA UNICUSANO, A CUI SI AGGIUNGE UNA CATTEDRA, A CONTRATTO, ALLA LINK, L’ILLUSTRISSIMA UNIVERSITÀ DI VINCENZO SCOTTI? - ALL’ANNUNCIO DELLA NUOVA CARICA DI BARCHIESI, LO SCONCERTO (EUFEMISMO) È PIOMBATO NELLE STANZE DEL MEF, PRIMO AZIONISTA DI CDP, MENTRE PER LE FONDAZIONI BANCARIE L’ULTIMA PRESA DI POTERE DEL DUPLEX FAZZO-BARCHIESI, IN SOLDONI, E' “IL PIÙ GROSSO SCANDALO POLITICO-FINANZIARIO MAI VISTO NEL BELPAESE...”

flavio cattaneo ignazio la russa giorgia meloni carlo calenda matteo salvini

DAGOREPORT - IL CONTESTO IN CUI È ESPLOSO LO SCONTRO-CON-SCAZZO TRA CARLO CALENDA, E L’AD DI ENEL, FLAVIO CATTANEO, HA COLPITO GLI HABITUÉ DEI PALAZZI ROMANI - IL DURO SCAMBIO NON È AVVENUTO IN UN TALK DE LA7, BENSÌ A UN GALLONATISSIMO CONVEGNO DI COLDIRETTI, LA FILO-GOVERNATIVA ASSOCIAZIONE CHE RAGGRUPPA 1,6 MILIONI DI IMPRENDITORI AGRICOLI (LA PRIMA USCITA PUBBLICA DI MELONI PREMIER FU A UN CONVEGNO COLDIRETTI) - L’INVITO AL CALENDA FURIOSO, DA MESI SMANIOSO DI ROMPERE LE OSSA A CATTANEO, È STATO “LETTO” NEI PALAZZI ROMANI COME UN SEGNO DI “DISTACCO” TRA LA STATISTA DELLA SGARBATELLA E L’AD DI ENEL, IL CUI MANDATO SCADE LA PROSSIMA PRIMAVERA DEL 2026 – E QUANDO IN UN SUCCESSIVO TWEET CALENDA COINVOLGE I GRAN MENTORI DELL'INARRESTABILE CARRIERA DI CATTANEO, LA RUSSA E SALVINI, SI ENTRA IN QUEL LUNGO E SOTTERRANEO CONFLITTO DI POTERE CHE FECE SBOTTARE ‘GNAZIO: “GIORGIA VUOLE CONTROLLARE TUTTO: PALAZZO CHIGI, IL SUO PARTITO, QUELLI DEGLI ALTRI, MA È IMPOSSIBILE’’ -  ORA IL DESTINO CINICO E BARO VUOLE CHE SUL CAPOCCIONE DI CATTANEO, OLTRE ALLA MANGANELLATA DI CALENDA, SIA ARRIVATO UNO SGRADITO OSPITE, UN NON IDENTIFICATO SPYWARE CHE L’HA SPIATO NOTTE E DÌ... - VIDEO - LA VIGNETTA ANTI-CALENDA DI "OSHO": "A PROPOSITO DE UTILI, VOLEMO PARLA' DELL'UTILITÀ DI AZIONE?"

chiara appendino roberto fico giuseppe conte vincenzo de luca elly schlein

DAGOREPORT - GENTILE CHIARA APPENDINO, È CONSAPEVOLE CHE IN POLITICA, COME NELLA VITA, ‘’NON SI PUÒ AVERE LA SIRINGA PIENA E LA MOGLIE IN OVERDOSE”? MA E' DAVVERO CONVINTA CHE, CON UN M5S “PIÙ AUTONOMO DAL PD”, IL PARTITO DI CONTE SAREBBE RIUSCITO A SVENTOLARE LE CANDIDATURE DI TRIDICO IN CALABRIA E DI FICO IN CAMPANIA, DOVE NEL 2020 M5S HA PRESO IL 9,9% MENTRE DE LUCA INTASCÒ IL 69,4%? – OGGI LA VITTORIA DI FICO, FINO A IERI DATA PER SICURA, STA TROVANDO UNA STRADA ACCIDENTATA - A SALVARE LA BARACCA CI DOVRÀ PENSARE LO SCERIFFO DI SALERNO – COME ELLY, CHE DOPO AVERLO DISPREZZATO, E' SCESA A MITI CONSIGLI, ANCHE FICO DEVE ACCETTARE LE “PRIORITÀ” DI DE LUCA OPPURE VERRÀ ABBANDONATO AL SUO DESTINO DI PERDENTE, FACENDO FELICE IL CANDIDATO DI FRATELLI D’ITALIA, EDMONDO CIRIELLI...

elly schlein giuseppe conte roberto fico vincenzo de luca eugenio giani

DAGOREPORT - PARAFRASANDO NANNI MORETTI, CON LEADER DEL CALIBRO DI ELLY SCHLEIN E DI GIUSEPPE CONTE, ''IL CENTROSINISTRA NON VINCERA' MAI'' - IN TOSCANA, I DUE "GENI" HANNO TENTATO DI ESTROMETTERE IL “CACICCO” EUGENIO GIANI, REO DI SANO RIFORMISMO, CHE SI È DIMOSTRATO CAVALLO VINCENTE – IN CAMPANIA, INVECE, RISCHIANO DI ANDARE A SBATTERE CON IL CAVALLO SBAGLIATO, IL FICO DI GIUSEPPE CONTE, CHE TRABALLA NEI SONDAGGI: URGE UN FORTE IMPEGNO DI RACCOLTA VOTI DEL "CACICCO" TANTO DISPREZZATO DA ELLY: VINCENZO DE LUCA (CHE A SALERNO SE LA DEVE VEDERE CON IL CONCITTADINO E CANDIDATO DEL CENTRODESTRA, CIRIELLI) – CON L’INCONSISTENZA STORICA DEL M5S A LIVELLO LOCALE, IL “CAMPOLARGO” VA AL PIU' PRESTO ACCANTONATO: TROPPI "PRINCIPI" DIVERSI TRA PD E M5S PER UN'ALLEANZA, MEGLIO UNA COALIZIONE IN CUI OGNUNO CORRE COL SUO PROGRAMMA CERCANDO DI MASSIMIZZARE IL CONSENSO - SOLO DOPO IL VOTO, IN CASO DI VITTORIA, SI TROVA L'ACCORDO (E COME DIMOSTRA LA COALIZiONE DEL GOVERNO MELONI, LA GESTIONE DEL POTERE È IL MIGLIOR PROGRAMMA...) - VIDEO

giorgia meloni guido crosetto

IL "FRATELLASTRO" CROSETTO FA BALLARE GLI OTOLITI DI GIORGIA MELONI: “SE GLI STATI EUROPEI NON RINUNCIANO ALLA LORO SOVRANITÀ IN ALCUNI SETTORI, SONO MORTI. SULLA DIFESA DOBBIAMO METTERE ASSIEME I 27 PAESI UE IN UN SOLO PROGETTO COMUNE” – LA POSIZIONE DEL MINISTRO DELLA DIFESA È ALL’OPPOSTO DI QUELLA SOVRANISTA DELLA DUCETTA, CHE PIÙ VOLTE IN PASSATO HA REMATO CONTRO IL PROGETTO DI UN ESERCITO UNICO EUROPEO: “SAREBBE UNA INUTILE DUPLICAZIONE. IL SISTEMA DI DIFESA OCCIDENTALE È BASATO SULLA NATO, E NELLA NATO CI SONO ESERCITI NAZIONALI CHE COOPERANO TRA DI LORO. IO VOGLIO PIUTTOSTO UNA COLONNA EUROPEA DELLA NATO” – CHISSA' CHI ALLA FINE DIRA' L'ULTIMA PAROLA... - VIDEO

mauro gambetti papa leone mazza baseball san pietro pipi sagrato

DAGOREPORT: IL PISCIO NON VA LISCIO – PAPA LEONE XIV E’ FURIOSO DOPO IL SACRILEGIO COMPIUTO DALL’UOMO CHE HA FATTO PIPI’ SULL’ALTARE DELLA BASILICA DI SAN PIETRO – IL PONTEFICE HA ORDINATO UN RITO RIPARATORIO “URGENTE” E, SOPRATTUTTO, HA FATTO IL CULO AL CARDINALE GAMBETTI, ARCIPRETE DELLA BASILICA VATICANA, CON UN CONFRONTO “TEMPESTOSO”: E’ IL TERZO GRAVE EPISODIO IN POCO PIU’ DI DUE ANNI AVVENUTO NELLA CHIESA PIU’ IMPORTANTE DEL MONDO – NEL MIRINO FINISCONO ANCHE GLI UOMINI DELLA GENDARMERIA VATICANA, INCAPACI DI INTERVENIRE TEMPESTIVAMENTE E DI PREVENIRE GESTI SACRILEGHI DELLO SVALVOLATO DI TURNO – VIDEO!