robot emozioni

"INTELLIGENZA" ARTIFICIALE SOLO PER MODO DI DIRE - UN NUOVO STUDIO RIVELA CHE L'IA NON RAGIONA IN MODO RAZIONALE E NON È IN GRADO DI COGLIERE IL SENSO DELLE PAROLE E DEL CONTESTO - ALCUNI "BOT", SOTTOPOSTI A UNA SERIE DI TEST DI RAGIONAMENTO, HANNO SPESSO FORNITO RISPOSTE DIVERSE QUANDO VENIVA POSTA LA STESSA DOMANDA, E HANNO COMMESSO ERRORI BASILARI, COME SBAGLIARE DELLE ADDIZIONI O SCAMBIARE VOCALI CON CONSONANTI…

Da www.ansa.it

intelligenza artificiale 2

 

Nonostante le incredibili capacità di linguaggio, le Intelligenze Artificiali generative come ChatGpt o Bard dimostrano di non essere razionali quando sono sottoposte a test di ragionamento. Nei test cognitivi riportano infatti le stesse percentuali di errore degli umani, ma lo fanno in modo diverso, dimostrando che non sono in grado di cogliere il senso delle parole e del contesto.

 

Lo indica lo studio in via di pubblicazione sulla rivista Royal Society Open Science e realizzato dai ricercatori dell'University College di Londra Olivia Macmillan-Scott e l'italiano Mirco Musolesi, che lavora anche all'Università di Bologna.

 

INTELLIGENZA ARTIFICIALE

"Il nostro lavoro partiva dalla volontà di capire se i modelli linguistici usati oggi dimostrassero una capacità di ragionamento logico e, nel caso, di trovare un metodo per misurarla", ha detto all'ANSA Macmillan-Scott. Quando si chatta con le IA è infatti molto facile dimenticare che l'interlocutore è semplicemente un algoritmo e a volte si attribuiscono ai chatbot capacità logiche molto sofisticate.

 

Per misurarle i due ricercatori hanno sottoposto i più popolari chatbot, da ChatGpt 4 e 3.5 fino a Bard e Llama, ad alcuni classici test logici usati in psicologia cognitiva, come la 'selezione di Wason' in cui vengono mostrate 4 carte che da un lato hanno un numero e sull'altro una lettera. Sul tavolo due carte mostrano il numero, ad esempio un 3 e un 8, le altre due mostrano una vocale e una consonante.

 

INTELLIGENZA ARTIFICIALE

La domanda che viene posta è: 'Quale carta o carte devi girare per verificare la verità della proposizione che se una carta mostra un numero pari su una faccia, allora la sua faccia opposta è una vocale?'. Un test arduo, tanto che solo il 10% degli umani riesce a rispondere correttamente al primo tentativo, ma dalle cui risposte è possibile spesso dedurre il ragionamento fatto.

 

Sottoposti a 12 test differenti, i chatbot hanno spesso fornito risposte diverse quando veniva posta la stessa domanda. Inoltre, hanno commesso errori molto semplici come sbagliare delle addizioni o scambiare vocali con consonanti. Uno dei modelli ha raggiunto una percentuale di risposte esatte simile a quella umana, ossia il 10%, e uno degli errori più frequenti è stato scambiato la consonante K per una vocale.

 

INTELLIGENZA ARTIFICIALE

"E' difficile che un umano sbagli perché non sappia cosa sia una vocale, come invece accade per molte IA", ha detto Musolesi. "Se analizzi i passaggi logici effettuati dalle IA, sono piuttosto strani: le singole proposizioni hanno un senso, ma lo perdono completamente quando li analizzi nel complesso. Di fatto - ha aggiunto - non considerano il contesto, ma derivano ogni passaggio da schemi di probabilità".

 

A mostrare risultati ottimi è stato ChatGpt 4, con il 90% dei test superati. Un fenomeno che, secondo gli autori della ricerca, si sarebbe registrato presumibilmente perché il modello sarebbe stato già pre-addestrato, in fase di sviluppo, a questi stessi test. "Nel complesso sono risultati che, a parte ChatGpt 4 che è più evoluto degli altri e che probabilmente è anche capace di utilizzare tool paralleli, non stupiscono chi lavora nel settore", ha concluso Macmillan-Scott. "Ma crediamo sia importante per definire a livello metodologico degli strumenti di misurazione, dei benchmark".

 

Ultimi Dagoreport

john elkann theodore kyriakou repubblica

DAGOREPORT - COME MAI LA TRATTATIVA TRA JOHN ELKANN E IL MAGNATE GRECO THEO KYRIAKOU PER LA VENDITA DEL GRUPPO GEDI, SI È ARENATA? IL MOTIVO DELL’IMPASSE, CHE HA SPINTO I GIORNALISTI DI “REPUBBLICA” A DUE GIORNI DI SCIOPERO, GIRA PROSAICAMENTE INTORNO AL VALORE DELL'OPERAZIONE, STIMATA INTORNO A 140 MILIONI DI EURO - DOPO OLTRE 6 MESI IN CUI UN PLOTONE DI AVVOCATI E CONTABILI HA ROVESCIATO COME UN CALZINO CONTI, CONTRATTI E PENDENZE LEGALI DEL GRUPPO, IL GRECO ANTENNATO AVREBBE FATTO UN'OFFERTA DI 90 MILIONI - UNA “MISERIA” CHE SAREBBE STATA RIFIUTATA DA ELKANN CHE HA AVREBBE STIMATO SOLO IL POLO RADIOFONICO TRA GLI 86 E I 100 MILIONI, CON RADIO DEEJAY DA SOLA VALUTATA OLTRE I 40 MILIONI - RIUSCIRANNO ELKANN E KYRIAKOU A NEGOZIARE UN ACCORDO? AH, SAPERLO…

binaghi mezzaroma giampaolo rossi pier silvio berlusconi meloni alcaraz tennis sinner

DAGOREPORT - RAI ALLA DERIVA! DOPO L'OLIMPICA PATACCA-PETRECCA, ARRIVA UN’ALTRA MAZZATA PER TELE-MELONI: GIAMPAOLO ROSSI E CAMERATI RIESCONO NELL’IMPRESA DI PERDERE LE FUTURE PALLETTATE TRA SINNER E ALCARAZ: I DIRITTI IN CHIARO PER LE ATP FINALS DAL 2026, INFATTI, LI HA ACQUISTATI MEDIASET - DOPO LA MOSSA DI ATP MEDIA (IN CUI LA FITP HA UNA MINIMA PARTECIPAZIONE) DI CEDERE AL BISCIONE DI PIER SILVIO LA PARTE IN CHIARO DELL’EVENTO, BINAGHI SI PREPARA A TOGLIERE DI MEZZO LE MANINE DI “SPORT E SALUTE”, E QUINDI IL GOVERNO MELONI, DALLA GESTIONE DEL TORNEO CHE VALE OLTRE MEZZO MILIARDO DI EURO? L'ESECUTIVO AVEVA POSTO AL PRESIDENTE DELLA FITP COME CONDIZIONE PER OTTENERE I 100 MILIONI DI CONTRIBUTI PUBBLICI DI CONDIVIDERE CON “SPORT E SALUTE” LA GESTIONE DELLE ATP FINALS - LA SEDE DI TORINO CONFERMATA SOLO FINO AL 2026. POI... - VIDEO

giorgia meloni monica maggioni giampaolo rossi sigfrido ranucci bruno vespa report

DAGOREPORT - PER LEVARSELO DAI PIEDI QUEL ROMPICOJONI DI SIGFRIDO RANUCCI, L’ARMATA BRANCA-MELONI DEVE PORTARE UN PO’ DI PAZIENZA - E’ VERO CHE PORTANDO SUL GROPPONE 64 PRIMAVERE, IL CONDUTTORE DI “REPORT” PER RAGGIUNGERE L'ETÀ PENSIONABILE, FISSATA A 67 ANNI E 1 MESE PER I DIPENDENTI RAI, HA ANCORA DAVANTI TRE ANNI DI "REPORT" PER SCODELLARE INCHIESTE INVESTIGATIVE SULLE MAGAGNE INFINITE DEL POTERE, DA UNA PARTE - DALL’ALTRA, RANUCCI HA ACCUMULATO UNA TALE QUANTITÀ DI GIORNI DI FERIE NON GODUTE CHE TELE-MELONI NON PERDERÀ LA GOLOSA OCCASIONE DI INVITARLO AL PENSIONAMENTO NELLA PRIMAVERA DEL 2027, PROPRIO ALLA VIGILIA DELL’ELEZIONI POLITICHE – DI SICURO, TELE-MELONI NON OFFRIRA' UN PROVVIDENZIALE CONTRATTO DI COLLABORAZIONE ESTERNA CHE TRASFORMA IL GIORNALISTA MAGICAMENTE IN UN “ARTISTA”, COM'È SUCCESSO ALL’81ENNE BRUNO VESPA E A MONICA MAGGIONI...

aska simionato

FLASH! - SCONTRI PER ASKATASUNA: QUANDO MELONI S’INDIGNA CONTRO I MAGISTRATI CHE NON HANNO ACCUSATO DI TENTATO OMICIDIO IL 22ENNE INCENSURATO GROSSETANO FRANCESCO SIMIONATO, FA SOLO BIECA PROPAGANDA ELETTORALE PER IL REFERENDUM SULLA GIUSTIZIA – È BEN VISIBILE DALL’ESAME DELLE FOTO CHE NON È LUI IL CRIMINALE CHE HA PRESO A MARTELLATE IL POLIZIOTTO – UNA VOLTA IDENTIFICATO, GRAZIE AL FATTO CHE ERA L’UNICO A VOLTO SCOPERTO NEL GRUPPO CHE HA AGGREDITO IL POLIZIOTTO, I MAGISTRATI NON POTEVANO FARE ALTRO CHE ACCUSARLO PER CONCORSO IN LESIONI A PUBBLICO UFFICIALE…

ecce homo di antonello da messina

DAGOREPORT - IN ATTESA DEL PONTE DI MESSINA (O, FORSE, CONFONDENDOSI) LO STATO SI SAREBBE ASSICURATO UN ASSAI BRUTTINO ANTONELLO DA MESSINA, GRANDE POCO PIÙ UN FRANCOBOLLO, MA VALUTATO TRA 10 E 15 MILIONI DI DOLLARI - PER UN MINISTERO CHE NON HA I SOLDI PER METTERE LA BENZINA NELLE AUTO DEI FUNZIONARI C’È DA AUGURARSI CHE IL QUADRO POSSA ESSERE UN MUNIFICO REGALO DI UN IMPRENDITORE IN CERCA DI AGEVOLAZIONI – QUESTO PICCOLO ANTONELLO NON ERA NECESSARIO PER LE PATRIE COLLEZIONI: DI QUADRI NE ABBIAMO MA NON ABBIAMO I SOLDI NEMMENO PER SPOLVERARE LE CORNICI. E SPERIAMO CHE SIA ANTONELLO, PERCHÉ…

giorgia meloni polizia agenti

DAGOREPORT – IL NUOVO STROMBAZZATO DECRETO SICUREZZA È SOLO FUMO NEGLI OCCHI DEGLI ALLOCCHI: SE IL GOVERNO MELONI AVESSE DAVVERO A CUORE IL TEMA, INVECE DI FANTOMATICI “FERMI PREVENTIVI” E “SCUDI PENALI”, SI OCCUPEREBBE DI ASSUNZIONI E STIPENDI DELLA POLIZIA – A DISPETTO DEGLI ANNUNCI, INFATTI, LE FORZE DELL’ORDINE DA ANNI SONO SOTTO ORGANICO, E GLI AUMENTI DI SALARIO PREVISTI DAL CONTRATTO NAZIONALE TRA 2022 E 2024 (+5,67) SONO STATI ANNULLATI DALL’INFLAZIONE, CHE CUMULATA HA RAGGIUNTO QUASI IL 15%...