SE STATE PROVANDO A CAPIRE L'ALGORITMO DI GOOGLE, RINUNCIATE - PANDU NAYAK, RESPONSABILE DEL SETTORE SEARCH DI MOUNTAIN VIEW, SVELA I SEGRETI DEL MOTORE DI RICERCA: "SOLO NEL 2020 CI SONO STATE 4.887 MODIFICHE. A VOLTE SBAGLIAMO, COME CON QUEL SITO NEGAZIONISTA. MA IN FUTURO SI POTRÀ CERCARE ANCHE FRA DOCUMENTI AUDIO E VIDEO, OLTRE CHE IN LINGUE DIVERSE DALLA PROPRIA"

Bruno Ruffilli per "La Stampa"

«Le ricerche su Google riflettono l'infinita curiosità dell'essere umano», dice Pandu Nayak. Origini indiane, una sessantina d'anni (quanti esattamente non lo si scopre neanche chiedendolo a Google), ha insegnato alla Stanford University e lavorato per la Nasa. E oggi è vicepresidente responsabile del settore Search dell'azienda di Mountain View: «Il nostro è un lavoro semplice, si tratta di organizzare tutte le informazioni del mondo e renderle universalmente accessibili e utili», racconta in questa conversazione in esclusiva per l'Italia.

Non sarà un obiettivo troppo ambizioso?

«È come se volessimo compilare l'indice di un libro, ma con alcune importanti differenze: per cominciare, il Web ha miliardi e miliardi di pagine, e anche l'indice è mostruoso, tanto che se venisse stampato coprirebbe 12 volte la distanza tra la Terra e la Luna e ritorno. Inoltre, ogni giorno il 15 per cento delle ricerche che arrivano a Google sono completamente nuove, mai fatte prima.

In più, teniamo conto anche di informazioni create dalle persone, come recensioni e luoghi di interesse, di news, di dati di aziende e istituzioni, oltre che di quelli prodotti con il machine learning, come il momento in cui un ristorante è affollato, o le previsioni del tempo. Organizziamo tutte queste informazioni e le presentiamo in maniera adeguata. O almeno ci proviamo».

Qual è la sfida più difficile?

«La comprensione del linguaggio. Per poter rispondere, innanzi tutto dobbiamo capire cosa vuole chi fa una ricerca. Un grosso passo avanti lo abbiamo fatto nel 2018 con Bert, una tecnologia per il natural language processing basata su un network neurale: grazie all'intelligenza artificiale, ora siamo capaci di elaborare anche quel 10 per cento di ricerche che presentano errori o sono formulate in modo poco chiaro».

Ingegner Nayak, quanto è importante la casualità nelle ricerche?

«Ci aiuta a soddisfare la curiosità delle persone. Questo perché Google non fornisce un solo risultato, ma una lista, quindi permette di esplorare il mondo sotto diverse prospettive e interpretazioni. Poniamo per esempio che qualcuno cerchi informazioni sul Taj Mahal: leggerà pagine che parlano del monumento, ma poi per caso potrebbe scoprire tra i risultati il link di un nuovo ristorante indiano con lo stesso nome, che ha aperto da poco nel suo quartiere. Sono cose molto diverse, eppure potrebbero destare interesse nella stessa persona, e dal caso potrebbe nascere un'opportunità di piacere o di conoscenza».

Però a volte la ricerca restituisce risultati discutibili: come quando, anni fa, il Guardian notò che in cima ai risultati sull'Olocausto c'era un sito negazionista.

«Era un errore, lo abbiamo corretto, abbiamo chiesto scusa, e oggi non è più così. Teniamo conto di diversi parametri per stabilire l'ordine dei risultati delle ricerche, come rilevanza e affidabilità, ma pure freschezza e originalità dei contenuti. Lavoriamo costantemente per migliorare l'algoritmo: solo nel 2020, le modifiche grandi e piccole sono state 4887».

Cioè è cambiato 13 volte al giorno?

«Sì. E abbiamo condotto anche più di 60mila confronti diretti tra la soluzione in uso e quella da introdurre; in tutto il mondo, oltre 10mila validatori analizzano il modo in cui le modifiche influenzano i risultati e ci dicono se andare avanti o no».

Anche in Italia?

«Sì, sono diverse centinaia».

Avere a disposizione più dati in inglese penalizza la qualità delle ricerche in altre lingue, come l'italiano o il polacco?

«In linea di massima no, perché la maggior parte delle tecniche che utilizziamo sono basate sulla statistica, quindi applicabili in tutto il mondo. Oltre alle affinità studiamo le differenze tra le varie lingue, come le parole composte in tedesco o la segmentazione dei termini cinesi.

Addestriamo la nostra intelligenza artificiale con metodi di apprendimento automatico, per cogliere le sfumature specifiche delle varie lingue. Inoltre, stiamo cominciando a creare modelli linguistici più potenti, che si possano trasferire da una lingua all'altra».

Oggi si può cercare un oggetto o un monumento inquadrandolo con la telecamera dello smartphone, a breve sarà possibile chiedere a Google di ritrovare un momento preciso di un video o di riconoscere un brano canticchiandolo. C'è una domanda destinata a rimanere senza risposta?

«Direi di no, ma nel caso segnaliamo che non disponiamo di dati sufficienti e spieghiamo che è necessaria una ricerca ulteriore».

Dunque continueremo a fare una ricerca dopo l'altra?

«Per un compito complesso come la preparazione di una gita servono in media 8 ricerche. Con la nuova tecnologia Multitask Unified Model ne basterà una sola per avere tutte le informazioni utili: Mum non solo comprende il linguaggio, ma lo genera anche. Ed è multimodale, quindi in futuro si estenderà ad audio e video, oltre che a lingue diverse da quella della ricerca».

Google ci darà risposta alla domanda fondamentale sulla vita, l'universo e tutto quanto?

«La risposta l'ha già data Douglas Adams: è 42. E ovviamente su Google c'è».