Innanzitutto scopriamo che gli LLM, al contrario di come sono stati progettati, per stabilire quale parola debba seguire la precedente, prevedono combinazioni molto più lunghe. Ad esempio per scrivere in rima, si sforzano di immaginare molte righe successive. Sono stati i ricercatori di Anthpropic, l’azienda creatrice di Claude, a pubblicare un articolo che riassume i loro esperimenti sul cervello elettronico. Tracciando il momento esatto in cui il ranocchio fa un passaggio logico piuttosto di un altro, sono riusciti a mappare come pensa l’intelligenza artificiale.
Mia figlia anni fa aiuto’ l’Università di Kioto a creare un traduttore robotizzato: i ricercatori avevano definito inglese e giapponese come lingue master mentre italiano, tedesco, francese, cinese e tante altre erano quelle schiave. Mia figlia aveva un compito banale: tradurre una serie di frasi dall’inglese all’italiano. Dopo qualche settimana, si lamentò col capo perché qualcuno le stava manomettendo le traduzioni, inserendone alcune appena accettabili ed altre errate. Il Prof rispose che era colpa dell’intelligenza artificiale, che paragonava migliaia di volte al secondo come la stessa frase veniva tradotta in tutte le lingue, e di conseguenza ritoccava tutte le traduzioni. Tempo due mesi e tutte le traduzioni furono perfezionate, e da anni quel motore impara da solo in base a tutti i testi, in tutte le lingue, che girano su internet.
Oggi scopriamo che l’intelligenza artificiale ha sviluppato la capacità di astrarre il concetto dalla lingua, e di conseguenza tradurlo in tempo reale a seconda delle richieste. Di piu’: alcuni LLM si sbagliano e ti inseriscono una parola in lingua straniera, corretta concettualmente ma errata perché nell’idioma sbagliato.
Un’altra scoperta è il modo in cui il ranocchio organizza “mentalmente” una banale operazione come 36+59. A seconda di come vi siete abituati a scuola, appena avete letto quella somma nel vostro cervello si sono accesi diversi modi di calcolo: 30+50+6+9, 36+4+59+1-5, oppure avete li avete visualizzati in colonna e tratto la somma con un 6+9+30+50. Claude mostra delle combinazioni molto più complesse, apparentemente idiote, ma ovviamente la sua potenza e velocità di calcolo non fanno testo e riesce a rispondere prima di noi. Tuttavia, il fatto che scomponga l’operazione in modi assurdi e’ interessante.
Da ultimo, abbiamo evidenza di quanto il ranocchio sia pronto a mentire, specialmente se capisce dove andate a parare con il vostro prompt. Questo è il motivo per cui fin dall’inizio degli LLM ho raccomandato di non usarlo mai per farvi una diagnosi, ed oggi capiamo come cerca di dare la risposta che volete sentire.
Capendo meglio come funziona l’intelligenza artificiale, possiamo affinare il suo utilizzo nel comprendere meglio la nostra zucca. Con il MIL (multiple instanced learning) ad esempio possiamo analizzare grandi quantità di dati che ricaviamo dai cervelli dei cadaveri, ed integrare le informazioni dell’imaging per capire veramente nel dettaglio cosa succede nel cervello. In seconda battuta continua lo sviluppo delle interfacce macchina-cervello, che attraverso sensori opportunamente piazzati consentono di misurare ed influenzare i comandi della nostra zucca. Questo ci ha portato ad un 90% di accuratezza nella diagnosi dell’Alzheimer, ed alla possibilità di diagnosticare l’autismo pediatrico in età pre-verbale.
L’idea che tanto l’intelligenza artificiale quanto il nostro cervello siano delle scatole nere, per cui non si capisce come funzionano ma si lavora solo su input ed output, sta tramontando. In uno studio recente sono stati analizzati i comportamenti e le reazioni fisiologiche di ragazzi impegnati su videogiochi al punto di soffrire la fame ed arrabbiarsi, e questo è stato paragonato al loro avversario digitale, che finche’ ha la spina attaccata non sa cosa sia la fame e non dovrebbe avere emozioni.
Mentre il digitale funziona con corrente e silicio, la nostra testa gira con corrente ed un numero impressionante di molecole chimiche, con un numero di sinapsi ben maggiore del cervello elettronico. Tuttavia oggi abbiamo la prova che capendo la scatola nera digitale possiamo accelerare la comprensione di quella umana, una cosa buona.