Personalmente dubito che all’aumentare degli investimenti in datacenter e modelli sempre più sofisticati corrisponda un miglioramento equivalente dell’intelligenza artificiale; infatti le ultime versioni di ChatGPT, Llama e concorrenti sono solo marginalmente migliori delle precedenti. Tuttavia, i $500 miliardi fanno gioco alla nuova amministrazione, che promette investimenti esorbitanti per un’America più grande, per mantenere il primato nell’intelligenza artificiale.
Tutto bello ed ottimista fino a quando dalla Cina ci è arrivata la nuova versione di DeepSeek, R1, che ragiona come O1 di OpenAI ma è open e costa meno di un ventesimo del concorrente, fino a punte del 95% in meno a seconda dell’uso che ne fate. Mentre la scelta di essere open, quindi di dare pieno accesso a chiunque lo voglia smanettare, integrare con altre applicazioni e modificarlo, la possiamo leggere come una strategia commerciale o geopolitica di rispetto, l’aspetto del minor costo è devastante.
Costruito con un’architettura Mixture-of-Experts (MoE), riesce ad utilizzare solo 37 miliardi di parametri per ogni passo del ragionamento, pur avendone 670 miliardi a disposizione. Oltre a questo, utilizza un sistema mai visto prima di caching che riduce le query ripetitive del 90% rispetto al concorrente più blasonato. Infine, paragonando il costo dell’output di questi due motori di intelligenza artificiale, quello che pagate $60 con OpenAI lo comprate a $2.19 da DeepSeek: fate voi.
Nel corso di una notte, la maggior parte dei ricercatori accademici ed aziendali che conosco s’è buttata a capofitto a provarlo, e dal giorno dopo ad usarlo in pianta stabile. Ci troviamo l’ennesimo caso di sanzioni che tornano come boomerang sulla testa di chi le lancia. Mentre alcune parti di DeepSeek sono copiate dai concorrenti americani, altre sono assolutamente innovative, e dare libero accesso a questo prodotto significa bypassare ogni possibile sanzione alla velocità della luce, letteralmente. Maggiori dettagli li trovate qui.
In pratica, quattro giorni dopo il discorso inaugurale di Trump, dove prometteva monumentali investimenti in intelligenza artificiale e datacenter, e Bruxelles rispondeva con la promessa di ulteriori regole e regolette per impantanare tutto, la Cina ha fatto la mossa del cavallo. Proprio a causa delle restrizioni sui chip più innovativi, sulle tecnologie per datacenter, e sugli studi più sofisticati, la Cina ha messo qualche milionata di ingegneri a lavorare di buzzo buono per ottimizzare rispetto ai vincoli e fare qualcosa di nuovo e migliore. Come già successo con Huawei, DeepSeek in tre mesi ha piazzato una mossa vincente.