Il gioco è semplice: dite a Sora di disegnare o proiettarvi qualcosa, e lei vi fa un video di 60 secondi che impressiona per qualità e realismo. Quei cani e persone che vedete son tutte avatar, tutte ricostruzioni fantasiose elaborate in pochi secondi per rispondere alla vostra richiesta. La parte di fisica dinamica, ossia il movimento delle automobili o dei passanti, non è ancora messo a punto, ma dovremo aspettare a lungo per tarare al meglio questo aspetto.
Sam Altman ha deciso di non rilasciare Sora al pubblico, ed il motivo è banale: OpenAI non ha ancora ben capito come evitare che malintenzionati creino video fake di personaggi famosi, magari di politici che annunciano un bombardamento inesistente, o creino un incidente diplomatico.
Vi ricorderete l’avatar fatto dal nonno, in venti minuti di registrazione sul cellulare e gratuitamente. Anche in questo caso lo strumento è fatto per essere a portata di tutti, ed almeno inizialmente senza spese, il che porterà centinaia di milioni di persone a giocarci e produrre video con cui inondare il mondo digitale. Fin da subito viene da preoccuparsi per i lavoratori dello spettacolo, della creazione di pubblicità e film, la cui professionalità sarà messa a dura prova da uno strumento che a tutti gli effetti ti rende produttore cinematografico.
Mentre OpenAI corre ai ripari per sviluppare un modulo che riconosca i video creati da Sora e quindi i falsi, possiamo immaginare che ogni concorrente stia lavorando per lanciare applicazioni equivalenti, e magari senza le remore di Altman, giusto per stare a galla nel mercato. Lui gioca d’anticipo, corre in giro per il mondo per creare un’ulteriore organizzazione internazionale che governi le attività dell’intelligenza artificiale. Non è mosso da chissà quale senso di giustizia e morale, più prosaicamente dal tentativo di tenere indietro i concorrenti, ed essere lui a dettare le regole del gioco.
FlowZero, VideoPoet e specialmente Canva sono altri nomi che lavorano in questo campo del “text-to-video”, ossia la capacità di generare filmati artificiali da poche righe di testo. Per ora l’input è dato da due o tre frasi, poche righe di testo, e siamo ancora lontani dal poter dare in pasto una sceneggiatura completa, ma forse non ce ne sarà bisogno. Ricordo una lezione di Stephen King, ripresa anche nel suo libro “On Writing” (dello scrivere, che raccomando assolutamente), dove lui spiega di non sviluppare una traccia, ma semplicemente creare ad ogni singolo passo, in base a cosa ha appena scritto un minuto prima.
Gli LLM hanno seguito molti dei suoi consigli: hanno letto tutto il possibile, scrivono e riscrivono di continuo per provare combinazioni nuove, si concentrano sul filo logico del testo e non sul lettore, elaborano un testo molto semplice e facile da seguire ed ovviamente fanno il tutto molto velocemente, di getto. Da ultimo, sono preda di allucinazioni, sempre coerenti ma fantasiose, impossibili: quasi come i racconti horror del mio più famoso vicino di casa in Maine.
Il mio consiglio resta lo stesso: scaricatelo, giocateci, cercate di divertirvi ed apprenderne i trucchi, è probabile che vi torni utile.