Demis Hassabis, a capo di Google DeepMind, il team di ricerca sull’intelligenza artificiale di Google, ha lanciato un’idea intrigante martedì sera: il loro ultimo modello per la creazione di video, Veo 3, potrebbe forse trovare applicazione nel mondo dei videogiochi.
Tutto è partito da un post su X (ex Twitter) che supplicava Google: “Lasciatemi giocare subito a un videogioco basato sui miei video di Veo 3” e chiedeva “modelli del mondo giocabili, quando?”. La risposta di Hassabis è stata un laconico ma suggestivo “non sarebbe fantastico?”.
Mercoledì mattina, Logan Kilpatrick, Product Lead per Google AI Studio e Gemini API, ha rincarato la dose con una risposta altrettanto enigmatica: una sequenza di emoji pensierose.
Sebbene questi scambi tra i dirigenti di Google sembrino poco più che battute o stuzzicamenti, l’idea di costruire “modelli del mondo giocabili” non è affatto irrealizzabile per un colosso tecnologico come Google. Un portavoce dell’azienda ha preferito non commentare ulteriormente al momento.
È importante distinguere i “modelli del mondo” (world models) dai modelli di generazione video. I primi sono progettati per simulare le dinamiche di un ambiente reale, consentendo agli agenti (come un’IA o un giocatore) di prevedere come il mondo reagirà alle loro azioni. I modelli di generazione video, invece, si limitano a sintetizzare sequenze visive realistiche.
Google ha già in cantiere progetti ambiziosi in questa direzione. Ci sono piani per evolvere il suo modello multimodale di base, Gemini 2.5 Pro, in un vero e proprio “modello del mondo” capace di simulare persino aspetti del cervello umano. Lo scorso dicembre, DeepMind ha presentato Genie 2, un modello in grado di generare una varietà apparentemente infinita di mondi interattivi e giocabili. Inoltre, è noto che Google ha formato un nuovo team dedicato proprio alla creazione di modelli IA capaci di simulare il mondo fisico.
Google non è l’unica a esplorare questo campo. Anche altri attori sono al lavoro sulla costruzione di “modelli del mondo”, tra cui spicca la pioniera dell’IA Fei-Fei Li. L’anno scorso, la sua startup World Labs è uscita dalla modalità “stealth” presentando un sistema IA proprietario in grado di generare scene 3D interattive, simili a quelle dei videogiochi, partendo da una singola immagine.
Veo 3, attualmente disponibile in anteprima pubblica, è un modello potente per la creazione di video e audio (dalle voci alle colonne sonore). Sebbene sia capace di generare movimenti realistici che simulano la fisica del mondo, non è ancora un “modello del mondo” completo. La sua forza attuale risiede piuttosto nella narrazione visiva per i giochi, ideale per creare cutscene, trailer o per la prototipazione narrativa.
Inoltre, Veo 3 è ancora un modello generativo con un “output passivo”. Per essere veramente utile nei videogiochi interattivi, esso (o una sua futura versione) dovrebbe evolvere in un simulatore più attivo, interattivo e predittivo.
La vera complessità nello sviluppo di videogiochi non risiede unicamente nella creazione di immagini mozzafiato, ma soprattutto nella simulazione in tempo reale, che deve essere coerente e controllabile. Per questo motivo, se Google decidesse di addentrarsi seriamente nello sviluppo di videogiochi o “mondi giocabili”, un approccio ibrido che combini le capacità di Veo e Genie in futuro potrebbe rivelarsi la strategia più efficace.