Il futuro dell’intelligenza artificiale si fa sempre più tangibile, e Google è di nuovo in prima linea, pronta a sorprenderci. Arriva direttamente da Demis Hassabis, la mente al timone di Google DeepMind, una notizia che accende la fantasia: l’azienda sta per far “incontrare” due delle sue creazioni più avanzate, l’intelligenza artificiale Gemini e il modello di generazione video Veo. L’obiettivo? Dare a Gemini una comprensione più profonda, quasi istintiva, del mondo che ci circonda, per plasmare un assistente digitale che non sia solo smart, ma veramente d’aiuto nella vita di tutti i giorni.
Hassabis, parlando nel podcast Possible, ha condiviso una visione affascinante: Gemini non è nato come un semplice chatbot, ma fin dall’inizio è stato concepito come un sistema capace di “sentire” il mondo attraverso dati e informazioni di ogni tipo. “Vogliamo costruire un assistente che sappia mettere insieme tutti i pezzi – testi, immagini, suoni, video – per capire davvero come interagiamo con la realtà”, ha spiegato. E Gemini già oggi dimostra di cosa è capace, creando immagini, componendo testi e generando audio con disinvoltura.
Non è solo Google a sognare in grande, sia chiaro. L’intero settore dell’IA sembra inseguire l’idea di modelli “onnipotenti”, capaci di fare un po’ di tutto. Pensiamo a ChatGPT di OpenAI, che non solo chiacchiera ma dipinge anche con le parole, o ai piani di Amazon per un modello “any-to-any” che promette un’interazione multimodale ancora più spinta.
Ma come fa un’IA a capire il mondo fisico? Hassabis ha svelato che il segreto di Veo sta nell’immensa libreria di YouTube. Immaginate Veo che “guarda” ore e ore di video, non per intrattenimento, ma per imparare le regole non scritte del nostro mondo: come cadono gli oggetti, come si muovono i fluidi, le piccole leggi fisiche che governano la nostra quotidianità. “Osservando un’infinità di video,” ha sottolineato Hassabis, “Veo impara a comprendere come funziona davvero il mondo reale”. Un tesoro di dati non solo vasto, ma incredibilmente prezioso.
Proprio per nutrire questa sete di conoscenza, Google aveva già aggiornato i suoi termini di servizio l’anno scorso, assicurandosi un accesso più ampio ai contenuti di YouTube per addestrare le sue IA. Una mossa strategica che ora si rivela fondamentale per questa fusione tra Gemini e Veo, gettando le basi per un assistente intelligente capace di afferrare le nostre esigenze in modo più completo e sfumato.
Insomma, la tecnologia non si ferma e Google ci sta mostrando la direzione: assistenti digitali che non si limiteranno più a eseguire compiti isolati, ma che sapranno offrirci un supporto concreto in tantissimi ambiti, rendendo la nostra vita un po’ più semplice e, forse, più interessante.