Google sta per lanciare una nuova versione del suo modello di intelligenza artificiale, progettata per offrire prestazioni elevate con un focus sull’efficienza. Il modello, chiamato Gemini 2.5 Flash, sarà presto disponibile sulla piattaforma di sviluppo AI di Google, Vertex AI.

Il modello Gemini 2.5 Flash offre un calcolo “dinamico e controllabile”, che consente agli sviluppatori di regolare i tempi di elaborazione in base alla complessità delle query. Ciò significa che gli sviluppatori possono bilanciare la velocità, l’accuratezza e i costi per le loro esigenze specifiche. Questa flessibilità è fondamentale per ottimizzare le prestazioni del modello in applicazioni ad alto volume e sensibili ai costi.

Il lancio di Gemini 2.5 Flash arriva in un momento in cui il costo dei modelli di intelligenza artificiale di punta continua ad aumentare. I modelli performanti a basso costo come 2.5 Flash rappresentano un’alternativa interessante alle costose opzioni di fascia alta, anche se a costo di una certa accuratezza. Il modello Gemini 2.5 Flash è una scelta ideale per applicazioni “ad alto volume” e “in tempo reale” come il servizio clienti e l’analisi dei documenti.

Gemini 2.5 Flash è un modello di “ragionamento” che impiega un po’ più di tempo per rispondere alle domande, al fine di verificare i fatti. Ciò lo rende simile ad altri modelli come o3-mini di OpenAI e R1 di DeepSeek. Google afferma che il modello è ottimizzato specificamente per una bassa latenza e costi ridotti, rendendolo il motore ideale per assistenti virtuali reattivi e strumenti di riepilogo in tempo reale.

Nonostante il lancio di Gemini 2.5 Flash, Google non ha pubblicato un rapporto sulla sicurezza o tecnico per il modello, rendendo più difficile valutare le sue prestazioni. Tuttavia, la società ha annunciato che prevede di portare i modelli Gemini come 2.5 Flash negli ambienti on-premise a partire dal terzo trimestre. I modelli Gemini dell’azienda saranno disponibili su Google Distributed Cloud (GDC), la soluzione on-premise di Google per i clienti con rigidi requisiti di governance dei dati.

Google sta collaborando con Nvidia per portare i modelli Gemini sui sistemi Nvidia Blackwell conformi a GDC, che i clienti possono acquistare tramite Google o i loro canali preferiti. Ciò segna un importante passo avanti per l’adozione di modelli di intelligenza artificiale in ambienti on-premise, dove la sicurezza e la governance dei dati sono fondamentali.

Categorized in:

Breaking AI,

Last Update: Aprile 11, 2025