Si comincia a vedere la nuova Alexa, quella “potenziata” con l’intelligenza artificiale generativa. Amazon ha dato il via alla sua distribuzione, e a quanto pare, la sta raggiungendo a ondate.
Già più di 100.000 persone hanno avuto accesso a questa versione avanzata, ha rivelato il capo di Amazon, Andy Jassy, durante la recente conference call sugli utili. Certo, se pensiamo ai 600 milioni di dispositivi Alexa già esistenti nel mondo, 100.000 sono solo l’inizio, una piccola parte. Ma il processo è in corso, esattamente come annunciato a febbraio, quando la nuova Alexa è stata presentata per la prima volta.
L’idea dietro questa evoluzione è ambiziosa: permettere agli utenti di conversare con l’assistente in modo molto più naturale e, soprattutto, di fargli fare cose concrete per noi, interagendo anche con app esterne. L’obiettivo è che la nuova Alexa sia capace di generare risposte originali al volo, un po’ come fanno le modalità vocali di ChatGPT di OpenAI o Gemini di Google, superando le risposte predeterminate dei sistemi più vecchi come la precedente Alexa o Siri.
C’è, però, un dettaglio importante, come ha fatto notare il Washington Post al momento del lancio: la versione di Alexa+ che sta venendo distribuita ora non ha ancora tutte le funzionalità chiave che Amazon aveva mostrato con entusiasmo a febbraio. Mancano, ad esempio, la capacità di usare app di terze parti come GrubHub, di inventare una storia della buonanotte per i bambini o di aiutare a fare brainstorming per un’idea regalo. Non è chiaro quando queste funzioni verranno integrate.
Jassy stesso ha confermato questa roadmap in evoluzione: “Abbiamo molte altre funzionalità che prevediamo di aggiungere nei prossimi mesi”, ha detto durante la conference call.
Ha anche parlato apertamente delle sfide tecnologiche. Ha definito questi primi “agenti AI” capaci di agire per l’utente come ancora piuttosto “primitivi” e “imprecisi”. Attualmente, ha spiegato, la maggior parte degli agenti AI che devono completare compiti in più passaggi ha un tasso di accuratezza piuttosto basso, tra il 30% e il 60%. Amazon si pone un obiettivo molto più alto, puntando al 90% di accuratezza per il suo agente di navigazione web interno, chiamato Nova Act, che è alla base della nuova Alexa+.
In questa corsa all’integrazione dell’AI generativa negli assistenti digitali, Amazon sembra muoversi un po’ più velocemente di Apple con la sua nuova Siri basata su modelli linguistici avanzati. Quando a Tim Cook, CEO di Apple, è stato chiesto dei ritardi della nuova Siri durante la conference call sugli utili (che si è tenuta contemporaneamente a quella di Amazon), ha risposto semplicemente che l’azienda aveva bisogno di “più tempo per completare il lavoro”.
È un percorso che sia Amazon che Apple hanno trovato pieno di intoppi e ritardi. Uno degli ostacoli maggiori, a quanto pare, è riuscire a far sì che questi grandi modelli linguistici usino effettivamente gli strumenti e si integrino con altri sistemi. È fondamentale per far fare ad Alexa o Siri cose pratiche e quotidiane come impostare un timer o leggere un messaggio, ma implementare questa capacità in modo affidabile si è rivelato più difficile del previsto.