Mercoledì scorso, OpenAI ha compiuto un passo significativo, aprendo le porte della sua ultima e più potente tecnologia di generazione di immagini, quella che alimenta la rinnovata funzionalità di ChatGPT, agli sviluppatori di tutto il mondo. Ora, l’integrazione di questa capacità nelle proprie app e servizi è diventata una realtà accessibile.

Ricordate il generatore di immagini di OpenAI che ha conquistato il web a fine marzo? Quello che ha fatto impazzire tutti con la sua abilità di creare immagini realistiche in stile Ghibli o trasformare concetti in “action figure AI”? Ebbene, quella viralità è stata un’arma a doppio taglio. Da un lato, ha portato milioni di nuovi utenti a ChatGPT, dall’altro, ha messo a dura prova le infrastrutture di OpenAI. Pensate, oltre 700 milioni di immagini sono state create da più di 130 milioni di utenti nella sola prima settimana!

Ora, questa magia è disponibile tramite API, grazie a un modello di intelligenza artificiale chiamato “gpt-image-1”. Un modello nativamente multimodale, capace di creare immagini in stili diversi, seguire istruzioni personalizzate, sfruttare la conoscenza del mondo e persino renderizzare testo all’interno delle immagini.

Immaginate di poter generare più immagini contemporaneamente, controllando la qualità della generazione e, di conseguenza, la velocità. Un vero e proprio controllo creativo nelle mani degli sviluppatori.

OpenAI sottolinea che gpt-image-1 eredita le stesse protezioni di sicurezza già implementate nella generazione di immagini in ChatGPT. Questo significa che sono attivi meccanismi per prevenire la creazione di contenuti che violino le policy aziendali. Inoltre, gli sviluppatori hanno la possibilità di regolare la sensibilità della moderazione, scegliendo tra un filtraggio standard (“auto”) o un filtraggio meno restrittivo (“low”). Quest’ultimo, come specificato nella documentazione, limita un minor numero di categorie di contenuti potenzialmente inappropriati per alcune fasce d’età.

Un altro aspetto importante: tutte le immagini create con gpt-image-1 sono contrassegnate con metadati C2PA, rendendole identificabili come generate da AI da piattaforme e app che supportano questo standard. Un passo avanti verso la trasparenza e l’autenticità dei contenuti.

Ma quanto costa tutto questo? Il prezzo è di 5 dollari per milione di token di input per il testo, 10 dollari per milione di token di input per le immagini e 40 dollari per milione di token di output per le immagini. Tradotto in termini più concreti, si parla di circa 2 centesimi, 7 centesimi e 19 centesimi per immagine generata, rispettivamente per immagini quadrate di bassa, media e alta qualità.

E non è finita qui. Aziende come Adobe, Airtable, Wix, Instacart, GoDaddy, Canva e Figma stanno già sperimentando con gpt-image-1 o lo hanno già integrato nei loro servizi. Ad esempio, Figma Design permette ora agli utenti di generare e modificare immagini direttamente tramite gpt-image-1, mentre Instacart sta testando il modello per le immagini di ricette e liste della spesa. Il futuro della creazione visiva è qui, ed è alimentato dall’intelligenza artificiale.

Categorized in:

Breaking AI,

Last Update: Aprile 27, 2025