JetBrains, un nome noto a chi lavora nel mondo dello sviluppo software grazie ai suoi tanti strumenti popolari, ha appena fatto una mossa interessante: ha rilasciato il suo primo modello AI “aperto” pensato apposta per la programmazione.
Mercoledì scorso, JetBrains ha reso disponibile su Hugging Face, una piattaforma molto usata dalla community AI, il modello chiamato Mellum. Questo generatore di codice, che l’azienda usava già l’anno scorso nelle sue suite di sviluppo, è stato addestrato su una quantità enorme di dati – oltre 4 trilioni di “token” – e ha 4 miliardi di “parametri”. È stato creato con un obiettivo ben preciso: aiutare a completare il codice mentre lo si scrive, basandosi sul contesto.
Parlando di numeri, i parametri sono un po’ come la “capacità di ragionamento” di un modello, mentre i token sono i dati grezzi che elabora. Per dare un’idea, un milione di token corrispondono più o meno a 30.000 righe di codice.
Come spiega la stessa JetBrains in un rapporto tecnico, Mellum è stato pensato per integrarsi negli strumenti professionali (immaginate suggerimenti di codice super intelligenti nei vostri editor!), negli assistenti di coding basati sull’AI, e anche per chi studia o fa ricerca sulla comprensione e generazione del codice. Ma non solo: è perfetto anche per l’educazione e per fare esperimenti personalizzando il modello (il cosiddetto “fine-tuning”).
Mellum è distribuito con una licenza Apache 2.0 ed è stato addestrato su vari set di dati, tra cui codice con licenza permissiva preso da GitHub e articoli di Wikipedia in inglese. L’addestramento non è stato uno scherzo: ci sono voluti circa 20 giorni su un cluster con 256 GPU Nvidia H200.
C’è però un piccolo dettaglio da tenere a mente: Mellum non è pronto all’uso appena scaricato. Il modello base ha bisogno di essere “affinamento”, cioè personalizzato per compiti specifici. Anche se JetBrains ha messo a disposizione alcuni modelli di Mellum già ottimizzati per Python, avvertono che servono più che altro per farsi un’idea delle sue potenzialità, non sono pronti per essere usati in un ambiente di produzione vero e proprio.
L’AI che scrive codice sta cambiando il modo in cui creiamo software, non c’è dubbio. Ma porta anche con sé nuove sfide, soprattutto sul fronte della sicurezza. Secondo un sondaggio di fine 2023 fatto da Snyk, una piattaforma per la sicurezza degli sviluppatori, più del 50% delle aziende si trova spesso o a volte ad affrontare problemi di sicurezza legati al codice generato dall’AI.
E JetBrains non nasconde i potenziali rischi: Mellum potrebbe “riflettere i bias” presenti nei dati su cui è stato addestrato (per esempio, generando codice con lo stile tipico dei repository open source) e i suoi suggerimenti non sono garantiti come “sicuri o privi di vulnerabilità”.
“Questo è solo l’inizio,” si legge in un post sul blog di JetBrains. “Non puntiamo alla generalità, ma alla focalizzazione. Se Mellum riuscirà ad accendere anche un solo esperimento, contributo o collaborazione significativa, per noi sarà già una vittoria.” Un invito aperto a tutta la community di sviluppatori a esplorare e costruire su questa nuova base.