Al Google I/O 2024, conferenza per sviluppatori del martedì, Google ha annunciato che sta integrando Gemini Nano, il modello AI più piccolo, direttamente nel client desktop di Chrome, a partire da Chrome 126.
Ciò, dice l'azienda, consentirà agli sviluppatori di utilizzare il modello on-device per alimentare le proprie funzionalità di intelligenza artificiale. Google stesso prevede di utilizzare questa nuova funzionalità per alimentare funzioni come il tool esistente "help me write" di Workspace Lab in Gmail, ad esempio.
L'azienda afferma che il recente lavoro su WebGPU e il supporto WASM in Chrome consente a questi modelli di funzionare a una velocità accettabile su una vasta gamma di hardware.
In un briefing prima dell'annuncio di martedì, Jon Dahlke, direttore del product management di Chrome di Google, ha notato che Google stava discutendo con altri fornitori di browser per abilitare questa - o una funzionalità simile - anche nei loro browser.
"Abbiamo iniziato a interagire con altri browser e apriremo un programma di anteprima anticipata per gli sviluppatori," ha scritto Dahlke nell'annuncio di martedì. "Con webGPU, WASM e Gemini integrati in Chrome, crediamo che il web SIA pronto per l'AI."
Dubito che la maggior parte dei concorrenti di Chrome voglia puntare esclusivamente sui modelli AI di Google. Ciò che ha più senso è abilitare i browser - e gli sviluppatori - a eseguire il modello che preferiscono. Google opterebbe chiaramente per eseguire Gemini per le sue applicazioni, ma questi modelli sono abbastanza piccoli da consentire agli sviluppatori di scegliere quello che preferiscono per le proprie applicazioni.
Tuttavia, la scommessa di Google è quella di abilitare una serie di API di alto livello in Chrome per tradurre, sottotitolare e trascrivere testi nel browser utilizzando i suoi modelli Gemini.
"Per offrire questa funzionalità, abbiamo ottimizzato la nostra versione più efficiente di Gemini e ottimizzato Chrome," ha detto Dahlke durante la presentazione per sviluppatori di oggi a I/O. "Ora vogliamo offrirti accesso ai modelli Gemini in Chrome. La nostra visione è quella di fornirti i modelli AI più potenti in Chrome per raggiungere miliardi di utenti senza doversi preoccupare di ingegneria prompt, ottimizzazione, capacità e costi. Tutto ciò che devi fare è chiamare alcune API di alto livello - tradurre, sottotitolare, trascrivere. Questo è un grande cambiamento per il web e vogliamo farlo nel modo giusto."
Per gli sviluppatori, Google sta ora utilizzando il modello integrato Gemini Nano per alimentare alcune nuove funzionalità nella Console degli strumenti di sviluppo di Chrome. Grazie a questo, gli strumenti di sviluppo di Chrome possono ora spiegare gli errori e fornire soluzioni di debugging direttamente nella console.
Stiamo lanciando una newsletter sull'AI! Iscriviti qui per iniziare a riceverla nelle tue caselle di posta il 5 giugno.