mercoledì, 15 Maggio 2024
HomeIntelligenza ArtificialeGemini: il nuovo modello IA multimodale di Google

Gemini: il nuovo modello IA multimodale di Google

Google ha ufficializzato Gemini 1.0, il suo nuovo modello di intelligenza artificiale multimodale e offerto in 3 versioni differenti in base alla complessità dei compiti che dovrà svolgere e anche in base al dispositivo su cui sarà utilizzato.

Cosa significa che Gemini è Multimodale

Per Multimodale si intende un modello di deep learning capace di comprendere più modalità di input per elaborare le informazioni e generare una risposta.

Le modalità di input fino ad ora più analizzate dai modelli di intelligenza artificiale sono: immagini, testo, audio e video ma a giudicare dai primi video sembra che Gemini ad esempio riesca ad interagire con quanto registrato da una webcam in tempo reale.

Lo scopo quindi di un modello multimodale è quello di poter analizzare la informazioni che gli giungono da tutte queste fonti per arrivare ad una comprensione più completa del test a cui è sottoposto.

Attualmente Gemini 1.0 può ricevere input quali testo, audio, video e codice di programmazione.

3 versioni di Gemini

Le 3 varianti sono:

  • Gemini Ultra, il più completo e potente pensato per ambiti di utilizzo complessi;
  • Gemini Pro, capace di adattarsi ad un’ampia gamma di attività;
  • Gemini Nano, il quale a sua volta si suddivide in Nano-1 e Nano-2, ovvero la variante maggiormente efficiente a disposizione per i dispositivi mobile.
@google

Let’s see what #GeminiAI can do. Go hands-on with Gemini’s multimodal reasoning capabilities

♬ original sound – Google

Google Gemini VS Chat GPT

Dal risultato del test a cui si è sottoposto Google Gemini, denominato MMLU e volto specificatamente a valutare le capacità dei modelli IA, traspare come Gemini Ultra abbia superato i migliori modelli oggi disponibili ottenendo un punteggio del 90% nel test di combinazione tra 57 materie.

In quasi tutti i test Gemini Ultra è risultato superiore, seppur a volte con un margine risicato, rispetto a Chat GPT ovvero il modello IA di riferimento fino ad oggi realizzato da OpenAI.

Questa superiorità però la dice lunga anche di come sia avanti Chat GPT la cui ultima versione è arrivata ormai qualche mese fa.

Come provare Google Gemini

Gemini Pro verrà integrato all’interno del chatbot di Google Bard andando a sostituire Palm-2, e già da oggi è infatti disponibile in 170 Paesi (trovi la lista QUI) ma almeno per il momento solo in lingua inglese.

Per l’Europa, con le varie lingue di cui è composta, bisognerà attendere il prossimo futuro.

Paolo Colombo
Paolo Colombohttps://www.mytechnology.eu
Classe '81, appassionato di tecnologia e internet. Dal 29 marzo 2007 scrive quotidianamente con passione sul suo blog www.mytechnology.eu | .it articoli inerenti queste due tematiche. Ha una bellissima moglie e due figli adorabili, e passa le nottate scrivendo articoli e giocando online con i membri del clan EraseR che conosce da ben 20 anni.
ALTRI ARTICOLI CHE POTREBBERO INTERESSARTI

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui

CONTINUA A SEGUIRMI

855FansMi piace
389FollowerSegui
429FollowerSegui
247FollowerSegui
6,570IscrittiIscriviti

ULTIMI ARTICOLI