Google ha lanciato Gemini, un modello di intelligenza artificiale (AI) che promette di possedere avanzate “capacità di ragionamento” per “pensare più attentamente” in presenza di domande difficili.

È difficile ridurre Gemini in un solo termine, tanto che anche l’amministratore delegato di Google, Sundar Pichai, ha preferito tagliare corto, affermando che il miglior modo per comprendere cosa sia Gemini è provarlo. Ma ha poi aggiunto: Gemini rappresenta una “nuova era” per l’intelligenza artificiale.

Gemini è stato testato sulla capacità di risolvere problemi e sulle conoscenze in 57 aree tematiche, tra cui matematica e discipline umanistiche. il nuovo sistema, secondo i suoi creatori, sarebbe addirittura in grado di superare gli esperti umani in una serie di test di intelligenza. Gemini può riconoscere e generare testo, immagini e audio, ma non è un prodotto a sé stante.

Si tratta di un modello che sarà integrato negli strumenti già esistenti di Google, tra cui la ricerca e Bard, ma anche nel browser Chrome.

A partire da oggi, il chatbot Bard sarà basato su una versione di Gemini e sarà disponibile in inglese in più di 170 paesi. Gli sviluppatori e i clienti enterprise avranno accesso a Gemini tramite le API la prossima settimana, mentre una versione più avanzata sarà disponibile il prossimo anno.

Gemini è un sistema nativo multimodale, che può analizzare il contenuto di un’immagine e rispondere a domande sulla stessa o, ancora, creare un’immagine da un messaggio di testo. Durante una dimostrazione dedicata alla stampa, un manager di Google ha caricato la foto di alcuni compiti di matematica in cui uno studente mostrava i calcoli che lo avevano portato a risolvere un problema. Gemini è stato in grado di identificare in quale fase del processo lo studente era incorso in un errore, ne ha spiegato la genesi e ha precisato come avrebbe dovuto rispondere correttamente.

Gemini sarà disponibile in tre “versioni”: Nano, cioé abbastanza leggera per essere integrata in uno smartphone (sarà disponibile sul modello Pixel 8 Pro a partire da oggi); Pro, per Bard; Ultra, che salirà a bordo di alcuni prodotti in arrivo il prossimo anno.

A un primo giudizio, potremmo semplificare dicendo che Pro potrebbe rappresentare la risposta dell’azienda a GPT-3.5 di OpenAI, mentre Ultra dovrebbe rivaleggiare con Chat GPT 4.5.

La sfida dell’IA: non solo Gemini

Gemini vuole creare un “nuovo standard”, ed è in grado di apprendere da fonti diverse dal testo, come le immagini, secondo Chirag Dekate, analista di Gartner. Ciò potrebbe “consentire innovazioni che probabilmente trasformeranno l’intelligenza artificiale generativa”.

Finora Google ha faticato ad attirare l’attenzione sia dei media sia degli utenti rispetto a quanto fatto dal chatbot ChatGPT di OpenAI. Ma l’azienda di Mountain View ritiene di avere per le mani, con Gemini, un modello molto più potente della piattaforma GPT-4 di OpenAI.Tuttavia, una nuova versione più potente del software OpenAI dovrebbe essere rilasciata il prossimo anno, e promette scintille. Tanto che l’amministratore delegato Sam Altman ha affermato che i nuovi prodotti dell’azienda faranno sembrare quelli attuali “un lontano parente”.

Resta da vedere se i recenti colpi di scena in seno a OpenAI – che hanno visto Altman licenziato e riassunto nel giro di poche ore – avranno qualche impatto sui prossimi lanci.

L’azienda deve affrontare anche la nuova concorrenza di xAI di Elon Musk, che starebbe raccogliendo un miliardo di dollari da investire in ricerca e sviluppo. Anche l’azienda cinese Baidu sta facendo passi da gigante con i propri prodotti di intelligenza artificiale.

La sfida fra i modelli, insomma, si fa davvero interessante.

L’articolo Google ha lanciato Gemini, un modello di intelligenza artificiale che promette di fare impallidire Chat GPT sembra essere il primo su Cellulare Magazine.