Tutto quello che devi sapere su Google Gemini

-

Google è uno degli attuali giganti della tecnologia che lavora su strumenti di intelligenza artificiale generativa. Con Anthropic e la sua Claude AI, è uno dei primi a reagire al lancio dell’ormai famoso ChatGPT di OpenAI alla fine del 2022.

Va però detto che il suo primo chatbot, IA Bard, lanciato nel febbraio 2023, non è stato proprio convincente. A causa di un errore durante una dimostrazione dal vivo, l’intelligenza artificiale aveva in qualche modo offuscato la reputazione dell’azienda e ne aveva addirittura fatto crollare il valore di borsa.

Pubblicità, i tuoi contenuti continuano di seguito

Ma Google ha rapidamente recuperato lanciando Gemini nel dicembre 2023. Molto più di un semplice chatbot, Gemini è una famiglia di modelli linguistici di grandi dimensioni (LLM) di nuova generazione in grado di comprendere linguaggio naturale, immagini, audio, codice e video. Ecco tutto quello che devi sapere al riguardo.

Gemelli (Google Bardo)

Il tanto atteso Gemini (Google Bard), l’agente conversazionale basato sull’intelligenza artificiale e sviluppato da Google, verrà distribuito questo giovedì 13 luglio 2023 in Francia sotto forma di servizio online gratuito.

  • Download:
    4102
  • Data di rilascio :
    22/04/2024
  • Autore:
    Google
  • Licenza :
    Licenza gratuita
  • Categorie:

    AI

  • Sistema operativo :

    Android, servizio in linea

Da Bardo ai Gemelli

Bard è stata la prima intelligenza artificiale conversazionale di Google, sviluppata dai suoi laboratori di ricerca sull’intelligenza artificiale: DeepMind e Google Research. È stato annunciato il 6 febbraio 2023 e reso disponibile agli utenti poche settimane dopo, il 21 marzo 2023. A quel tempo era necessario registrarsi in una lista d’attesa per potervi accedere. Successivamente Google ha rimosso questo requisito e ha reso disponibile la sua intelligenza artificiale in oltre 180 paesi il 10 maggio 2023.

Bard è stato lanciato con l’obiettivo di competere con ChatGPT di OpenAI, che è stato rilasciato nel novembre 2022 ed è stato un successo immediato. Tuttavia, forse sotto pressione a causa del successo di quest’ultimo, Google ha lanciato la sua intelligenza artificiale prima che fosse del tutto pronta. Durante una dimostrazione pubblica dal vivo, il chatbot ha commesso un errore fornendo informazioni false in risposta a una domanda posta da un utente. Un errore non privo di conseguenze, poiché il giorno successivo costò a Google una perdita di valore di borsa di 100 miliardi di dollari.

Pubblicità, i tuoi contenuti continuano di seguito

Naturalmente l’azienda non si è lasciata scoraggiare e ha continuato a lavorare sulla sua intelligenza artificiale. Il 6 dicembre 2023 ha lanciato Gemini, un grande modello linguistico con capacità multimodali che superavano quelle dei modelli dell’epoca (in questo caso GPT-4 di OpenAI).

L’intelligenza artificiale è pubblicizzata come composta da una serie di modelli di dimensioni diverse, ciascuno progettato per uno specifico insieme di casi d’uso e ambienti di distribuzione. Gemini Ultra, la fascia più alta, è progettata per gestire compiti complessi. Gemini Pro si presenta come il modello più versatile e alimenta il chatbot Bard di Google. Infine, Gemini Nano è progettato per l’uso su dispositivi ed è disponibile su Pixel 8 Pro di Google.

È interessante notare che il chatbot AI di Google non si chiama più Bard dall’8 febbraio 2024. È stato ribattezzato Gemini, proprio come altri strumenti AI di Google integrati in alcuni dei suoi servizi (l’ex strumento Duet per Google Workspace e Google Cloud, per esempio).

Cosa puoi fare con i Gemelli?

I tre modelli di Gemini sono stati pre-addestrati su una varietà di materiali audio, foto e video, nonché su un ampio set di basi di codice e testo in diverse lingue. Sono quindi nativamente multimodali e possono ragionare su una sequenza di diverse tipologie di dati in input, tra cui audio, immagini e testo.

Grazie a queste funzionalità, tutti i modelli Gemini possono teoricamente rispondere a domande in linguaggio naturale, riassumere e generare testo, tradurre testi in più di 100 lingue, analizzare elementi visivi complessi (grafici, figure, diagrammi, ecc.), sottotitoli e didascalie , esegui traduzioni audio, genera descrizioni da video, analizza e genera codice (Python, Java, C++, ecc.) e molto altro.

Pubblicità, i tuoi contenuti continuano di seguito

Uno dei punti di forza di Gemini è la sua capacità di ragionamento multimodale, ovvero può rispondere a un mix di diversi tipi di dati in un unico prompt.

Inoltre, come indicato sopra, i tre modelli Gemini sono destinati ciascuno a casi d’uso specifici:

  • Gemelli Ultra, la versione massima del LLM, è destinata a compiti molto complessi. Secondo Google può essere utilizzato per aiutare gli studenti nei compiti di fisica, per risolvere problemi passo dopo passo, per identificare articoli scientifici rilevanti per un problema specifico, per estrarre informazioni da un articolo e molto altro ancora.
  • Gemelli Pro è attualmente offerto nella versione 1.5. Rispetto al suo predecessore, può elaborare più dati, siano essi testo (circa 700.000 parole o 30.000 righe di codice), audio (fino a 11 ore di audio) o video (fino a un’ora) in un’ampia gamma di lingue. Ricorda che questo è il modello LLM che alimenta il chatbot Gemini AI di Google.
  • Gemelli Nano è una versione più leggera di entrambi i modelli. Abbastanza leggero da poter essere eseguito localmente su alcuni dispositivi, non richiede l’invio dell’attività a un server remoto. Al momento della stesura di questo articolo, è disponibile su Google Pixel 8 Pro dove alimenta alcune funzionalità AI (tra cui Smart Reply sulla tastiera Gboard e Riepiloga nell’app Registratore).

Dipende dal modello di Gemini a cui desideri accedere. Se è Gemini Nano, puoi trovarlo sul Pixel 8 Pro di Google. Tuttavia, si prevede che in futuro arriverà anche su altri dispositivi.

Per il resto, Gemini Pro è attualmente disponibile in più di 230 paesi e territori in tutto il mondo, inclusa la Francia. Puoi accedervi gratuitamente tramite il chatbot Gemini (ex Bard) da un browser web. Basta creare un account Google.

Gemini Ultra è anche abbastanza diffuso con disponibilità in più di 150 paesi al momento in cui scrivo. L’accesso è però a pagamento. Per utilizzare questo modello, dovrai abbonarti all’opzione Gemini Advanced che viene fatturata a $ 20 al mese. Ciò può essere fatto tramite un abbonamento Google One AI Premium, che include anche funzionalità di Google Workspace e 2 TB di spazio di archiviazione.

Infine, vale la pena notare che Gemini Pro e Gemini Ultra sono disponibili anche in servizi come Google Cloud Vertex AI (tramite API) e Google AI Studio.


Gemelli (Google Bardo)

Il tanto atteso Gemini (Google Bard), l’agente conversazionale basato sull’intelligenza artificiale e sviluppato da Google, verrà distribuito questo giovedì 13 luglio 2023 in Francia sotto forma di servizio online gratuito.

  • Download:
    4102
  • Data di rilascio :
    22/04/2024
  • Autore:
    Google
  • Licenza :
    Licenza gratuita
  • Categorie:

    AI

  • Sistema operativo :

    Android, servizio in linea

Pubblicità, i tuoi contenuti continuano di seguito

-

PREV LG mette fine a questa innovazione sorprendente ma troppo costosa
NEXT Migrazione federale a Microsoft 365 sotto il microscopio del controllo finanziario