Onnipresente, universale o generale: all’I/O 2024, Google vede l’intelligenza artificiale ovunque

Onnipresente, universale o generale: all’I/O 2024, Google vede l’intelligenza artificiale ovunque
Onnipresente, universale o generale: all’I/O 2024, Google vede l’intelligenza artificiale ovunque
-

Non si sveglia un gigante addormentato. Eppure, questo è ciò che OpenAI e la sua AI generativa ChatGPT hanno fatto due anni fa. Dopo aver recuperato terreno lo scorso anno, quest’anno Google passa all’offensiva e promette di implementare Gemini, la propria intelligenza artificiale, ovunque, ovunque, ovunque.

In ogni caso, questo è quanto emerge dal lungo discorso di apertura della conferenza Google I/O, destinata a creatori, programmatori e utilizzatori dei prodotti del colosso di Mountain View, che si è svolta martedì mattina in California. “Un anno fa abbiamo creato Gemini. Da allora, abbiamo fatto di tutto affinché tutti possano usarlo. Oggi lo usano più di 2 miliardi di persone”, ha sintetizzato sul palco il CEO di Google e Alphabet, Sundar Pichai.

IA “multimodale”.

Abbiamo detto ovunque? Ci sarà un’app Gemini migliorata per Android. Ci saranno i Gemelli nei messaggi di testo di Google. Esistono strumenti per la creazione di musica Gemini. Esistono anche strumenti Gemini per generare video HD rivolti ai professionisti dell’immagine. E, naturalmente, Gemini alimenterà una nuova versione del motore di ricerca di Google: il suo pane, burro e, ovviamente, i soldi degli altri.

La ricerca online basata sull’intelligenza artificiale di Gemini è la risposta di Google alle pressioni che provengono da tutte le parti da almeno un anno. Innanzitutto, il suo rivale californiano OpenAI prevede di lanciare da un giorno all’altro il proprio motore di ricerca, che dovrebbe minacciare la sua egemonia. Un’egemonia già erosa da algoritmi sempre meno compresi dai professionisti del web, il cui unico compito è posizionare i propri siti il ​​più in alto possibile nei risultati dei motori di ricerca.

Lanciata in versione beta lo scorso anno, la funzione di riepilogo dei consigli sui prodotti AI sta diventando una realtà per gli utenti Internet situati negli Stati Uniti. Questo strumento riassume la maggior parte delle recensioni e dei commenti fatti sui prodotti o servizi che i consumatori intendono acquistare. Nei suoi test, Google afferma che non solo gli acquirenti trovano più facilmente il prodotto giusto, ma che i siti conformi a questa nuova formula “generano più clic che se la loro pagina fosse semplicemente apparsa in un elenco di risultati”.

Anche la ricerca più tradizionale di riferimenti web verrà migliorata, promette Google. I risultati possono essere perfezionati e formattati in base a un contesto specifico e a domande più sfumate.

Google promette anche la multimodalità: sarà possibile continuare la stessa ricerca passando da un dispositivo all’altro. Il colosso di Mountain View ha addirittura presentato una simulazione in cui il suo motore di ricerca crea da zero un podcast che risponde oralmente a una domanda scritta da un giovane internauta. Due voci create da zero gli spiegano come Isaac Newton schematizzò la gravità utilizzando riferimenti presi dal basket, sport che il giovane amava.

“Abbiamo costruito un’immensa conoscenza composta da miliardi di dettagli su persone, luoghi e cose, in modo che tu possa ottenere le informazioni affidabili di cui hai bisogno in un batter d’occhio”, promette la responsabile della ricerca di Google, Liz Reid.

Dall’intelligenza artificiale ai tuoi occhiali

OpenAI sogna un’intelligenza artificiale generale che unisca tutta la conoscenza umana in un unico assistente digitale. L’azienda, il cui valore contabile in questi giorni raggiunge gli 80 miliardi di dollari, secondo alcuni, ha presentato il proprio aggiornamento strategico lunedì, il giorno prima di Google I/O. Ha introdotto GPT-4o, la versione “omni” (da qui la “o”) del suo modello linguistico avanzato GPT-4. Questo nuovo strumento sarà accessibile più rapidamente e a un costo inferiore dai creatori che cercano un’intelligenza artificiale generativa da integrare nelle loro applicazioni. GPT-4o può “ragionare con voce, immagine o testo”, promette OpenAI.

Google ha più o meno la stessa visione, che si chiama Project Astra. “Per essere veramente utile, un agente AI deve comprendere il mondo che ci circonda, e ricordare ciò che vede e sente, per dargli il giusto contesto in cui agire”, hanno spiegato sul palco Eli Collins e Doug Eck, rispettivamente direttore dei prodotti e direttore senior della ricerca per Google. “È facile immaginare un futuro prossimo in cui un assistente esperto sarà sempre con te, nel tuo telefono o nei tuoi occhiali. »

Sì, nei tuoi occhiali, la nuova frontiera del mondo informatico, a quanto pare. “Le persone dovrebbero poter parlare con il proprio assistente in modo naturale, senza ritardi”, aggiunge Google. Sapevamo già che Google voleva lanciare nuovi occhiali per realtà mista, improvvisamente ci chiediamo se i defunti Google Glass emergeranno presto dal cimitero dei tanti prodotti Google che fino ad ora consideravamo un fallimento.

Nel frattempo Google intende attirare persone e PMI che hanno già adottato ChatGPT (o anche Copilot in Microsoft), con una versione rinnovata di Gemini che è già online. Gemini 1.5 è più raffinato e potrà adottare ruoli, e dare una personalità precisa al dialogante (chatbot) che fornisce assistenza clienti per siti web commerciali.

I Gemelli potranno vivere anche su un telefono, come il Pixel 8a appena rilasciato da Google questa settimana. I suoi utenti potranno avviare una discussione con l’IA sul proprio telefonino, poi spostarla su un PC, o altrove, per iscritto o oralmente, e richiedere una risposta vocale, scritta o perché no, sotto forma di immagine . Sundar Pichai cita un esempio di utilizzo in cui una persona guarda le foto di una giovane ragazza che nuota in una piscina. Quindi chiede all’IA: “A che età ha iniziato a nuotare?” Come sono stati i suoi progressi? »

L’IA, in questo scenario, può rispondere dalle immagini che ha di fronte e da altre fonti di informazioni personali che ha raccolto altrove. “I Gemelli saranno ora in grado di comprendere il mondo come lo fanno le persone, non solo attraverso il testo, ma attraverso la visione, il suono e il linguaggio”, spiegò in seguito Eli Collins.

Ciò solleverà sicuramente domande sulla privacy, un argomento poco discusso durante il discorso di apertura di Google.

Non importa. Se dipendesse da Google, l’intelligenza artificiale sarebbe ovunque.

Le spese di spedizione e sistemazione per questo articolo sono state pagate da Google Canada.

Da vedere in video

-

PREV VMware fa una nuova concessione: gli hypervisor desktop Workstation Pro e Fusion Pro saranno ora gratuiti per uso personale
NEXT Verniolle. Nuova serata teatrale al Relais de Poche