Nuovo concorrente nel campo dell'intelligenza artificiale generativa con Whisk, un nuovo prodotto di Google. L'azienda afferma che il suo strumento è pensato per una rapida esplorazione visiva piuttosto che per modifiche precise: i risultati non sono perfetti, ma hanno funzionalità di modifica per correggere le imprecisioni.
Gli IA preferiscono Whisk-ASS?
Whisk è un recente esperimento di Google Labs che consente agli utenti di creare immagini utilizzando altre immagini come punto di partenza. Combinando il modello Imagen 3 con le capacità di comprensione visiva di Gemini, Whisk genera immagini uniche basate su argomenti, scene e stili forniti dall'utente. Questo strumento semplifica la visualizzazione e la ricomposizione delle idee in modi innovativi.
Se l’utente non dispone di immagini, Whisk può offrirgliele generate dall’intelligenza artificiale – in conclusione, le trappole del diritto d’autore vengono evitate molto moderatamente. Se lo desidera, l'utente aggiungerà anche ulteriori dettagli testuali.
Non vuoi prima un Whisk-Y?
Una volta forniti i suggerimenti, Whisk genera immagini e descrizioni di testo corrispondenti per ciascuno, consentendo agli utenti di salvarli, scaricarli o perfezionarli aggiungendo altro testo o modificando direttamente l'immagine.
Ovviamente, Whiksi si affida a Gemini che produrrà una descrizione delle immagini, prima di inserirle in Imagen 3, lo strumento di generazione delle immagini. “ In background, il modello Gemini genera automaticamente una descrizione dettagliata delle immagini fornite, che viene poi elaborata dal nuovissimo modello di generazione di immagini di Google, Imagen 3. Questo processo cattura l'essenza delle immagini fornite, consentendo di remixarle in modo creativo », indica l'azienda di Mountain View.
LEGGI – I lettori preferiscono la poesia dell’Intelligenza Artificiale
Questa soluzione è progettata per una rapida esplorazione visiva, piuttosto che per modifiche precise a livello di pixel. Ha lo scopo di incoraggiare la sperimentazione e la creatività consentendo agli utenti di testare rapidamente idee diverse e scaricare quelle che preferiscono.
Whisk utilizza il modello di generazione di immagini Imagen 3 di Google. Per testarlo sarà possibile farlo a questo indirizzo, in attesa del vostro turno, visto che lo strumento per il momento è disponibile solo negli Stati Uniti. Tieni presente che Google presto distinguerà le immagini generate o modificate dall’intelligenza artificiale nei suoi risultati di ricerca, indicandone chiaramente la provenienza.
READ – Il futuro dell'editoria: uno strumento AI che valuta la qualità dei libri
Crediti immagine: Google, Immagine 3
Di Clemente Solym
Contatto: [email protected]