DayFR Italian

[Màj] Microsoft nega categoricamente l’utilizzo dei documenti Office per formare i propri LLM

-

Aggiornamento del 29 novembre: Microsoft ci ha risposto, con spiegazioni più chiare di quelle già indicate ad altri: ” Queste affermazioni sono false. Microsoft non utilizza i dati dei clienti provenienti dalle applicazioni aziendali e consumer di Microsoft 365 per addestrare modelli LLM (Large Language Model) di base. In alcuni casi, i clienti possono acconsentire all’utilizzo dei propri dati per soddisfare esigenze specifiche, come lo sviluppo di modelli personalizzati, su espressa richiesta di alcuni clienti professionali. »

L’azienda aggiunge che “ Un’impostazione in Microsoft 365 chiamata “Connected Experiences” a cui alcuni hanno fatto riferimento di recente non ha nulla a che fare con il modo in cui Microsoft addestra modelli linguistici di grandi dimensioni e fondamentali “. Ricorda il funzionamento delle Connected Experiences (che esistono da aprile 2019), che abbiamo spiegato nella prima versione di questo articolo.

Articolo originale del 28 novembre: Microsoft ha avuto un problema da diversi giorni. Il 24 novembre l’account NixCraft, seguito da più di 374.000 iscritti, ha pubblicato un messaggio di avviso su X:

« Microsoft Office, come molte aziende negli ultimi mesi, ha abilitato subdolamente una funzione di “opt-out” che cattura i tuoi documenti Word ed Excel per addestrare i suoi sistemi interni di intelligenza artificiale. Questa funzione è abilitata per impostazione predefinita ed è necessario deselezionare manualmente una casella per disabilitarla. Se sei uno scrittore che utilizza MS Word per scrivere contenuti proprietari (post di blog, romanzi o qualsiasi altro lavoro che intendi proteggere e/o vendere), ti consigliamo di disattivare immediatamente questa funzione. »

Di che funzione si tratta? Esperienze connesse. Tuttavia, questi esistono da molto tempo. Sul suo sito, Microsoft elenca questi famosi esperimenti. Contengono tutto ciò che direttamente o indirettamente si riferisce a una funzione online all’interno delle applicazioni Office. Tra queste funzioni troviamo l’eventuale richiamo a dati esterni, la dettatura, il Writing Assistant (quindi la correzione ortografica e grammaticale), la lettura ad alta voce, il controllo di similarità, la trascrizione di registrazioni o anche la co-creazione di documenti.

Queste funzionalità sono disponibili nelle versioni Windows e Mac di Office, nonché nelle versioni online della suite per ufficio.

Analisi dei dati versus formazione

In breve tempo, la pubblicazione su X ha suscitato molte reazioni indignate, ma non solo. Voci hanno cominciato a sottolineare che le Connected Experiences non erano una novità e che questo utilizzo dei dati per scopi di formazione LLM non era stato menzionato.

Nella sua informativa sulla privacy, Microsoft indica che i dati possono essere utilizzati a fini di analisi, in modo che le funzioni richiamate possano avere il loro effetto. D’altra parte, non vi è alcuna indicazione che vengano recuperati per modelli linguistici di grandi dimensioni, a differenza di altri servizi come Copilot o LinkedIn.

Microsoft risponde, ma…

Per sedare il dibattito, Microsoft ha risposto per la prima volta a NixCraft il 25 novembre: “ Nelle applicazioni M365, non utilizziamo i dati dei clienti per addestrare i LLM. Questa impostazione abilita solo le funzioni che richiedono l’accesso a Internet, come la creazione condivisa di un documento “. La società ha aggiunto il collegamento che elenca le esperienze connesse.

Allo stesso tempo, ha comunicato a diversi americani un messaggio che voleva fosse altrettanto chiaro: “ Microsoft non utilizza i dati dei clienti provenienti dalle applicazioni consumer e commerciali di Microsoft 365 per addestrare modelli linguistici di grandi dimensioni. Inoltre, l’impostazione Servizi connessi non ha nulla a che fare con il modo in cui Microsoft addestra modelli linguistici di grandi dimensioni ».

A seconda del sito è possibile trovare più o meno informazioni aggiuntive. A How-To Geek, un portavoce ha aggiunto: ” L’impostazione Servizi connessi è un’impostazione standard del settore che abilita funzionalità che richiedono una connessione Internet. Le esperienze connesse svolgono un ruolo importante nel migliorare la produttività integrando i tuoi contenuti con le risorse disponibili sul Web ».

Ma l’azienda è variata anche nelle sue dichiarazioni. A The Register, ha detto: “ Nelle applicazioni consumer e commerciali di Microsoft 365, Microsoft non utilizza i dati dei clienti per addestrare modelli linguistici di grandi dimensioni senza la loro autorizzazione ».

Partecipare? Decidere di uscire? Mancanza di chiarezza?

Abbiamo contattato Microsoft per chiarimenti su questa affermazione. Allo stato attuale, non sappiamo davvero cosa intendesse l’azienda. Questo potrebbe essere un semplice problema di comunicazione o addirittura un’opzione. In questo caso, si tratta di un’impostazione di partecipazione o di rinuncia?

Si può facilmente verificare cosa è abilitato in Office. In Windows, dal menu File di una delle applicazioni, devi andare al pannello Account. Da lì, facciamo clic su Gestisci impostazioni. Si apre una finestra in cui è possibile scorrere le impostazioni proposte. Poco più in basso troviamo l’opzione legata a Connected Experiences, che “ analizzare i tuoi contenuti “. È abilitato per impostazione predefinita.

Ricorda che puoi vedere anche tutte le impostazioni di riservatezza dell’account Microsoft da questa pagina (devi effettuare il login).

Aggiorneremo questa notizia quando l’azienda ci risponderà.

Related News :