Contributo di La conversazione. Cosa sappiamo delle emissioni di gas serra di Netflix?

Contributo di La conversazione. Cosa sappiamo delle emissioni di gas serra di Netflix?
Contributo di La conversazione. Cosa sappiamo delle emissioni di gas serra di Netflix?
-

In considerazione degli sforzi significativi che il settore delle tecnologie dell’informazione e della comunicazione (ICT) deve compiere per abbandonare un trend di forte crescita delle emissioni di gas serra (+45% entro il 2030) verso una traiettoria di riduzione significativa (-45% rispetto al stesso periodo), tutti gli aspetti del digitale devono necessariamente mettere in discussione il loro contributo a questa tendenza. In questo senso è interessante mappare e stimare i loro impatti ambientali per costruire una società sostenibile.

Come mostra il grafico seguente, i video online rappresentano la maggior parte del traffico Internet a livello globale.

Il video viene quindi spesso individuato come una delle principali cause degli impatti ambientali della tecnologia digitale e se ne discute, ad esempio, nel rapporto 2019 di The Shift Project sull’insostenibilità dei video online. Ma al di là della TV e di altri terminali di visualizzazione, cosa sappiamo della materialità dietro la visione di un film o di una serie su video on demand (VoD)? A cosa serve effettivamente questa attrezzatura?

Esistono poche informazioni pubbliche sulle architetture molto complesse gestite dai fornitori di servizi VoD e sul loro dimensionamento. Tuttavia, abbiamo tentato un’analisi approssimativa del servizio Netflix. Quest’ultimo è infatti uno dei più utilizzati e ha il pregio di rendere accessibili alcune informazioni riguardanti il ​​suo funzionamento. Questa piattaforma è solo un esempio e l’obiettivo non è in alcun modo prendere di mira specificamente questa azienda.

Attraverso le informazioni raccolte attraverso diverse fonti (report di attività, video di convegni tecnici, articoli di blog), illustriamo la difficoltà di mappare le diverse parti dell’architettura di un servizio VoD, lavoro tuttavia essenziale prima di effettuare una quantificazione dell’impatto ambientale impatti di tale servizio.

Sebbene il consumo di elettricità non comprenda tutti gli impatti ambientali, è una delle informazioni rese pubbliche da Netflix, come mostrato nella figura seguente. Il 2019 è l’unico anno per il quale viene fornita una stima del consumo dei server gestiti da terze parti.

Streaming video, come funziona?

La parte più semplice da spiegare di questo consumo riguarda la rete di distribuzione dei contenuti (CDN). Si tratta di un’infrastruttura con diverse decine di migliaia di server per Netflix sparsi in tutto il mondo e che ospitano i titoli più popolari del catalogo vicino agli utenti. Alcuni di questi server sono ospitati direttamente nei data center dei fornitori di servizi Internet (ISP) e sfuggono quindi al consumo energetico preciso riportato da Netflix.

Gli ISP infatti dispongono di propri data center, al fine di consentire la fornitura di traffico Internet di qualità riducendo la pressione sulle infrastrutture di rete.

Pertanto, quando un utente accede a contenuti video online, in realtà è molto spesso su una CDN che tali contenuti sono ospitati. Questi dati attraversano tutte le infrastrutture di rete (cavi, antenne, apparecchiature di instradamento, ecc.) necessarie per connettere questa CDN all’utente, senza dimenticare il suo Internet box ed eventualmente altre apparecchiature (switch, ripetitore wifi, TV box, ecc.) a cui il terminale dove viene visualizzato il video.

Il resto del consumo di server di terze parti riguarda l’utilizzo di Amazon Web Services (AWS) per tutte le operazioni a monte della distribuzione dei contenuti video stessi. Ciò rappresenta un utilizzo costante di diverse centinaia di migliaia di macchine virtuali (più di centomila nel 2016) oltre alle esigenze di storage.

Infatti, una volta prodotto, il video viene prima archiviato in forma grezza e non compressa. Viene poi codificato in un centinaio di versioni diverse per offrire la migliore qualità di esperienza dell’utente qualunque siano le caratteristiche del terminale e del suo schermo (più di 1500 tipi di apparecchiature supportate), la qualità della rete Internet e il sistema operativo utilizzato . La codifica video richiede quindi diverse centinaia di migliaia di CPU in parallelo.

Queste molteplici versioni sono duplicate su più server all’interno di data center dislocati in diverse aree geografiche (3 per Netflix nel 2016) per ragioni di sicurezza e per garantire l’accesso ai contenuti in tutto il mondo.

Il volto nascosto del VoD

I modelli di business delle piattaforme VoD si basano sulla ritenzione dell’attenzione e sul numero di abbonati o visualizzazioni. Prima di poter visualizzare i contenuti video, l’utente naviga innanzitutto nella piattaforma, dalla home page alla scelta dei contenuti. Tale navigazione è personalizzata per ciascun utente e si basa su meccanismi di cattura e fidelizzazione dell’attenzione che richiedono la raccolta, la conservazione e l’elaborazione di numerosi dati personali e di utilizzo. Tutta una parte dell’infrastruttura, e quindi dell’impronta ambientale, è quindi legata non alla distribuzione di video, ma alla personalizzazione dell’esperienza dell’utente.

L’insieme dei dati che permettono l’implementazione di questi meccanismi viene comunemente chiamato “datahub”. È costituito dai dati raccolti dalla piattaforma (dati utente e dati di utilizzo), aggregati con dati provenienti da altre fonti nella catena del valore di Netflix: inserzionisti, fornitori di servizi di pagamento, fornitori di servizi, fornitori di misurazione dell’audience, recensioni di contenuti, social network, ecc. Netflix è, ad esempio, membro della Digital Advertising Alliance.

Questo datahub è di dimensioni notevoli, nel 2016 per 89 milioni di account conteneva 60 PB (1 petabyte = 1 milione di GB) di dati. Non è aberrante immaginare che sarà ancora più importante oggi con 260 milioni di abbonati nel 2023.

D’altro canto, la dimensione del catalogo di Netflix è stimata tra le 50.000 e le 60.000 ore di visualizzazione. In questo articolo parliamo di 470 GB all’ora di video raw, il che corrisponde a un catalogo non codificato di circa 25 PB, ovvero la metà del datahub del 2016. Intuitivamente, però, ci aspetteremmo che il catalogo video raw rappresenti una quota maggiore dei requisiti di archiviazione rispetto ai dati di utilizzo.

A questo volume di dati si aggiungono i flussi video e i dati prodotti in relazione alle riprese e al montaggio dagli stessi studi Netflix, che rappresentano circa 100 PB all’anno.

A sostegno del loro modello economico, il volume delle produzioni originali è in forte crescita, così come gli impatti ambientali associati, che rappresentano più della metà delle emissioni di gas serra di Netflix.

Al di là della memorizzazione, ogni azione sulla piattaforma (cerca, clicca su play, ecc.) genera un evento elaborato da Netflix, erano 500 miliardi al giorno nel 2016. Questa acquisizione di dati viene utilizzata ad esempio per la generazione di una home page personalizzata per ogni account utente. Quest’ultimo richiederebbe un totale di oltre 22.000 server virtuali ospitati presso AWS e lo storage di oltre 14,3 PB di dati per la gestione di una cache dinamica denominata EVCache.

Tra gli elementi di personalizzazione dell’esperienza dell’utente c’è ovviamente il contenuto offerto, ma anche il modo in cui viene presentato con la personalizzazione delle miniature utilizzate, o addirittura l’uso di “Dynamic Sizzles”, generazione di video personalizzati che aggregano contenuti da diversi film o serie.

Questi meccanismi di mantenimento dell’attenzione si basano sull’uso di algoritmi di apprendimento automatico continuo sempre più avanzati, che richiedono sia grandi quantità di dati che potenza di calcolo. Per ovvi motivi di aggiornamento, questi algoritmi vengono addestrati in modo incrementale. La generalizzazione del loro utilizzo provoca necessariamente un aumento dei dati acquisiti, elaborati e archiviati, aumentando così gli impatti ambientali associati.

A tutti questi dati bisogna aggiungere le policy di backup necessarie per il ripristino del business in caso di incidente. Vengono applicati a ogni livello di questa architettura, il che può portare a una duplicazione più o meno significativa di tutti questi contenuti. Da notare che Netflix implementa anche sofisticate metodologie di purificazione dei dati, sia per quanto riguarda la cache che il datahub e i dati prodotti dagli studi.

“Solo” un video?

Pertanto, guardare un video online comporta molti passaggi e dati generati ben oltre il contenuto video stesso. L’ottimizzazione estrema dell’esperienza utente si basa su risorse hardware significative rispetto alla semplice visione di video. La mancanza di informazioni disponibili sul completo funzionamento delle piattaforme e delle infrastrutture associate rende rischioso in questa fase valutare gli impatti ambientali della loro attività rispetto ai limiti planetari da parte di un terzo indipendente.

Qualcuno potrebbe ribattere che questi impatti, se paragonati al numero di abbonati, sarebbero senza dubbio trascurabili rispetto a molti altri consumi. Ad esempio, per il 2019, il consumo energetico dei server utilizzati da Netflix rappresenta solo circa 2,3 kWh/anno per abbonato. Questa cifra può sembrare insignificante, o addirittura in contraddizione con i dati relativi al consumo energetico dei data center nel mondo forniti dall’Agenzia internazionale per l’energia, che rappresenterebbero approssimativamente il consumo di elettricità di un paese come l’Italia o il Regno Unito. Ciò illustra una difficoltà con le tecnologie dell’informazione e della comunicazione (TIC), che è un settore composto da una miriade di servizi, ciascuno apparentemente insignificante, ma la cui somma di impatti è preoccupante. In altre parole, la riduzione complessiva degli impatti ambientali delle ICT comporta necessariamente una miriade di “piccoli guadagni”. Nel contesto dello streaming video, Netflix è solo uno dei servizi VoD tra tutta una serie di fornitori e nuove modalità di condivisione video peer-to-peer o tramite social network.

Il video on demand può diventare sostenibile?

Per rispettare un percorso di riduzione degli impatti ambientali del settore dei video online, possiamo legittimamente chiederci come sarebbe una piattaforma VoD compatibile con un percorso ambientale sostenibile. L’analisi precedente solleva almeno quattro principali aree di riduzione:

  • il compromesso da raggiungere tra il peso (risoluzione massima e numero di varianti) dei video codificati (che incide sui requisiti di calcolo, archiviazione e trasmissione) e la qualità effettivamente percepita dagli utenti,
  • mettere in discussione la personalizzazione dell’esperienza all’estremo,
  • la necessità di elevate prestazioni (in termini di qualità del servizio, disponibilità, ecc.) per un servizio di intrattenimento,
  • e, infine, il ritmo di produzione di nuovi contenuti.

Oltre alle questioni ambientali, gli algoritmi di raccomandazione alla base di queste piattaforme VoD sollevano anche molte questioni etiche e democratiche.

-

NEXT Per abbassare i prezzi dell’elettricità, il prossimo governo dovrà cambiare le regole