Lo sviluppo di LLM, la replicazione dei dati e l’estensione dei periodi di conservazione dei dati aumentano in modo molto significativo i requisiti di archiviazione. Ciò richiede un aumento degli investimenti
in questa zona.
Secondo gli intervistati dell’ultimo sondaggio Seagate condotto da Recon Analytics, lo storage è il secondo componente più importante di un’infrastruttura AI, dopo la sicurezza. Un risultato che non dovrebbe sorprendere per un importante fornitore di supporti di memorizzazione. Da notare che le aziende a cui appartengono gli intervistati riportano un fatturato annuo superiore a 10 milioni di dollari e una capacità di storage attuale superiore a 50 TB.
Dallo studio è emerso che sei acquirenti di soluzioni su dieci utilizzano principalmente lo storage cloud per la gestione dei dati AI e si aspettano che le esigenze di storage raddoppieranno almeno entro il 2028. Ci sono tre ragioni per questo. Da un lato, il periodo di conservazione dei dati è più lungo, da sei mesi a diversi anni. D’altro canto, il 73% dei membri del panel utilizza checkpoint LLM giornalieri o settimanali per archiviare parametri critici. Infine, l’80% degli intervistati ritiene che la replica dei dati per l’intelligenza artificiale sia molto o moderatamente importante.
Tra gli intervistati che eseguono quotidianamente il backup dei checkpoint, ovvero il 28% degli intervistati, quasi uno su tre conserva i dati per più di 12 mesi, mentre il 29% degli intervistati li conserva per 6-12 mesi.
Maggiore utilizzo del cloud per soddisfare le esigenze
Il grafico seguente mostra le soluzioni adottate per rispondere alle crescenti esigenze di storage dovute all’uso dell’intelligenza artificiale, in base ai ricavi. Insomma, il cloud viene utilizzato soprattutto dalle aziende il cui fatturato è compreso tra 1 miliardo e 500 milioni di dollari.
Fonte del grafico: analisi di ricognizione
Secondo lo studio, si prevede che il cloud storage rimarrà il principale vettore di archiviazione per l’intelligenza artificiale, con il 65% dei dati archiviati nel “cloud” anziché internamente nel 2024
e il 69% nel 2028. Si prevede che le esigenze di storage raddoppieranno nei prossimi tre anni in modalità ibrida o on-premise.
La maggior parte delle aziende che registrano e salvano i checkpoint lo fanno su base giornaliera o settimanale sul cloud. Ciò riguarda le organizzazioni che gestiscono più di 100 PB di dati, considerando che la replica dei dati migliora in modo molto significativo i risultati dell’intelligenza artificiale.
Il fabbisogno energetico aumenta di conseguenza
Tuttavia, un quarto degli intervistati ritiene che la sicurezza sia una priorità, seguito dal 18% per lo storage. Due su tre elencano lo storage tra le quattro principali preoccupazioni relative alle infrastrutture. Si noti che anche il consumo di energia dovuto all’intelligenza artificiale sta crescendo drasticamente, insieme all’aumento delle capacità di stoccaggio, un punto che non può essere trascurato e isolato da una questione ambientale e tecnica globale.
Un modo per ridurre il volume dei dati archiviati è eliminare i numerosissimi dati inutilizzabili. Un lavoro di governance dei dati che deve essere svolto seriamente dagli interessati.