Il testo che segue proviene da un comunicato stampa e non riflette in alcun modo l’opinione della redazione.
Secondo IDC, oltre il 40% della spesa IT tra le aziende Forbes Global 2000 sarà destinata a iniziative legate all’intelligenza artificiale. IDC prevede inoltre che l’uso di tecnologie di automazione e intelligenza artificiale generativa potrebbe consentire un aumento di produttività di 1.000 miliardi di dollari entro il 2026. Red Hat prevede che questi investimenti richiedono una piattaforma solida in grado di gestire il ciclo di vita dei modelli AI/ML e di implementare applicazioni di intelligenza artificiale generativa insieme ai carichi di lavoro esistenti. nel cloud ibrido.
Caratteristiche principali di OpenShift AI 2.15
–Salvataggio di modelli : gestione centralizzata per la condivisione, il tracciamento e il versioning dei modelli di IA generativa, con supporto multi-registro. Red Hat ha affidato questo progetto alla comunità Kubeflow.
–Rilevamento della deriva dei dati : Monitoraggio continuo dei dati di input per identificare le discrepanze tra i dati di addestramento e i dati di produzione, migliorando l’affidabilità e l’accuratezza del modello.
–Rilevamento dei bias : strumenti per monitorare l’equità e la trasparenza dei modelli, essenziali per costruire fiducia nell’IA, dalla community TrustyAI.
–Ottimizzazione con LoRA : utilizzo di adattatori di basso rango (LoRA) per un adeguamento efficiente dei modelli linguistici (LLM), riducendo i costi e il fabbisogno di risorse.
–Supporto NIM NVIDIA : accelera l’implementazione di applicazioni di intelligenza artificiale generativa tramite microservizi accessibili e integrati nella piattaforma NVIDIA AI Enterprise.
–Supporto della GPU AMD : nuove opzioni per lo sviluppo, il training e l’ottimizzazione dei modelli con GPU AMD, ideali per ottimizzare le prestazioni per carichi di elaborazione intensivi.
Distribuzione del modello migliorata
Red Hat OpenShift AI 2.15 migliora l’implementazione di modelli di intelligenza artificiale generativa con nuove funzionalità come il runtime vLLM per Kserve e il supporto per Kserve ModelCars. Queste aggiunte consentono l’uso di repository conformi alla Open Container Initiative (OCI) per archiviare e gestire facilmente modelli containerizzati. Inoltre, le opzioni di percorso privato e pubblico per gli endpoint Kserve migliorano la sicurezza consentendo il targeting degli endpoint interni.
Rafforzamento della formazione e della sperimentazione dell’IA
Questo aggiornamento AI di OpenShift migliora le pipeline di data science e il monitoraggio degli esperimenti con progressi intelligenti. La regolazione degli iperparametri tramite Ray Tune aumenta la precisione accelerando al contempo l’addestramento di modelli predittivi e generativi. L’aggiunta di immagini containerizzate di base ai cluster Ray semplifica la distribuzione delle attività di formazione e ottimizzazione su più carichi di lavoro all’interno del cluster. Ciò non solo riduce i tempi di elaborazione ma massimizza anche l’utilizzo dei nodi disponibili.
Disponibilità
Red Hat OpenShift AI 2.15 è disponibile da metà novembre 2024.