Condividi tramite


Panoramica della distribuzione di un cluster Ray in servizio Azure Kubernetes (AKS)

Questo articolo illustra come distribuire un cluster Ray in servizio Azure Kubernetes usando l'operatore KubeRay. Si apprenderà anche come usare il cluster Ray per eseguire il training di un semplice modello di Machine Learning e visualizzare i risultati in Ray Dashboard.

Importante

Il software open source è citato nella documentazione e negli esempi di Azure Kubernetes. Il software distribuito viene escluso dai contratti di servizio del servizio Azure Kubernetes, dalla garanzia limitata e supporto tecnico di Azure. Quando si usa la tecnologia open source insieme al servizio Azure Kubernetes, consultare le opzioni di supporto disponibili dalle rispettive community e dai gestori di progetti per sviluppare un piano.

Microsoft si assume la responsabilità di creare i pacchetti open source distribuiti nel servizio Azure Kubernetes. Tale responsabilità include la proprietà completa del processo di compilazione, analisi, firma, convalida e hotfix, oltre al controllo sui file binari nelle immagini del contenitore. Per altre informazioni, vedere Gestione delle vulnerabilità per il servizio Azure Kubernetes (AKS) e Copertura del supporto del servizio Azure Kubernetes (AKS).

Che cos’è Ray?

Ray è un progetto open source sviluppato presso UC Berkeley's RISE Lab che fornisce un framework unificato per il ridimensionamento di applicazioni per intelligenza artificiale e Python. È costituito da un runtime distribuito di base e da un set di librerie di intelligenza artificiale progettate per accelerare i carichi di lavoro di Machine Learning.

Ray semplifica il processo di esecuzione di attività Python a elevato utilizzo di calcolo su larga scala, consentendo di ridimensionare facilmente le applicazioni. Il framework supporta varie attività di Machine Learning, tra cui il training distribuito, l'ottimizzazione degli iperparametri, l'apprendimento per rinforzo e la gestione del modello di produzione.

Per altre informazioni, vedere il repository GitHub Ray.

Che cos'è KubeRay?

KubeRay è un operatore Kubernetes open source per la distribuzione e la gestione di cluster Ray in Kubernetes. KubeRay automatizza la distribuzione, il ridimensionamento e il monitoraggio dei cluster Ray. Offre un modo dichiarativo per definire cluster Ray usando risorse personalizzate Kubernetes, semplificando la gestione dei cluster Ray insieme ad altre risorse Kubernetes.

Per altre informazioni, vedere il repository GitHub KubeRay.

Processo di distribuzione Ray

Il processo di distribuzione è costituito dai passaggi seguenti:

  1. Usare Terraform per creare un file di piano locale per definire lo stato desiderato per l'infrastruttura richiesta del servizio Azure Kubernetes costituito da un gruppo di risorse di Azure, da un pool di nodi di sistema dedicato e da un pool di nodi del carico di lavoro per Ray con tre nodi.
  2. Distribuire un piano Terraform locale in Azure.
  3. Recuperare gli output dalla distribuzione terraform e ottenere le credenziali kubernetes nel cluster del servizio Azure Kubernetes appena distribuito.
  4. Installare il repository Helm Ray e distribuire KubeRay nel cluster del servizio Azure Kubernetes usando Helm.
  5. Scaricare ed eseguire un manifesto YAML del processo Ray dal repository degli esempi di Ray GitHub per eseguire una classificazione delle immagini con un set di dati MNIST usando reti neurali convoluzionali (CNN).
  6. Eseguire l'output dei log dal processo Ray per ottenere informazioni dettagliate sul processo di Machine Learning eseguito da Ray.

Passaggio successivo

Collaboratori

Microsoft gestisce questo articolo. I collaboratori seguenti l'hanno originariamente scritto:

  • Russell de Pina | Responsabile TPM
  • Ken Kilty | Responsabile TPM
  • Erin Schaffer | Sviluppatore di contenuti 2
  • Adrian Joian | Ingegnere Capo del Cliente
  • Ryan Graham | Specialista tecnico principale