Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In diesem Artikel erfahren Sie, wie Sie mit dem KubeRay-Operator einen Ray-Cluster in Azure Kubernetes Service (AKS) bereitstellen. Außerdem erfahren Sie, wie Sie den Ray-Cluster verwenden, um ein einfaches Machine Learning-Modell zu trainieren und die Ergebnisse im Ray-Dashboard anzuzeigen.
Wichtig
Open-Source-Software wird überall in AKS-Dokumenten und -Beispielen erwähnt. Software, die Sie bereitstellen, ist von AKS-Vereinbarungen zum Servicelevel, der eingeschränkten Garantie und dem Azure-Support ausgeschlossen. Wenn Sie Open-Source-Technologie zusammen mit AKS nutzen, nutzen Sie die Supportoptionen, die von den jeweiligen Communitys und Projektbetreuenden angeboten werden, um einen Plan zu entwickeln.
Das GitHub-Repository von Ray beschreibt z. B. mehrere Plattformen, die in Antwortzeit, Zweck und Supportebene variieren.
Microsoft übernimmt die Verantwortung für die Erstellung der Open-Source-Pakete, die wir in AKS bereitstellen. Diese Verantwortung schließt den vollständigen Besitz des Build-, Scan-, Signatur-, Validierungs- und Hotfixprozesses sowie die Kontrolle über die Binärdateien in Containerimages ein. Weitere Informationen finden Sie unter Sicherheitsrisikomanagement für AKS und AKS-Supportabdeckung.
Was ist Ray?
Ray ist ein Open-Source-Projekt, das im RISE Lab der UC Berkeley entwickelt wurde und ein einheitliches Framework für die Skalierung von KI- und Python-Anwendungen bietet. Es besteht aus einer zentralen verteilten Runtime und einer Gruppe von KI-Bibliotheken, die zur Beschleunigung von Workloads des maschinellen Lernens entwickelt wurden.
Ray vereinfacht den Prozess der Ausführung rechenintensiver Python-Aufgaben im großen Stil, sodass Sie Ihre Anwendungen nahtlos skalieren können. Das Framework unterstützt verschiedene Aufgaben maschinellen Lernens, einschließlich verteilten Trainings, Hyperparameteroptimierung, Verstärkung des Trainings und des Bereitstellens von Produktionsmodellen.
Weitere Informationen finden Sie im GitHub-Repository für Ray.
Was ist KubeRay?
KubeRay ist ein Open-Source-Kubernetes-Operator für die Bereitstellung und Verwaltung von Ray-Clustern in Kubernetes. KubeRay automatisiert die Bereitstellung, Skalierung und Überwachung von Ray-Clustern. Es bietet eine deklarative Möglichkeit zum Definieren von Ray-Clustern mit benutzerdefinierten Kubernetes-Ressourcen, wodurch es einfach ist, Ray-Cluster zusammen mit anderen Kubernetes-Ressourcen zu verwalten.
Weitere Informationen finden Sie im GitHub-Repository für KubeRay.
Ray-Bereitstellungsvorgang
Der Bereitstellungsvorgang besteht aus den folgenden Schritten:
- Erstellen Sie mit Terraform eine lokale Plandatei, um den gewünschten Zustand für die erforderliche AKS-Infrastruktur zu definieren, die aus einer Azure-Ressourcengruppe, einem dedizierten Systemknotenpool und einem Workloadknotenpool für Ray mit drei Knoten besteht.
- Stellen Sie einen lokalen Terraform-Plan in Azure bereit.
- Rufen Sie Ausgaben aus der Terraform-Bereitstellung ab, und erhalten Sie Kubernetes-Anmeldeinformationen für den neu bereitgestellten AKS-Cluster.
- Installieren Sie das Helm-Ray-Repository, und stellen Sie KubeRay mithilfe von Helm im AKS-Cluster bereit.
- Laden Sie ein YAML-Manifest für einen Ray-Auftrag aus dem GitHub-Beispiel-Repository für Ray herunter, um eine Bildklassifizierung mit einem MNIST-Dataset mithilfe von Convolutional Neural Networks (CNNs) durchzuführen.
- Geben Sie die Protokolle aus dem Ray-Auftrag aus, um Erkenntnisse zu dem Prozess des maschinellen Lernens zu erhalten, der von Ray durchgeführt wird.
Nächster Schritt
Beitragende
Microsoft pflegt diesen Artikel. Die folgenden Mitwirkenden haben es ursprünglich geschrieben:
- Russell de Pina | Principal TPM
- Ken Kilty | Principal TPM
- Erin Schaffer | Content Developer 2
- Adrian Joian | Principal Customer Engineer
- Ryan Graham | Principal Technical Specialist
Azure Kubernetes Service