Maschinelles Lernen auf Azure Databricks

Erstellen, Bereitstellen und Verwalten von Machine Learning-Anwendungen auf Azure Databricks. Die integrierte Plattform vereint den gesamten ML-Lebenszyklus von der Datenvorbereitung bis zur Produktionsüberwachung.

Sie suchen generative KI und KI-Agenten? Siehe Build AI Agents auf Azure Databricks.

Get started

Probieren Sie eine Schnellstartanleitung aus, bereiten Sie Ihre Daten vor, oder erstellen Sie ein Low-Code-Modell.

Guide Description
Erste Schritte: Erstellen Ihres ersten Machine Learning-Modells auf Databricks Erstellen Sie mit scikit-learn ein einfaches End-to-End-Klassifizierungsmodell.
AutoML Erstellen Sie automatisch hochwertige Modelle mit minimalem Code mit automatisiertem Feature engineering und Hyperparameter-Tuning.
Laden von Daten für maschinelles Lernen und Deep Learning Laden und Vorbereiten von Daten für ML- und Deep Learning-Workflows.
Trainieren von Empfehlungsmodellen Trainieren Sie ein Empfehlungsmodell mit der Zweiturm- oder DLRM-Architektur.

Trainieren klassischer Machine Learning-Modelle

Erstellen Sie Machine Learning-Modelle mit automatisierten Tools und Entwicklungsumgebungen für die Zusammenarbeit.

Feature Description
Databricks Runtime für ML Vorkonfigurierte Cluster mit Scikit-Learn, XGBoost, MLflow und anderen ML-Bibliotheken sowie Unterstützung für Deep Learning-Frameworks.
MLflow-Nachverfolgung Verfolgen Sie Experimente, vergleichen Sie die Modellleistung und verwalten Sie den gesamten Lebenszyklus der Modellentwicklung.
Feature Engineering (Merkmalsentwicklung) Erstellung, Verwaltung und Bereitstellung von Features mit automatisierten Datenpipelines und Merkmalsentdeckung.
Databricks-Notizbücher Zusammenarbeitsentwicklungsumgebung mit Unterstützung für Python,R, Scala und SQL für ML-Workflows.

Trainieren von Deep Learning-Modellen

Verwenden Sie verwaltete Compute- und integrierte Frameworks, um Deep Learning-Modelle zu entwickeln.

Feature Description
Verteilte Schulung Beispiele für verteiltes Deep Learning mit Ray, TorchDistributor und DeepSpeed.
KI-Runtime Serverlose GPU-Compute für benutzerdefinierte Deep Learning-Schulungen und -Ableitungsworkloads.
DL Best Practices Leitfaden für die Frameworkauswahl, das Laden von Daten, die verteilte Skalierung und die Verwaltung des Deep Learning-Modelllebenszyklus.
PyTorch Einzelknoten- und verteiltes Training mithilfe von PyTorch.

Modelle bereitstellen und bedienen

Stellen Sie Modelle für die Produktion mit skalierbaren Endpunkten, Echtzeit-Rückschlüssen und Überwachung auf Unternehmensniveau bereit.

Feature Description
Modellbereitstellung Stellen Sie benutzerdefinierte Modelle und LLMs als skalierbare REST-Endpunkte mit automatischer Skalierung und GPU-Unterstützung bereit.
KI-Gateway Steuern und überwachen Sie den Zugriff auf Modelle, die auf Azure Databricks bereitgestellt werden, mit Nutzungsverfolgung, Nutzlastprotokollierung und Sicherheitskontrollen.
Externe Modelle Integrieren Sie Modelle von Drittanbietern, die außerhalb von Databricks gehostet werden, in einheitliche Governance und Überwachung.
Foundation-Modell-APIs Greifen Sie auf hochmoderne offene Modelle zu und führen Sie Abfragen darauf aus, die von Databricks gehostet werden.

Überwachen und Steuern von ML-Systemen

Stellen Sie die Modellqualität, Datenintegrität und Compliance mit umfassenden Überwachungs- und Governancetools sicher.

Feature Description
Unity-Katalog Steuern Sie Daten, Features, Modelle und Funktionen mit einheitlicher Zugriffssteuerung, Linienverfolgung und Ermittlung.
Datenprofilerstellung Überwachen Sie die Datenqualität, die Modellleistung und die Vorhersageabweichungen mit automatisierten Warnungen und Ursachenanalyse.
Erkennung von Anomalien Überwachen Sie die Aktualität und Vollständigkeit der Daten auf Katalogebene.
MLflow für Modelle Nachverfolgen von Experimenten, Verwalten von Modellen im Unity-Katalog, Bereitstellen und Auswerten von Machine Learning-Modellen während des gesamten Entwicklungslebenszyklus.

ML-Workflows produktiv machen

Skalieren Sie Machine Learning-Vorgänge mit automatisierten Workflows, CI/CD-Integration und produktionsfertigen Pipelines.

Feature Description
Modelle im Unity-Katalog Verwenden Sie die Modellregistrierung im Unity-Katalog für zentrale Governance und zum Verwalten des Modelllebenszyklus, einschließlich Bereitstellungen.
Lakeflow-Aufträge Erstellen Sie automatisierte Workflows und produktionsfähige ETL-Pipelines für die ML-Datenverarbeitung.
Ray on Databricks Skalieren Sie ML-Workloads mit verteiltem Rechnen für groß angelegte Modellschulungen und Inferenzen.
MLOps-Workflows Implementieren Sie End-to-End MLOps mit automatisierten Schulungs-, Test- und Bereitstellungspipelines.