Freigeben über


Was ist AutoML?

Mit Databricks AutoML können Sie Machine Learning automatisch auf ein Dataset anwenden. Sie stellen das Dataset bereit und identifizieren das Vorhersageziel, während AutoML das Dataset für das Modelltraining vorbereitet. AutoML führt dann eine Reihe von Testversionen durch und zeichnet diese auf, wodurch mehrere Modelle erstellt, optimiert und ausgewertet werden. Die Ergebnisse werden nach der Modellauswertung angezeigt. Außerdem wird ein Python-Notebook mit dem Quellcode für jeden Testlauf bereitgestellt, damit Sie den Code überprüfen, reproduzieren und ändern können. Darüber hinaus werden von AutoML auch zusammenfassende Statistiken für Ihr Dataset berechnet. Diese Informationen werden in einem Notebook gespeichert, das Sie dann später überprüfen können.

Sie können Databricks AutoML für Regressions-, Klassifizierungs- und Vorhersageprobleme verwenden. Informationen zur Funktionsweise von Azure Databricks AutoML.

Anforderungen

  • Mindestens Databricks Runtime 9.1 ML. Für die GA-Version (allgemeine Verfügbarkeit), Databricks Runtime 10.4 LTS ML oder höher.
    • Für Zeitreihenvorhersagen Databricks Runtime 10.0 ML oder höher.
    • Bei Databricks Runtime 9.1 LTS ML und höher hängt AutoML vom Paket databricks-automl-runtime ab, das Komponenten enthält, die außerhalb von AutoML nützlich sind, und hilft auch dabei, die vom AutoML-Training generierten Notebooks zu vereinfachen. databricks-automl-runtime ist unter PyPI verfügbar.
  • Im Cluster können keine zusätzlichen Bibliotheken installiert werden, die nicht in der Databricks Runtime für Machine Learning vorinstalliert sind.
    • Jede Änderung (Entfernung, Upgrades oder Downgrades) an vorhandenen Bibliotheksversionen führt aufgrund von Inkompatibilität zu Ausführungsfehlern.
  • AutoML ist nicht mit Clustern im Freigegebenen Zugriffsmodus kompatibel.
  • Um Unity Catalog mit AutoML verwenden zu können, muss der Cluster-ZugriffsmodusEinzelbenutzer sein und Sie müssen der designierte Einzelbenutzer des Clusters sein.

Aktivieren von AutoML für den Zugriff auf Arbeitsbereichsdateien

AutoML verwendet das Arbeitsbereichsdateisystem, um während der Ausführung von Experimenten auf Datensätze zuzugreifen. Sie müssen über Netzwerkports 1017 und 1021 verfügen, die für AutoML-Experimente geöffnet sind, um auf Dateien in Ihrem Arbeitsbereich zuzugreifen.

Um diese Ports zu öffnen oder zu bestätigen, dass sie offen sind, überprüfen Sie die Konfiguration Ihrer Cloud-VPN-Firewall und die Regeln für Sicherheitsgruppen oder wenden Sie sich an Ihren lokalen Cloud-Administrator. Weitere Informationen zur Konfiguration und Bereitstellung von Arbeitsbereichen finden Sie unter Erstellen eines Arbeitsbereichs.

Nächste Schritte