Freigeben über


Herstellen einer Verbindung mit serverlosem Computing

Dieser Artikel erklärt die verschiedenen serverlosen Angebote, die auf Azure Databricks verfügbar sind. Serverloses Computing ermöglicht es Ihnen, schnell auf Abruf-Compute-Ressourcen zuzugreifen.

Die Artikel in diesem Abschnitt konzentrieren sich auf serverloses Compute für Notebooks, Aufträge und Lakeflow-Deklarative-Pipelines. Für Informationen zu serverlosen SQL-Lagerorten siehe Was sind serverlose SQL-Lagerorte?. Informationen zur Modellbereitstellung finden Sie unter Bereitstellen von Modellen mithilfe von Mosaik AI Model Serving.

Informationen zur Architektur der Ebene für serverloses Computing finden Sie unter Ebene „Serverloses Computing“.

Was ist serverloses Computing?

Serverloses Computing ermöglicht es Ihnen, Arbeitsauslastungen auszuführen, ohne einen Cluster bereitstellen zu müssen. Stattdessen belegt und verwaltet Databricks automatisch die notwendigen Compute-Ressourcen. Dies ermöglicht es Ihnen, sich auf das Schreiben von Code und die Analyse von Daten zu konzentrieren, ohne sich um das Clustermanagement oder die Ressourcenverwendung sorgen zu müssen.

Serverloses Computing bietet die folgenden Vorteile:

  • Cloud-Ressourcen werden von Azure Databricks verwaltet, wodurch der Mehraufwand reduziert und sofortiges Compute bereitgestellt wird, um die Benutzerproduktivität zu verbessern.
  • RapidStart- und Skalierungszeiten für serverlose Compute-Ressourcen minimieren die im Leerlauf verbrachte Zeit und stellen sicher, dass Sie nur für die Compute-Nutzung zahlen.
  • Da die Kapazitätshandhabung, die IT-Sicherheit, das Reparieren und das Upgraden automatisch verwaltet werden, müssen Sie sich weniger um Zuverlässigkeit, Sicherheitsrichtlinien und Kapazitätsengpässe sorgen.

Welche Typen von serverlosem Compute sind auf Azure Databricks verfügbar?

Azure Databricks bietet derzeit die folgenden Typen von serverlosem Compute an:

  • Serverloses Computing für Notebooks: On-Demand, skalierbares Compute zur Ausführung von SQL- und Python-Code in Notebooks.
  • Serverlose Berechnung für Aufträge: On-Demand, skalierbare Compute, die zum Ausführen Ihrer Lakeflow-Aufträge verwendet wird, ohne Infrastruktur zu konfigurieren und bereitzustellen.
  • Serverlose SQL-Lagerorte: On-Demand-Compute, das verwendet wird, um SQL-Befehle auf Datenobjekten im SQL-Editor oder in interaktiven Notizbüchern auszuführen. Sie können SQL-Warehouses mithilfe der Benutzeroberfläche, der CLI oder der REST-API erstellen.
  • Serverless Lakeflow Declarative Pipelines: Optimierte und skalierbare Rechenleistung für Aktualisierungen Ihrer Lakeflow Declarative Pipelines.
  • Mosaic KI-Modell-Dienst: Hochverfügbarer und latenzarmer Dienst zur Bereitstellung von KI-Modellen.
  • Mosaik AI Model Training - Prognose: Nutzen Sie AutoML, um den besten Prognosealgorithmus und die passenden Hyperparameter basierend auf einem vom Benutzer bereitgestellten Datensatz auszuwählen.

Aktivieren des serverlosen Computings

Um auf serverlose Rechenleistung für Notizbücher, Aufträge und Lakeflow Declarative Pipelines zuzugreifen, kann es erforderlich sein, dass ein Kontoadministrator die Funktion aktiviert. Weitere Informationen finden Sie unter Aktivieren des serverlosen Computings.

Um auf serverlose SQL-Lagerorte zuzugreifen, siehe Aktivieren von serverlosen SQL-Lagerorten.

Einschränkungen beim serverlosen Computing

Eine Liste der Einschränkungen finden Sie unter Serverlose Compute Limitations.

Häufig gestellte Fragen (FAQ)

Wie werden Releases ausgerollt?

Serverloses Computing ist ein versionsloses Produkt. Das bedeutet, dass Databricks automatisch Upgrades für die Runtime des serverlosen Computings durchführt, um Verbesserungen und Upgrades für die Plattform zu unterstützen. Alle Benutzenden erhalten innerhalb eines kurzen Zeitraums die gleichen Updates.

Wie kann ich feststellen, welche serverlose Version ausgeführt wird?

Serverlose Workloads werden immer auf der neuesten Laufzeitversion ausgeführt. Informationen zur neuesten Version finden Sie in den Versionshinweisen.

Wie kann ich die Kosten für serverlose Bereitstellung schätzen?

Databricks empfiehlt, einen repräsentativen oder spezifischen Workload auszuführen und zu vergleichen und dann die Abrechnungssystemtabelle zu analysieren. Weitere Informationen unter Referenz zur Systemtabelle für abrechnungsfähigen Verbrauch.

Wie kann ich die DBU-Nutzung für eine bestimmte Workload analysieren?

Um die Kosten für eine bestimmte Workload anzuzeigen, fragen Sie die system.billing.usage Systemtabelle ab. Siehe Kosten für serverloses Computing überwachen für Beispielabfragen an und laden Sie unser Kosten-Observability-Dashboard herunter.

Gibt es eine Verzögerung zwischen dem Ausführen eines Auftrags oder einer Abfrage und dem Erscheinen von Gebühren in der Tabelle der abrechnungsfähigen Nutzung?

Ja, es kann eine Verzögerung von bis zu 24 Stunden zwischen dem Ausführen einer Workload und ihrer Darstellung in der Systemtabelle für abrechenbare Nutzung auftreten.

Ich habe keine serverlose Berechnung für Aufträge und Notizbücher aktiviert, warum sehe ich Abrechnungseinträge für serverlose Aufträge?

Lakehouse-Monitoring und prädiktive Optimierung werden ebenfalls unter der serverlosen Jobs-LME abgerechnet.

Das serverlose Computing muss nicht aktiviert sein, damit diese beiden Features verwendet werden können.

Unterstützt serverloses Computing private Repositorys?

Repositorys können privat sein oder Authentifizierung erfordern. Aus Sicherheitsgründen ist beim Zugriff auf authentifizierte Repositorys eine vorsignierte URL erforderlich.

Wie installiere ich Bibliotheken für meine Auftragsaufgaben?

Databricks empfiehlt, Umgebungen zu verwenden, um Bibliotheken für Ihre Aufträge zu installieren und zu verwalten. Weitere Informationen finden Sie unter Konfigurieren der Umgebung für Aufgaben, die keine Notizbuch-Auftragsaufgaben sind.

Kann ich eine Verbindung mit benutzerdefinierten Datenquellen herstellen?

Nein, es werden nur Quellen unterstützt, die den Lakehouse-Verbund nutzen. Siehe Unterstützte Datenquellen.

Wie funktioniert das serverlose Compute-Netzwerk?

Serverlose Computeressourcen werden in der serverlosen Computeebene ausgeführt, die von Azure Databricks verwaltet wird. Weitere Details zum Netzwerk und zur Architektur finden Sie unter Serverloses Compute-Plane-Netzwerk.

Kann ich serverloses Compute für Aufträge mit Databricks Asset-Bündeln konfigurieren?

Ja, Databricks-Bestandsbündel können verwendet werden, um Aufträge zu konfigurieren, die serverloses Computing nutzen. Siehe Auftrag, der serverloses Berechnen verwendet.

Wie kann ich meine serverlose Arbeitsauslastung von meinem lokalen Entwicklungscomputer oder von meiner Datenanwendung ausführen?

Databricks Connect ermöglicht es Ihnen, eine Verbindung mit Databricks von Ihrem lokalen Computer aus herzustellen und Workloads ohne Server auszuführen. Weitere Informationen finden Sie unter Was ist Databricks Connect?.