Was ist die Databricks-Erweiterung für Visual Studio Code?
Mit der Databricks-Erweiterung für Visual Studio Code können Sie eine Verbindung mit Ihren Azure Databricks-Remotearbeitsbereichen über die integrierte Entwicklungsumgebung (Integrated Development Environment, IDE) von Visual Studio Code herstellen, die auf Ihrem lokalen Entwicklungscomputer ausgeführt wird. Anschließend können Sie folgende Aktionen ausführen:
- Über die Benutzeroberfläche von Visual Studio Code können Sie Databricks Asset Bundles definieren, bereitstellen und ausführen, um CI/CD-Muster und bewährte Methoden auf Ihre Azure Databricks-Aufträge, Delta Live Tables-Pipelines und MLOps-Stapel anzuwenden. Siehe Was sind Databricks Asset Bundles? und Erweiterungsfeatures für Databricks Asset Bundles.
- Ausführen lokaler Python-Codedateien aus Visual Studio Code in Azure Databricks-Clustern in Ihren Remotearbeitsbereichen. Siehe Ausführen einer Python-Datei in einem Cluster
- Führen Sie lokale Python-Codedateien (
.py
) und Python-, R-, Scala- und SQL-Notebooks (.py
,.ipynb
,.r
,.scala
und.sql
) in Visual Studio Code als Azure Databricks-Aufträge in Ihren Remotearbeitsbereichen aus. Siehe Ausführen einer Python-Datei als Auftrag. - Richten Sie Ihre Debug-Umgebung und Databricks Connect mithilfe einer einfachen Checkliste ein, die Auswahldialoge auslöst, und konfigurieren Sie sie. Siehe Debuggen von Code mithilfe von Databricks Connect für die Databricks-Erweiterung für Visual Studio Code.
- Debuggen Notebooks Zelle für Zelle in Visual Studio Code mit Databricks Connect. Siehe Ausführen und Debuggen von Notebookzellen mit Databricks Connect mithilfe der Databricks-Erweiterung für Visual Studio Code.
- Synchronisieren des lokalen Codes, den Sie in Visual Studio Code entwickeln, mit Code in Ihren Remotearbeitsbereichen.
Hinweis
Die Databricks-Erweiterung für Visual Studio Code unterstützt die Ausführung von R-, Scala- und SQL-Notebooks als automatisierte Aufträge, bietet jedoch keine tiefergehende Unterstützung für diese Programmiersprachen in Visual Studio Code.
Erste Schritte
Erste Schritte mit der Databricks-Erweiterung für Visual Studio Code:
- Installieren Sie die Erweiterung.
- Erstellen Sie ein neues Databricks-Projekt oder migrieren Sie ein vorhandenes Visual Studio Code-Projekt.
- Konfigurieren Sie Ihr Projekt ganz einfach mithilfe der Benutzeroberfläche der Databricks-Erweiterung.
- Führen Sie im Rahmen des Tutorials für die Erweiterung etwas Python-Code aus.
- Debuggen Sie Ihren Code mithilfe der Databricks Connect-Integration.
- Testen Sie Ihren Code mithilfe von
pytest
. Siehe Ausführen von Tests mit pytest mithilfe der Databricks-Erweiterung für Visual Studio Code.
Erstellen eines neuen Databricks-Projekts
Wenn die Erweiterung installiert ist, können Sie mit der Databricks-Erweiterung für Visual Studio Code ein neues Databricks-Projekt erstellen:
- Starten Sie Visual Studio Code.
- Klicken Sie in der Randleiste von Visual Studio Code auf das Databricks-Symbol, um die Erweiterung zu öffnen.
- Klicken Sie auf Neues Databricks-Projekt erstellen.
- Wählen Sie in der Befehlspalette einen Host und eine Authentifizierungsmethode für das Projekt aus. Weitere Informationen finden Sie unter Einrichten der Authentifizierung für die Databricks-Erweiterung für Visual Studio Code.
- Geben Sie in Geben Sie einen Pfad zu einem Ordner an, in dem das neue Projekt erstellt werden soll den Pfad zu einem Ordner auf dem lokalen Entwicklungscomputer ein, auf dem Sie das Projekt erstellen möchten, oder klicken Sie auf Dialog Ordnerauswahl öffnen und wählen Sie den Pfad zum Projektordner aus.
- Verwenden Sie für Zu verwendende Vorlagen in der Databricks-Projektinitialisierungsansicht die Pfeile nach oben und unten, um eine Projektvorlage auszuwählen, und drücken Sie dann die Eingabetaste. Informationen zu Projektvorlagen für Bundles finden Sie unter Databricks Asset Bundle-Vorlagen.
- Geben Sie einen eindeutigen Namen für dieses Projekt für das Projekt ein oder behalten Sie den Standardprojektnamen
my_project
bei und drücken Sie dann die Eingabetaste. - Wählen Sie aus, ob Sie ein Stub-Notebook (Beispiel), eine Stub-Delta Live Tables-Pipeline (Beispiel), ein Stub-Python-Paket (Beispiel) oder eine beliebige Kombination dieser Stubs (Beispiele) zu Ihrem Projekt hinzufügen möchten.
- Drücken Sie eine beliebige Taste, um die Registerkarte mit dem Editor für die Databricks-Projektinitialisierung zu schließen.
- Wählen Sie für Wählen Sie das Projekt aus, das Sie öffnen möchten, das gerade erstellte Projekt aus.
Migrieren eines Projekts zu einem Databricks-Projekt
Wenn Sie über ein vorhandenes Projekt verfügen, das Sie zu einem Databricks-Projekt migrieren möchten, öffnen Sie es mit der Databricks-Erweiterung für Visual Studio Code, um mit der Migration zu beginnen:
- Starten Sie Visual Studio Code. Klicken Sie im Hauptmenü auf Datei>Ordner öffnen und navigieren Sie zu Ihrem Projekt, um es zu öffnen.
- Klicken Sie in der Randleiste von Visual Studio Code auf das Databricks-Symbol, um die Erweiterung zu öffnen.
- Klicken Sie auf Zu Databricks-Projekt migrieren.
- Wählen Sie in der Befehlspalette einen Host und eine Authentifizierungsmethode für das Projekt aus. Siehe Authentifizierungseinrichtung für die Databricks-Erweiterung für Visual Studio Code.
Hinweis
Wenn Sie ein Projekt öffnen, das mit der Databricks-Erweiterung für Visual Studio Code v1 erstellt wurde, wird automatisch versucht, die Migration anhand der vorhandenen Authentifizierungs- und Arbeitsbereichskonfiguration des Projekts vorzunehmen. Die Migrationsschaltfläche ist nur verfügbar, wenn die automatische Migration fehlschlägt.
Öffnen eines vorhandenen Databricks Asset Bundles-Projekts
Wenn die Databricks-Erweiterung für Visual Studio Code mehr als ein Databricks Asset Bundles-Projekt im aktuellen Ordner erkennt, können Sie mit der Databricks-Erweiterung für Visual Studio Code auswählen, welches Projekt geöffnet werden soll.
Hinweis
Ein Databricks Asset Bundles-Projekt verfügt über eine databricks.yml
-Datei im Stammordner des Projekts. Weitere Informationen finden Sie unter Konfiguration für Databricks-Ressourcenpakete.
Starten Sie Visual Studio Code. Klicken Sie im Hauptmenü auf Datei>Ordner öffnen und navigieren Sie zu dem Verzeichnis, das Ihr Bundle-Projekt enthält.
Klicken Sie in der Randleiste von Visual Studio Code auf das Databricks-Symbol, um die Erweiterung zu öffnen.
Klicken Sie auf Vorhandenes Databricks-Projekt öffnen.
Wählen Sie in der Befehlspalette Ihr vorhandenes Databricks Asset Bundles-Projekt aus.
Wählen Sie in der Befehlspalette einen Host und eine Authentifizierungsmethode für das Projekt aus. Weitere Informationen finden Sie unter Einrichten der Authentifizierung für die Databricks-Erweiterung für Visual Studio Code.
Hinzufügen eines weiteren Databricks-Projekts zum Arbeitsbereich
Mit der Databricks-Erweiterung für Visual Studio Code können Sie mehrere Databricks-Projekte in Ihrem Visual Studio Code-Arbeitsbereich haben und problemlos zwischen ihnen wechseln. Gehen Sie zum Hinzufügen eines weiteren Projekts folgendermaßen vor:
Starten Sie Visual Studio Code. Klicken Sie im Hauptmenü auf Datei>Ordner zu Arbeitsbereich hinzufügen und navigieren Sie zu dem Verzeichnis, das Ihr anderes Bundle-Projekt enthält.
Klicken Sie in der Randleiste von Visual Studio Code auf das Databricks-Symbol, um die Erweiterung zu öffnen.
Klicken Sie auf Aktiver Arbeitsbereichsordner, um das zu verwendende Projekt für die Erweiterung auszuwählen.