Sdílet prostřednictvím


Spuštění souboru v clusteru nebo souboru nebo poznámkovém bloku jako úlohy v Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code

Rozšíření Databricks pro Visual Studio Code umožňuje spouštět kód Pythonu v clusteru nebo v Pythonu, R, Scala nebo kódu SQL nebo poznámkovém bloku jako úlohu v Azure Databricks.

Tyto informace předpokládají, že jste už nainstalovali a nastavili rozšíření Databricks pro Visual Studio Code. Viz Instalace rozšíření Databricks pro Visual Studio Code.

Spuštění souboru Pythonu v clusteru

Spuštění souboru Pythonu v clusteru Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code s příponou a otevřeným projektem:

  1. Otevřete soubor Pythonu, který chcete spustit v clusteru.
  2. Udělejte jednu z těchto věcí:
    • V záhlaví editoru souborů klikněte na ikonu Spustit v Databricks a potom klikněte na Nahrát a spustit soubor.

      Nahrání a spuštění souboru z ikony

    • V zobrazení Průzkumníka (Průzkumník zobrazení>) klikněte pravým tlačítkem myši na soubor a pak v místní nabídce vyberte Spustit v Databricks>Nahrát a Spustit soubor.

      Nahrání a spuštění souboru z místní nabídky

Soubor běží v clusteru a výstup je k dispozici v konzole ladění (zobrazit > konzolu ladění).

Spuštění souboru Pythonu jako úlohy

Spuštění souboru Pythonu jako úlohy Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code s příponou a otevřeným projektem:

  1. Otevřete soubor Pythonu, který chcete spustit jako úlohu.
  2. Udělejte jednu z těchto věcí:
    • V záhlaví editoru souborů klikněte na ikonu Spustit v Databricks a potom klikněte na Spustit soubor jako pracovní postup.

      Spustit soubor jako pracovní postup z ikony

    • V zobrazení Průzkumníka (Průzkumník zobrazení>) klikněte pravým tlačítkem myši na soubor a v místní nabídce vyberte Spustit v Databricks>Spustit soubor jako pracovní postup.

      Spuštění souboru jako pracovního postupu z místní nabídky

Zobrazí se nová karta editoru s názvem Spuštění úlohy Databricks. Soubor se spustí jako úloha v pracovním prostoru a veškerý výstup se vytiskne do oblasti Výstup nové karty editoru.

Pokud chcete zobrazit informace o spuštění úlohy, klikněte na odkaz ID spuštění úlohy na nové kartě Editoru spuštění úlohy Databricks. Otevře se váš pracovní prostor a v pracovním prostoru se zobrazí podrobnosti o spuštění úlohy.

Spuštění poznámkového bloku Pythonu, R, Scaly nebo SQL jako úlohy

Pokud chcete spustit poznámkový blok jako úlohu Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code s rozšířením a otevřeným projektem:

  1. Otevřete poznámkový blok, který chcete spustit jako úlohu.

    Tip

    Pokud chcete převést soubor Pythonu, R, Scaly nebo SQL na poznámkový blok Azure Databricks, přidejte komentář # Databricks notebook source na začátek souboru a před každou buňku přidejte komentář # COMMAND ---------- . Další informace najdete v tématu Import souboru a jeho převod do poznámkového bloku.

    Soubor kódu Pythonu formátovaný jako poznámkový blok Databricks1

  2. Proveďte některou z následujících akcí:

    • V záhlaví editoru souborů poznámkového bloku klikněte na ikonu Spustit v Databricks a potom klikněte na Spustit soubor jako pracovní postup.

    Poznámka:

    Pokud možnost Spustit v Databricks jako pracovní postup není dostupná, přečtěte si téma Vytvoření vlastní konfigurace spuštění.

    • V zobrazení Průzkumníka (Průzkumník zobrazení>) klikněte pravým tlačítkem myši na soubor poznámkového bloku a v místní nabídce vyberte Spustit v Databricks>Spustit soubor jako pracovní postup.

Zobrazí se nová karta editoru s názvem Spuštění úlohy Databricks. Poznámkový blok běží jako úloha v pracovním prostoru. Poznámkový blok a jeho výstup se zobrazí v oblasti Výstup nové karty editoru.

Pokud chcete zobrazit informace o spuštění úlohy, klikněte na odkaz ID spuštění úlohy na kartě Editor spuštění úlohy Databricks. Otevře se váš pracovní prostor a v pracovním prostoru se zobrazí podrobnosti o spuštění úlohy.

Vytvoření vlastní konfigurace spuštění

Vlastní konfigurace spuštění pro rozšíření Databricks pro Visual Studio Code umožňuje předat do úlohy nebo poznámkového bloku vlastní argumenty nebo vytvořit různá nastavení spuštění pro různé soubory.

Chcete-li vytvořit vlastní konfiguraci spuštění, klepněte na tlačítko Spustit > přidat konfiguraci z hlavní nabídky v editoru Visual Studio Code. Pak vyberte Databricks pro konfiguraci spuštění na základě clusteru nebo Databricks: Pracovní postup konfigurace spuštění na základě úlohy.

Například následující vlastní konfigurace spuštění upraví spouštěcí příkaz Spustit soubor jako pracovní postup , který předá --prod argument úloze:

{
  "version": "0.2.0",
  "configurations": [
    {
      "type": "databricks-workflow",
      "request": "launch",
      "name": "Run on Databricks as Workflow",
      "program": "${file}",
      "parameters": {},
      "args": ["--prod"]
    }
  ]
}

Tip

Přidejte "databricks": true do "type": "python" konfigurace, pokud chcete použít konfiguraci Pythonu, ale využijte ověřování Databricks Connect, které je součástí nastavení rozšíření.

Pomocí vlastních konfigurací spuštění můžete také předat argumenty příkazového řádku a spustit kód pouhým stisknutím klávesy F5. Další informace najdete v tématu Spuštění konfigurací v dokumentaci editoru Visual Studio Code.