Megosztás a következőn keresztül:


Databricks-projekt konfigurálása a Visual Studio Code Databricks-bővítményével

A Visual Studio Code Databricks bővítménye konfigurációs nézetet kínál a bővítménypanelen, amely lehetővé teszi a Databricks-projekt beállításainak egyszerű konfigurálását és frissítését. Ezek a funkciók magukban foglalják a cél-munkaterület üzembehelyezési választóját, a hitelesítés és a számítás egyszerű konfigurációját, a munkaterület mappaszinkronizálását, valamint a Hibakereséshez szükséges Python virtuális környezet aktiválásának egyszerű lépéseit.

A Visual Studio Code Databricks-bővítményének Konfiguráció nézete akkor érhető el, ha létrehozott vagy migrált egy projektet egy Databricks-projektbe. Lásd: Új Databricks-projekt létrehozása.

Feljegyzés

A Visual Studio Code Databricks bővítményének korábbi verziói a projekt JSON-fájljában és környezeti változóiban megadott konfigurációs beállításokat a terminálban adták meg. A kiadási verzióban a projekt és a környezet konfigurációja megtalálható a databricks.yml fájlokban.databricks.env

Ha a projekt egy Databricks-eszközcsomag, a Databricks extention felhasználói felülete csomagerőforrás-kezelőt és csomagváltozó nézetet is biztosít a kötegerőforrások és változók kezeléséhez. Lásd a Databricks Asset Bundles bővítmény funkcióit.

A cél üzembehelyezési munkaterület módosítása

A Databricks-projekt üzembehelyezési céljának kiválasztása vagy váltása (például célról dev célra prod váltáshoz):

  1. A Databricks bővítménypanel konfigurációs nézetében kattintson a Targethez társított fogaskerék ikonra (Válasszon egy Databricks-eszközcsomag-célt).

    Databricks-eszközcsomag-cél kiválasztása

  2. A parancskatalógusban válassza ki a kívánt üzembehelyezési célt.

A cél konfigurálása után megjelenik a gazdagép és az üzembe helyezési mód. A Databricks Asset Bundles üzembe helyezési módjairól további információt a Databricks Asset Bundle üzembe helyezési módjaiban talál.

A munkaterület-gazdagép módosítható a projekthez társított konfigurációs fájl célbeállításának workspace databricks.yml módosításával. Lásd a célokat.

Feljegyzés

A Visual Studio Code következő Databricks-bővítménye csak akkor érhető el, ha a cél üzembehelyezési mód fejlesztés alatt áll:

  • A csatolt fejlesztési fürt használata kötegfeladatokhoz
  • Munkaterület mappafájljainak szinkronizálása
  • Interaktív fejlesztőfürt kiválasztása

A Databricks-profil konfigurálása a projekthez

Amikor Létrehoz egy Databricks-projektet, vagy áttelepít egy projektet Databricks-projektként, konfigurál egy profilt, amely a Databrickshez való csatlakozáshoz használt hitelesítési beállításokat tartalmazza. Ha módosítani szeretné a használt hitelesítési profilt, kattintson az AuthType-hoz társított fogaskerék ikonra a Konfiguráció nézetben.

További információ a Visual Studio Code-hitelesítés Databricks-bővítményéről: A Visual Studio Code Databricks-bővítményének hitelesítési beállítása.

Fürt kiválasztása kód és feladatok futtatásához

A Visual Studio Code Databricks-bővítményével kiválaszthat egy meglévő Azure Databricks-fürtöt, vagy létrehozhat egy új Azure Databricks-fürtöt a kód és a feladatok futtatásához. Miután csatlakozott a számításhoz, megjelenik a fürt azonosítója, a Databricks Runtime verziója, a létrehozó, az állapot és a hozzáférési mód. Elindíthatja és le is állíthatja a fürtöt, és közvetlenül a fürt oldaladataihoz navigálhat.

Tipp.

Ha nem szeretné megvárni, amíg a feladatfürt elindul, jelölje be a Feladatokat tartalmazó fürt felülbírálása csomagban jelölőnégyzetet a fürtkijelölés alatt, és használja a kijelölt fürtöt a csomagfeladatok fejlesztési módban való futtatásához.

Meglévő fürt használata

Ha van egy meglévő Azure Databricks-fürtje, amelyet használni szeretne:

  1. A Konfiguráció nézetben a Fürt mellett kattintson a Fürt kiválasztása vagy a fogaskerék (Fürt konfigurálása) ikonra.

    Fürt konfigurálása

  2. A parancskatalógusban válassza ki a használni kívánt fürtöt.

Új fürt létrehozása

Ha nincs meglévő Azure Databricks-fürtje, vagy újat szeretne létrehozni:

  1. A Konfiguráció nézetben a Fürt mellett kattintson a fogaskerék (Fürt konfigurálása) ikonra.

  2. A parancskatalógusban kattintson az Új fürt létrehozása elemre.

  3. Amikor a rendszer arra kéri, hogy nyissa meg a külső webhelyet (az Azure Databricks-munkaterületet), kattintson a Megnyitás gombra.

  4. Ha a rendszer kéri, jelentkezzen be az Azure Databricks-munkaterületre.

  5. Fürt létrehozásához kövesse az utasításokat.

    Feljegyzés

    A Databricks azt javasolja, hogy hozzon létre egy személyes számítási fürtöt. Ez lehetővé teszi a számítási feladatok azonnali futtatását, minimalizálva a számítási feladatok kezelésével járó többletterhelést.

  6. A fürt létrehozása és futtatása után térjen vissza a Visual Studio Code-hoz.

  7. A Konfiguráció nézetben a Fürt mellett kattintson a fogaskerék (Fürt konfigurálása) ikonra.

    Fürt ikon konfigurálása 3

    A parancskatalógusban kattintson a használni kívánt fürtre.

A munkaterület mappája szinkronizálása a Databricks szolgáltatással

A Databricks-projekthez társított távoli Databricks-munkaterület mappát a Databricks bővítménypanel Konfiguráció nézetében a Munkaterület mappához társított szinkronizálási ikonra (szinkronizálás indítása) kattintva szinkronizálhatja.

Feljegyzés

A Visual Studio Code Databricks-bővítménye csak az általa létrehozott munkaterület-címtárakkal működik. A projektben csak akkor használhat meglévő munkaterületi címtárat, ha azt a bővítmény hozta létre.

Ha a Databricksben a munkaterület nézetére szeretne navigálni, kattintson a Munkaterület mappához társított külső hivatkozás ikonra (Külső hivatkozás megnyitása) .

A bővítmény a projekt társított Databricks-eszközcsomag konfigurációjának leképezésében workspace megadott beállítás alapján file_path határozza meg a használni kívánt Azure Databricks-munkaterületi mappát. Lásd a munkaterületet.

Feljegyzés

A Visual Studio Code Databricks-bővítménye csak egyirányú, automatikusan szinkronizálja a fájlmódosításokat a helyi Visual Studio Code-projektből a távoli Azure Databricks-munkaterület kapcsolódó munkaterületi mappájába. A távoli munkaterület könyvtárában lévő fájlok átmenetiek. Ne kezdeményezz módosításokat a távoli munkaterületről, mert ezek a módosítások nem lesznek szinkronizálva a helyi projekthez.

A Visual Studio Code Databricks-bővítményének korábbi verzióihoz tartozó munkaterületi címtár szinkronizálási funkciójának használati részleteiért lásd : Munkaterület-címtár kiválasztása a Visual Studio Code Databricks-bővítményéhez.

A Python-környezet és a Databricks Connect beállítása

A Konfiguráció nézet Python-környezet szakasza lehetővé teszi a Python virtuális fejlesztési környezet egyszerű beállítását, valamint a Databricks Connect telepítését kód- és jegyzetfüzetcellák futtatásához és hibakereséséhez. A Python virtuális környezetek biztosítják, hogy a projekt a Python- és Python-csomagok kompatibilis verzióit használja (ebben az esetben a Databricks Connect-csomagot).

A Python virtuális környezet projekthez való konfigurálásához a bővítménypanel Konfiguráció nézetében :

  1. Kattintson a Python-környezet alatti piros Virtuális környezet aktiválása elemre.
  2. A parancskatalógusban válassza a Venv vagy a Conda lehetőséget.
  3. Válassza ki a telepíteni kívánt függőségeket, ha vannak ilyenek.

A környezetek módosításához kattintson az Aktív környezethez társított fogaskerék ikonra (Virtuális környezet módosítása).

További információ a Databricks Connect telepítéséről, amely lehetővé teszi a kód és jegyzetfüzetek futtatását és hibakeresését a Visual Studio Code Databricks-bővítményéhez a Databricks Connect használatával.