Megosztás a következőn keresztül:


Jegyzetfüzet formátumának kezelése

Ez a cikk az Azure Databricks alapértelmezett jegyzetfüzetformátumát, a jegyzetfüzet formátumának módosítását és a kimeneti véglegesítések kezelését ismerteti, ha a jegyzetfüzet egy forrás által vezérelt mappában található.

Alapértelmezés szerint a Databricks-jegyzetfüzetek .ipynb (IPython vagy Jupyter) formátumban jönnek létre. Dönthet úgy is, hogy a forrásformátumot használja.

A jegyzetfüzeteket továbbra is különböző formátumokban importálhatja és exportálhatja. Lásd : Databricks-jegyzetfüzetek importálása és exportálása.

Jegyzetfüzet-formátumok

A Databricks két formátumban támogatja a jegyzetfüzetek létrehozását és szerkesztését: IPYNB (alapértelmezett) és forrásformátumban.

A Git tárolók segítségével kezelheti a forrásfájlokat, beleértve a jegyzetfüzeteket is. Csak bizonyos Databricks-eszköztípusok támogatottak a Git-mappákban. A formátum hatással van a jegyzetfüzetek távoli adattárakra való véglegesítésére az alábbi táblázatban leírtak szerint.

Jegyzetfüzet alapformátuma Leírás
adatforrás Alapszintű formátum, amely csak a forráskódot rögzíti, a kódnyelvet jelző utótaggal, például .py, .scala, .r és .sql.
IPYNB (Jupyter) Gazdag formátum, amely rögzíti a forráskódot, a jegyzetfüzetkörnyezetet, a vizualizáció definícióit, a notebook widgeteket és az opcionális kimeneteket. Az IPYNB-jegyzetfüzetek bármilyen, a Databricks-jegyzetfüzetek által támogatott nyelven tartalmazhatnak kódot (a py.ipynb része ellenére). Az IPYNB formátum használatával igény szerint a jegyzetfüzet kimenetét is szabályozhatja a jegyzetfüzettel együtt.

Az IPYNB formátum a Databricks-jegyzetfüzetek jobb megtekintését is támogatja távoli Git-adattárakban. Ha a GitHubot vagy a GitLabet használja, engedélyezheti a jegyzetfüzetek továbbfejlesztett megjelenítését a lekéréses kérelmekben, így könnyebben megtekintheti és kódolva tekintheti át a jegyzetfüzet módosításait.

Az IPYNB-jegyzetfüzetek gazdag diffjeinek GitHub-támogatásáról további információt a Funkciók előzetese: Rich Jupyter Notebook Diffs című témakörben talál. Az IPYNB-jegyzetfüzetek GitLab-támogatásáról további információt a Jupyter Notebook-fájlokban talál.

Ha meg szeretné különböztetni a forrásformátumú jegyzetfüzeteket a szokásos Python-, Scala- és SQL-fájloktól, az Azure Databricks hozzáadja a "Databricks notebook source" megjegyzést a Python, a Scala és az SQL-jegyzetfüzetek tetejére. Ez a megjegyzés biztosítja, hogy az Azure Databricks a szkriptfájl helyett jegyzetfüzetként értelmezi a fájlt.

Az alapértelmezett jegyzetfüzetformátum-beállítás módosítása

Az IPYNB-jegyzetfüzetek az alapértelmezett formátumok, amikor új jegyzetfüzetet hoznak létre az Azure Databricksben.

Az alapértelmezett Azure Databricks forrásformátum módosításához jelentkezzen be az Azure Databricks munkaterületére, kattintson a profiljára az oldal jobb felső sarkában, majd kattintson a Beállítások elemre, és válassza a Fejlesztőikategóriát. Módosítsa az alapértelmezett jegyzetfüzetformátumot a Szerkesztő beállításai címsor alatt.

Az alapértelmezett jegyzetfüzetformátum módosítása a profil fejlesztői beállításaiban

Jegyzetfüzet formátumának konvertálása

A meglévő jegyzetfüzeteket az Azure Databricks felhasználói felületén keresztül konvertálhatja másik formátumba.

Meglévő jegyzetfüzet átalakítása másik formátumba:

  1. Nyissa meg a jegyzetfüzetet a munkaterületen.

  2. Válassza a Fájl lehetőséget a munkaterület menüjében, válassza a Jegyzetfüzet formátumot, és válassza ki a kívánt formátumot. Választhat a Jupyter (.ipynb) (ajánlott) vagy a Forrás (.scala, .py, .sql, .r)között. A jegyzetfüzet aktuális formátuma szürkén jelenik meg, és mellette pipa látható.

    A munkaterület fájlmenüje kibontva, a jegyzetfüzet formátumának beállításával.

Az Azure Databricksben támogatott jegyzetfüzettípusokról további információt a Databricks-jegyzetfüzetek importálása és exportálása című témakörben talál.

IPYNB-jegyzetfüzet kimeneti mentéseinek kezelése

A kimenetek egy jegyzetfüzet Databricks-platformon való futtatásának eredményei, beleértve a táblamegjelenítéseket és a vizualizációkat. A forrásvezérelt mappákban lévő IPYNB-jegyzetfüzetek esetében kezelheti, hogy a jegyzetfüzet kimenetei hogyan legyenek lekötve a távoli tárházhoz.

A jegyzetfüzet kimenetének .ipynb véglegesítésének engedélyezése

A kimeneteket csak akkor lehet véglegesíteni, ha a munkaterület rendszergazdája engedélyezte ezt a funkciót. Alapértelmezés szerint a Git-mappák felügyeleti beállítása nem teszi lehetővé .ipynb a jegyzetfüzet kimenetének véglegesítése. Ha rendszergazdai jogosultságokkal rendelkezik a munkaterülethez, módosíthatja ezt a beállítást:

  1. Lépjen az Azure Databricks adminisztrátori konzolján a Adminisztrátori beállítások>Munkaterület beállításai pontra.

  2. Az Git-mappákterületen válassza a Git-mappáknak az IPYNB-kimenetek exportálásának engedélyezése lehetőséget, majd válassza a Engedélyezve: IPYNB-kimenetek be- és kikapcsolhatók.

    felügyeleti konzol: IpYNB-kimenetek exportálásának engedélyezése a Git-mappák számára.

Fontos

A kimenetek belefoglalásakor a vizualizáció és az irányítópult konfigurációja szerepel a létrehozott.ipynb jegyzetfüzetekben.

IPYNB-jegyzetfüzet kimeneti összetevő-véglegesítéseinek szabályozása

Amikor véglegesít egy .ipynb fájlt, a Databricks létrehoz egy konfigurációs fájlt, amely lehetővé teszi a kimenetek véglegesítésének szabályozását: .databricks/commit_outputs.

  1. Ha .ipynb jegyzetfüzetfájllal rendelkezik, de nincs konfigurációs fájlja a távoli adattárban, lépjen a Git állapota párbeszédpanelre.

  2. Az értesítési párbeszédpanelen válassza a Create commit_outputs config file (Commit_outputs konfigurációs fájl létrehozása) lehetőséget.

    Jegyzetfüzet véglegesítési felhasználói felülete: Commit_outputs fájl létrehozása gomb.

A konfigurációs fájlokat a Fájl menüből is létrehozhatja. A Fájl menü rendelkezik egy vezérlővel a konfigurációs fájl automatikus frissítéséhez, ahol megadhatja egy adott IPYNB-jegyzetfüzet kimeneteinek felvételét vagy kizárását.

  1. A Fájl menüben válassza a Jegyzetfüzet-kimenetek közzététele lehetőséget.

    Jegyzetfüzet-szerkesztő: A jegyzetfüzetek kimenetének mentése, állapota és vezérlése.

  2. A párbeszédpanelen erősítse meg a jegyzetfüzet eredményeinek mentését.

    Jegyzetfüzetek kimenetének véglegesítése párbeszédpanel.