Sdílet prostřednictvím


Knihovny pracovních prostorů (starší verze)

Důležité

Tato dokumentace byla vyřazena a nemusí být aktualizována. Produkty, služby nebo technologie uvedené v tomto obsahu se už nepodporují. Viz Knihovny clusterů.

Poznámka:

Knihovny pracovních prostorů jsou zastaralé a neměly by se používat. Ukládání knihoven jako souborů pracovního prostoru se ale liší od knihoven pracovních prostorů a je stále plně podporováno. Knihovny uložené jako soubory pracovního prostoru můžete nainstalovat přímo do výpočetních úloh nebo úloh.

Knihovny pracovních prostorů slouží jako místní úložiště, ze kterého vytváříte knihovny nainstalované v clusteru. Knihovny pracovních prostorů může tvořit vlastní kód vytvořený vaší organizací nebo to může být konkrétní verze opensourcové knihovny, kterou vaše organizace standardně využívá.

Abyste ji mohli použít v poznámkovém bloku nebo úloze, musíte do clusteru nainstalovat knihovnu pracovního prostoru. Viz Instalace knihovny pracovních prostorů do clusteru.

Knihovny pracovních prostorů ve sdílené složce jsou k dispozici všem uživatelům v pracovním prostoru, zatímco knihovny pracovních prostorů v uživatelské složce jsou k dispozici pouze danému uživateli.

Důležité

Knihovny je možné nainstalovat z DBFS při použití Databricks Runtime 14.3 LTS a níže. Každý uživatel pracovního prostoru ale může upravovat soubory knihovny uložené v DBFS. Aby se zlepšilo zabezpečení knihoven v pracovním prostoru Azure Databricks, ukládání souborů knihovny v kořenovém adresáři DBFS je ve výchozím nastavení v Databricks Runtime 15.1 a novějších zakázaných. Viz Ukládání knihoven v kořenovém adresáři DBFS je ve výchozím nastavení zastaralé a zakázané.

Místo toho databricks doporučuje nahrát všechny knihovny, včetně knihoven Pythonu, souborů JAR a konektorů Spark, do souborů pracovních prostorů nebo svazků katalogu Unity nebo pomocí úložišť balíčků knihoven. Pokud vaše úloha tyto vzory nepodporuje, můžete také použít knihovny uložené v cloudovém úložišti objektů.

Jak se knihovny pracovních prostorů liší od knihoven uložených se soubory pracovního prostoru?

Termín "knihovny pracovních prostorů" odkazuje na jakoukoli knihovnu zaregistrovanou v pracovním prostoru. Knihovny pracovních prostorů se zobrazují společně s poznámkovými bloky a soubory pracovních prostorů a dodržují pravidla seznamu ACL pro jejich adresář.

Termín "soubory pracovního prostoru" odkazuje na libovolný soubor uložený v pracovním prostoru. Balíčky .whl Pythonu můžete uložit jako soubory pracovního prostoru a pak je zaregistrovat jako knihovny pracovních prostorů. Podívejte se, co jsou soubory pracovního prostoru?

Knihovny můžete nahrát jako soubory pracovního prostoru. Podívejte se na základní využití souborů pracovního prostoru.

Do souborů pracovního prostoru můžete nahrát mnoho typů souborů, ale soubory .whl Pythonu je možné nainstalovat pomocí souborů pracovního prostoru. Viz knihovny v oboru clusteru.

Ve službě Databricks Runtime 13.3 LTS a novějších můžete soubory kol Pythonu uložené jako soubory pracovního prostoru nainstalovat %pip . Viz Instalace balíčku uloženého jako soubor pracovního prostoru s %pip.

Vytvoření knihovny pracovních prostorů

Upozorňující

Tato funkce už není dostupná. Viz Vytváření a instalace knihoven pracovních prostorů už není k dispozici.

  1. Klikněte pravým tlačítkem na složku pracovního prostoru, do které chcete knihovnu uložit.
  2. Vyberte Vytvořit > knihovnu. Zobrazí se dialogové okno Vytvořit knihovnu.
  3. Vyberte zdroj knihovny a postupujte podle příslušných pokynů:

Nahrání souboru jar, vejce Pythonu nebo kolečka Pythonu

Poznámka:

Instalace souborů vejce Pythonu je zastaralá a bude odebrána v budoucí verzi Databricks Runtime.

Důležité

Knihovny je možné nainstalovat z DBFS při použití Databricks Runtime 14.3 LTS a níže. Každý uživatel pracovního prostoru ale může upravovat soubory knihovny uložené v DBFS. Aby se zlepšilo zabezpečení knihoven v pracovním prostoru Azure Databricks, ukládání souborů knihovny v kořenovém adresáři DBFS je ve výchozím nastavení v Databricks Runtime 15.1 a novějších zakázaných. Viz Ukládání knihoven v kořenovém adresáři DBFS je ve výchozím nastavení zastaralé a zakázané.

Místo toho databricks doporučuje nahrát všechny knihovny, včetně knihoven Pythonu, souborů JAR a konektorů Spark, do souborů pracovních prostorů nebo svazků katalogu Unity nebo pomocí úložišť balíčků knihoven. Pokud vaše úloha tyto vzory nepodporuje, můžete také použít knihovny uložené v cloudovém úložišti objektů.

  1. V seznamu tlačítek Zdroj knihovny vyberte Nahrát.
  2. Vyberte Jar, Python Egg nebo Python Whl.
  3. Volitelně zadejte název knihovny.
  4. Přetáhněte soubor Jar, Egg nebo Whl do rozevíracího pole nebo klikněte na rozevírací pole a přejděte do souboru. Soubor se nahraje do dbfs:/FileStore/jarssouboru .
  5. Klikněte na Vytvořit. Zobrazí se obrazovka stavu knihovny.

Odkaz na nahraný soubor JAR, vejce Pythonu nebo kolečka Pythonu

Novou knihovnu pracovních prostorů můžete vytvořit odkazem na soubory JAR, pythonového vejce nebo kolečka Pythonu uložené v kořenovém adresáři DBFS, v úložišti objektů nebo pomocí souborů pracovního prostoru. Po provedení tohoto pracovního postupu zaregistruje ukazatel na knihovnu bez nahrání nebo přesouvání souborů.

S Modulem Databricks Runtime 13.2 a novějším můžete také odkazovat na svazek v katalogu Unity. Tato funkce je ve verzi Public Preview.

Pro režim sdíleného přístupu je nutné přidat jars do .allowlist Viz Knihovny allowlist a inicializační skripty pro sdílené výpočetní prostředky.

  1. V seznamu tlačítek Zdroj knihovny vyberte cestu k souboru nebo ADLS .
  2. Vyberte Jar, Python Egg nebo Python Whl.
  3. Volitelně zadejte název knihovny.
  4. Zadejte cestu ke knihovně, například následující příklady:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Klikněte na Vytvořit. Zobrazí se obrazovka stavu knihovny.

Další informace o práci s knihovnami v úložišti objektů najdete v tématu Instalace knihoven z úložiště objektů.

Další informace o souborech pracovního prostoru najdete v tématu Práce se soubory v Azure Databricks.

Instalace knihovny pracovních prostorů do clusteru

Poznámka:

Azure Databricks zpracovává všechny knihovny pracovních prostorů v pořadí, v jakém byly nainstalované v clusteru. Pokud existují závislosti mezi knihovnami, budete možná muset věnovat pozornost pořadí instalace v clusteru.

Důležité

Knihovny je možné nainstalovat z DBFS při použití Databricks Runtime 14.3 LTS a níže. Každý uživatel pracovního prostoru ale může upravovat soubory knihovny uložené v DBFS. Aby se zlepšilo zabezpečení knihoven v pracovním prostoru Azure Databricks, ukládání souborů knihovny v kořenovém adresáři DBFS je ve výchozím nastavení v Databricks Runtime 15.1 a novějších zakázaných. Viz Ukládání knihoven v kořenovém adresáři DBFS je ve výchozím nastavení zastaralé a zakázané.

Místo toho databricks doporučuje nahrát všechny knihovny, včetně knihoven Pythonu, souborů JAR a konektorů Spark, do souborů pracovních prostorů nebo svazků katalogu Unity nebo pomocí úložišť balíčků knihoven. Pokud vaše úloha tyto vzory nepodporuje, můžete také použít knihovny uložené v cloudovém úložišti objektů.

V režimu přístupu jednoho uživatele se používá identita přiřazeného objektu (uživatele nebo instančního objektu). V režimu sdíleného přístupu používají knihovny identitu uživatele, který knihovnu nainstaloval. Režim sdíleného přístupu bez izolace nepodporuje svazky, ale používá stejné přiřazení identity jako režim sdíleného přístupu.

Pokud chcete zobrazit všechny možnosti instalace knihoven do clusterů, přečtěte si téma Knihovny clusteru.

Pokud chcete nainstalovat knihovnu, která už v pracovním prostoru existuje, můžete začít z uživatelského rozhraní clusteru nebo uživatelského rozhraní knihovny:

Cluster

  1. Na bočním panelu klikněte na Ikona výpočetních prostředků Výpočty.
  2. Klikněte na název clusteru.
  3. Klikněte na kartu Knihovny .
  4. Klikněte na Nainstalovat nový.
  5. V seznamu tlačítek Zdroj knihovny vyberte Knihovna pracovních prostorů.
  6. Vyberte knihovnu pracovního prostoru.
  7. Klikněte na Install (Nainstalovat).

Knihovna

  1. Přejděte do složky obsahující knihovnu.
  2. Klikněte na název knihovny.
  3. Zaškrtněte políčko vedle clusteru, na který chcete knihovnu nainstalovat, a klikněte na Nainstalovat. V seznamu se zobrazí jenom spuštěné clustery.

Zobrazení podrobností knihovny pracovního prostoru

Poznámka:

Složky pracovních prostorů poskytují pohodlí při zjišťování knihoven pracovních prostorů a správě seznamů ACL.

  1. Přejděte do složky pracovního prostoru obsahující knihovnu.
  2. Klikněte na název knihovny.

Na stránce s podrobnostmi o knihovně se zobrazují spuštěné clustery a stav instalace knihovny. Pokud je knihovna nainstalovaná, stránka obsahuje odkaz na hostitele balíčku. Pokud se knihovna nahrála, zobrazí se na stránce odkaz na nahraný soubor balíčku.

Přesunutí knihovny pracovního prostoru

Poznámka:

Složky pracovních prostorů poskytují pohodlí při zjišťování knihoven pracovních prostorů a správě seznamů ACL. Přesunutí knihovny pracovního prostoru nepřesouvají soubory, ale mohou upravovat, kteří uživatelé mají přístup k knihovně pracovních prostorů.

  1. Přejděte do složky pracovního prostoru obsahující knihovnu.
  2. Klikněte pravým tlačítkem myši na název knihovny a vyberte Přesunout. Zobrazí se prohlížeč složek.
  3. Klikněte na cílovou složku.
  4. Klikněte na Přesunout.

Odstranění knihovny pracovního prostoru

Důležité

Před odstraněním knihovny pracovního prostoru byste ji měli odinstalovat ze všech clusterů.

Odstranění knihovny pracovního prostoru:

  1. Přesuňte knihovnu do složky Koš.
  2. Buď trvale odstraňte knihovnu ve složce Koš, nebo vyprázdněte složku Koš.