Sdílet prostřednictvím


Nasazení aplikace Databricks

Po vytvoření a vývoji aplikace Azure Databricks ji nasaďte, aby byla přístupná v pracovním prostoru Azure Databricks. Nasazení sestaví aplikaci, nainstaluje závislosti a spustí ji pomocí konfigurace definované v souborech projektu. Aplikace můžete nasadit pomocí uživatelského rozhraní Azure Databricks nebo rozhraní příkazového řádku Databricks.

Poznámka:

Pokud vytvoříte aplikaci ze šablony, Azure Databricks ji automaticky nasadí při prvním vytvoření. Po provedení změn ho ale můžete znovu nasadit později. Viz Vytvoření aplikace Databricks ze šablony.

Logika nasazení

Databricks Apps podporuje nasazování aplikací, které používají Python, Node.jsnebo kombinaci obou. To umožňuje flexibilní architektury, jako je Node.js front-end s back-endem Pythonu.

Během nasazování proces sestavení zkontroluje package.json soubor v kořenovém adresáři vaší aplikace a určí, jestli se Node.js používá. Pokud je k dispozici, zahrnuje kroky sestavení specifické pro Node spolu s kroky Pythonu. Logika nasazení se řídí tímto vzorem:

Pokud package.json je k dispozici:

  1. Spusťte příkaz npm install.
  2. Spusťte pip install -r requirements.txt (pokud existuje)
  3. Spusťte npm run build (pokud build je skript definován v package.json)
  4. Spusťte příkaz zadaný v app.yamlparametru , nebo npm run start pokud není zadán žádný příkaz.

Poznámka:

Pokud není ve app.yaml specifikován žádný příkaz, Azure Databricks provede npm run start, i když aplikace obsahuje kód v Pythonu. Pokud chcete spouštět procesy Pythonu i Node.js, definujte vlastní start skript, který používá nástroj jako concurrently k jejich spuštění. Například: concurrently "npm run start:node" "python my_app.py".

Pokud package.json není k dispozici:

  1. Spusťte pip install -r requirements.txt (pokud existuje)
  2. Spusťte příkaz zadaný v app.yamlparametru , nebo python <my-app>.py pokud není zadán žádný příkaz.

Příprava na nasazení

Před nasazením aplikace ověřte, že projekt obsahuje nezbytné součásti:

Kromě toho se ujistěte, že aplikace správce služby má přístup ke složce zdrojového kódu.

Volba zdroje nasazení

Aplikace Databricks můžete nasadit z následujících zdrojů:

  • Složka pracovního prostoru – Nahrajte soubory aplikace do složky pracovního prostoru a nasaďte je odtud. Toto je standardní metoda nasazení.
  • Úložiště Git – Nakonfigurujte úložiště Git pro aplikaci a nasaďte přímo bez nahrání souborů do pracovního prostoru. Aplikace načte kód z nakonfigurovaného referenčního bodu Gitu (větve, značky nebo potvrzení) při každém nasazení. Podporují se všichni hlavní poskytovatelé Gitu, včetně GitHubu, GitLabu a Bitbucketu. Úplný seznam podporovaných poskytovatelů najdete v tématu Připojení poskytovatele Gitu k Databricks.

Mezi pracovními prostory a zdroji Gitu pro stejnou aplikaci můžete kdykoli přepínat.

Nasazení aplikace

Následující části popisují, jak nasadit ze složky pracovního prostoru nebo přímo z úložiště Git.

Nasazení ze složky pracovního prostoru

Uživatelské rozhraní Databricks

Nasazení aplikace z uživatelského rozhraní Azure Databricks:

  1. Nahrajte soubory aplikace do pracovního prostoru Azure Databricks. Pokyny najdete v tématu Import souboru.
  2. Klikněte na ikonu počítáníPočítat v bočním panelu.
  3. Přejděte na kartu Aplikace a klikněte na odkaz na aplikaci ve sloupci Název .
  4. Klikněte na Nasadit a vyberte složku v pracovním prostoru, kam jste nahráli soubory aplikace.
  5. Klikněte na Vybrat a pak nasadit.
  6. Zkontrolujte konfiguraci a klikněte na Nasadit.

Příkazové rozhraní Databricks

Nasazení aplikace pomocí rozhraní příkazového řádku:

  1. Otevřete terminál a přejděte do adresáře, který obsahuje soubory vaší aplikace.

  2. Pomocí příkazu nahrajte soubory aplikace do pracovního prostoru sync Azure Databricks. Cestu nahraďte umístěním pracovního prostoru, kam chcete soubory nahrát.

    databricks sync --watch . /Workspace/Users/my-email@org.com/my-app
    

    Příznak --watch udržuje proces synchronizace spuštěný a automaticky nahraje změny při úpravě souborů místně. Pokud chcete vyloučit konkrétní soubory nebo adresáře ze synchronizace, přidejte je do .gitignore souboru v místním adresáři aplikace. Běžné soubory, které se mají vyloučit, jsou node_modules/, .env, __pycache__/.DS_Storea všechny velké datové soubory nebo artefakty sestavení.

  3. Ověřte nahrávání zobrazením souborů v pracovním prostoru. Na bočním panelu klikněte na Workspace IconWorkspace IconPracovní prostor a přejděte do adresáře, který jste vytvořili pro aplikaci.

  4. Nasaďte aplikaci spuštěním následujícího příkazu. Nahraďte název aplikace a cestu ke zdrojovému kódu hodnotami.

    databricks apps deploy my-app-name \
       --source-code-path /Workspace/Users/my-email@org.com/my-app
    

    Rozhraní příkazového řádku zobrazí průběh nasazení a potvrdí, kdy je aplikace spuštěná.

Nasazení z úložiště Git

Důležité

Tato funkce je v beta verzi. Pokud správce tuto funkci zakáže, stávající aplikace nasazené z Gitu se budou dál spouštět, ale nemůžete je znovu nasadit ani restartovat, dokud verzi Preview znovu nepovolíte nebo neodeberete úložiště z aplikace.

Pokud chcete nasadit aplikaci z úložiště Git, přidejte úložiště na úrovni aplikace a při nasazení zadejte odkaz Gitu. Vaše úložiště Git musí obsahovat soubory aplikace, včetně app.yamlzávislostí a vstupního bodu. Podporují se všichni hlavní poskytovatelé Gitu, včetně GitHubu, GitLabu a Bitbucketu.

Konfigurace a nasazení aplikace z Gitu:

  1. Nahrajte soubory aplikace do úložiště Git.
  2. V pracovním prostoru Azure Databricks klikněte na výpočetní ikonu Compute na bočním panelu.
  3. Přejděte na kartu Aplikace a vyberte existující aplikaci, která chcete upravit, nebo klikněte na Vytvořit aplikaci.
  4. V kroku Konfigurace úložiště Git zadejte adresu URL úložiště Git (například https://github.com/org/repo) a vyberte poskytovatele Gitu.
  5. Kliknutím na Vytvořit aplikaci nebo Uložit se vrátíte na stránku podrobností aplikace.
  6. V případě privátních úložišť musí mít instanční objekt aplikace nakonfigurované přihlašovací údaje Gitu. Na stránce podrobností aplikace klikněte na Konfigurovat přihlašovací údaje Gitu. Případně upravte aplikaci a přidejte přihlašovací údaje v kroku Konfigurace úložiště Git . Abyste mohli přidat přihlašovací údaje Gitu, musíte mít CAN MANAGE oprávnění k aplikaci. Pokyny pro jednotlivé poskytovatele najdete v tématu Připojení poskytovatele Git k Databricks.

Důležité

Kvůli zabezpečení Azure Databricks odstraní všechny přihlašovací údaje Gitu přidružené k instančnímu objektu aplikace při změně zdroje nasazení (z Gitu do pracovního prostoru nebo pracovního prostoru na Git) nebo při změně úložiště Git. Změna pouze odkazu na Git neodstraní přihlašovací údaje. Po změně zdroje nasazení nebo úložiště musíte znovu nakonfigurovat přihlašovací údaje Gitu, aby se nasazovala z Gitu.

Poznámka:

Tvůrci aplikací automaticky obdrží CAN MANAGE oprávnění k aplikačnímu objektu jenom v případech, kdy je povolená funkce Beta nasazení Gitu. Pokud jste aplikaci vytvořili v době, kdy byla funkce zakázaná, možná nemáte oprávnění k přidání přihlašovacích údajů Gitu.

Servisní identity podporují jeden přihlašovací údaj Git na poskytovatele. Aktualizace přihlašovacích údajů, například prostřednictvím konzoly účtu, nahradí stávající přihlašovací údaje daného poskytovatele a ovlivní všechny aplikace používající tento služební principál s tímto poskytovatelem.

Pak aplikaci nasaďte:

  1. Na stránce podrobností aplikace klikněte na Nasadit.
  2. Vyberte z Gitu.
  3. Jako referenci gitu zadejte název větve, značku nebo potvrzení SHA (například main, v1.0.0nebo hodnotu hash potvrzení).
  4. Jako typ odkazu zadejte typ odkazu, například větev, značku nebo potvrzení.
  5. Klikněte na Deploy.

Pro odkazy na větev nebo značky Azure Databricks automaticky nasadí nejnovější commit z této větve nebo značky. Pro odkazy SHA potvrzení azure Databricks vždy nasadí toto konkrétní potvrzení. Pokud jsou přihlašovací údaje Git služby neplatné nebo vypršela jejich platnost, nasazení selže.

Chování po nasazení

Po dokončení nasazení Azure Databricks spustí vaši aplikaci na základě definovaného command ve vašem souboru app.yaml nebo výchozího spuštění python app.py. Stránka podrobností aplikace zobrazuje aktuální stav a poskytuje přístup k protokolům, historii nasazení a informacím o prostředí.

Zobrazení stránky podrobností aplikace po nasazení aplikace

Pokud chcete zobrazit výstup nasazené aplikace, klikněte na odkaz aplikace.

Přejděte na kartu Protokoly pro diagnostiku a monitorování běhu. Viz Protokolování a monitorování pro aplikace Databricks.

Aktualizace nebo opětovné nasazení aplikace

Znovu nasaďte aplikaci po provedení změn zdrojového kódu nebo konfigurace. Opětovné nasazení použije nejnovější aktualizace bez opětovného vytvoření aplikace. Kdykoli můžete znovu nasadit z pracovního prostoru nebo úložiště Git.

Opětovné nasazení ze složky pracovního prostoru

Pro opětovné nasazení ze složky pracovního prostoru:

  1. Aktualizujte soubory aplikace ve složce pracovního prostoru.
  2. Vyberte aplikaci a klikněte na Nasadit.
  3. Pokud se cesta ke zdrojovému kódu změnila nebo přecházíte ze zdroje Gitu, klikněte na šipku vedle možnosti Nasadit a vyberte Nasadit pomocí jiného zdroje.

Opětovné nasazení z úložiště Git

Znovu nasadit z úložiště Git:

  1. Nasdílejte změny do úložiště Git.
  2. V pracovním prostoru Azure Databricks vyberte aplikaci a klikněte na Nasadit.
  3. Pokud se Git reference změnila nebo přecházíte ze zdroje pracovní plochy, klikněte na šipku vedle Nasadit a vyberte Nasadit z jiného zdroje.

Pokud chcete změnit úložiště Git nebo přihlašovací údaje, upravte konfiguraci aplikace. Odebrání úložiště Git z aplikace vynucuje nasazení z pracovního prostoru.

Důležité

Změna úložiště Git nebo přepnutí mezi zdroji nasazení (Git a pracovní prostor) odstraní všechny přihlašovací údaje Gitu pro instanční objekt aplikace. Před opětovnou nasazením z Gitu je nutné znovu nakonfigurovat přihlašovací údaje.

Řešení potíží s nasazením

Pokud se vaší aplikaci nepodaří nasadit nebo se nespustí podle očekávání, vyzkoušejte následující kroky pro řešení potíží:

  • Zkontrolujte logy na chybové zprávy nebo výstup běhového prostředí.
  • Ověřte app.yaml syntaxi a nastavení.
  • Ověřte, zda se tajné údaje a proměnné prostředí v části env správně vyhodnocují.
  • Ověřte, že jsou zahrnuté nebo nainstalované všechny požadované závislosti.

Pro nasazení úložiště Git:

  • V případě privátních úložišť ověřte, že služební účet aplikace má nakonfigurované gitové přihlašovací údaje.
  • Ověřte správnost adresy URL úložiště Git.
  • Ověřte, že v úložišti existuje odkaz Gitu (větev, značka nebo potvrzení).

Další kroky