Nasazení aplikace Databricks

Po vytvoření a vývoji Azure Databricks aplikace ji nasaďte, aby byla přístupná v pracovním prostoru Azure Databricks. Nasazení sestaví aplikaci, nainstaluje závislosti a spustí ji pomocí konfigurace definované v souborech projektu. Aplikace můžete nasadit pomocí uživatelského rozhraní Azure Databricks nebo rozhraní příkazového řádku Databricks.

Poznámka:

Pokud vytvoříte aplikaci ze šablony, Azure Databricks ji automaticky nasadí při prvním vytvoření. Po provedení změn ho ale můžete znovu nasadit později. Viz Vytvoření aplikace Databricks ze šablony.

Logika nasazení

Databricks Apps podporuje nasazování aplikací, které používají Python, Node.jsnebo kombinaci obou aplikací. To umožňuje flexibilní architektury, jako je front-end Node.js s back-endem Python.

Během nasazování proces sestavení zkontroluje package.json soubor v kořenovém adresáři vaší aplikace a určí, jestli se Node.js používá. Pokud je k dispozici, zahrnuje kroky sestavení specifické pro Node.js spolu s kroky Pythonu. Logika nasazení se řídí tímto vzorem:

Pokud package.json je k dispozici:

  1. Spusťte příkaz npm install.
  2. Nainstalujte Python závislosti:
    • Pokud requirements.txt existuje, spusťte pip install -r requirements.txt
    • Pokud requirements.txt neexistuje a pyproject.toml i uv.lock existují, spusťte uv sync pro instalaci závislostí.
  3. Spusťte npm run build (pokud build je skript definován v package.json)
  4. Spusťte příkaz zadaný v app.yamlparametru , nebo npm run start pokud není zadán žádný příkaz.

Poznámka:

Pokud v app.yaml není zadaný žádný příkaz, Azure Databricks spustí npm run start, i když aplikace obsahuje kód Python. Pokud chcete spustit procesy Python i Node.js, definujte vlastní skript start, který ke spuštění obou používá nástroj, jako je concurrently. Například: concurrently "npm run start:node" "python my_app.py".

Pokud package.json není k dispozici:

  1. Nainstalujte Python závislosti:
    • Pokud requirements.txt existuje, spusťte pip install -r requirements.txt
    • Pokud requirements.txt neexistuje a pyproject.toml i uv.lock existují, spusťte uv sync pro instalaci závislostí.
  2. Spusťte příkaz zadaný v app.yamlparametru , nebo python <my-app>.py pokud není zadán žádný příkaz.

Příprava na nasazení

Před nasazením aplikace ověřte, že projekt obsahuje nezbytné součásti:

Kromě toho se ujistěte, že aplikace správce služby má přístup ke složce zdrojového kódu.

Volba zdroje nasazení

Aplikace Databricks můžete nasadit z následujících zdrojů:

  • Složka pracovního prostoru – Nahrajte soubory aplikace do složky pracovního prostoru a nasaďte je odtud. Toto je standardní metoda nasazení.
  • Úložiště Git – Nakonfigurujte úložiště Git pro aplikaci a nasaďte přímo bez nahrání souborů do pracovního prostoru. Aplikace načte kód z nakonfigurovaného referenčního bodu Gitu (větve, značky nebo potvrzení) při každém nasazení. Můžete také zadat cestu ke zdrojovému kódu pro nasazení z konkrétního adresáře v rámci úložiště. Podporují se všichni hlavní poskytovatelé Gitu, včetně GitHub, GitLabu a Bitbucketu. Úplný seznam podporovaných poskytovatelů najdete v tématu Připojení poskytovatele Gitu k Databricks.

Mezi zdroji pracovního prostoru a Gitu můžete přepínat pro stejnou aplikaci kdykoli, pokud správce pracovního prostoru nevynucuje nasazení jen pro Git. Viz Nasazení pouze pomocí Git.

Vynucení nasazení jen pro Git

Správci pracovního prostoru mohou vyžadovat, aby se všechny aplikace v pracovním prostoru nasadily z úložišť Git. Pokud chcete toto nastavení povolit, přejděte do části Nastavení>Vývoj>Aplikace a zapněte možnost Povolit pouze nasazení aplikací z Gitu. Toto nastavení je ve výchozím nastavení vypnuté.

Když povolíte toto nastavení:

  • Uživatelé musí před vytvořením aplikace nakonfigurovat úložiště Git.
  • Uživatelé můžou nasazovat jenom z Gitu, ne ze složek pracovních prostorů.
  • Databricks zakáže šablony aplikací v pracovním prostoru.
  • Uživatelé nemůžou odebrat úložiště Git z aplikací, které ho mají.
  • Stávající aplikace se budou dál spouštět, ale uživatelé je nemůžou nasadit ani spustit znovu, pokud aplikace nemá úložiště Git.

Nasazení aplikace

Následující části popisují, jak nasadit ze složky pracovního prostoru nebo přímo z úložiště Git.

Nasazení ze složky pracovního prostoru

Uživatelské rozhraní Databricks

Nasazení aplikace z uživatelského rozhraní Azure Databricks:

  1. Nahrajte soubory aplikace do pracovního prostoru Azure Databricks. Pokyny najdete v tématu Import souboru.
  2. V pracovním prostoru Databricks klikněte na ikonu aplikace. Přepínač aplikací a vyberte Databricks Apps.
  3. Ve sloupci Název vyberte aplikaci.
  4. Klikněte na Nasadit a vyberte složku v pracovním prostoru, kam jste nahráli soubory aplikace.
  5. Klikněte na Vybrat a pak nasadit.

Příkazové rozhraní Databricks

Nasazení aplikace pomocí rozhraní příkazového řádku:

  1. Otevřete terminál a přejděte do adresáře, který obsahuje soubory vaší aplikace.

  2. Nahrajte soubory aplikace do pracovního prostoru Azure Databricks pomocí příkazu sync. Cestu nahraďte umístěním pracovního prostoru, kam chcete soubory nahrát.

    databricks sync --watch . /Workspace/Users/my-email@org.com/my-app
    

    Příznak --watch udržuje proces synchronizace spuštěný a automaticky nahraje změny při úpravě souborů místně. Pokud chcete vyloučit konkrétní soubory nebo adresáře ze synchronizace, přidejte je do .gitignore souboru v místním adresáři aplikace. Běžné soubory, které se mají vyloučit, jsou node_modules/, .env, __pycache__/.DS_Storea všechny velké datové soubory nebo artefakty sestavení.

  3. Ověřte nahrávání zobrazením souborů v pracovním prostoru. Klikněte na ikonu aplikace. Přepínač aplikací >Lakehouse, a potom klikněte na ikonu pracovního prostoruPracovní prostor a přejděte do adresáře, který jste vytvořili pro aplikaci.

  4. Nasaďte aplikaci spuštěním následujícího příkazu. Nahraďte název aplikace a cestu ke zdrojovému kódu hodnotami.

    databricks apps deploy my-app-name \
       --source-code-path /Workspace/Users/my-email@org.com/my-app
    

    Rozhraní příkazového řádku zobrazí průběh nasazení a potvrdí, kdy je aplikace spuštěná.

Nasazení z úložiště Git

Pokud chcete nasadit aplikaci z úložiště Git, přidejte úložiště na úrovni aplikace a při nasazení zadejte odkaz Gitu. Vaše úložiště Git musí obsahovat soubory aplikace, včetně app.yamlzávislostí a vstupního bodu. Podporují se všichni hlavní poskytovatelé Gitu, včetně GitHub, GitLabu a Bitbucketu. Aplikace založené na Gitu můžete také nasadit pomocí uživatelského rozhraní, rozhraní příkazového řádku, rozhraní API nebo deklarativních sad automation.

Uživatelské rozhraní Databricks

Konfigurace a nasazení aplikace z Gitu:

  1. Nahrajte soubory aplikace do úložiště Git.
  2. V pracovním prostoru Databricks klikněte na ikonu aplikace. Přepínač aplikací a vyberte Databricks Apps.
  3. Vyberte existující aplikaci, která se má upravit, nebo klikněte na + Vytvořit aplikaci.
  4. V kroku Konfigurace úložiště Git zadejte adresu URL úložiště Git (například https://github.com/org/repo) a vyberte poskytovatele Gitu.
  5. Kliknutím na Vytvořit aplikaci nebo Uložit se vrátíte na stránku podrobností aplikace.
  6. V případě privátních úložišť musí mít instanční objekt aplikace nakonfigurované přihlašovací údaje Gitu. Na stránce podrobností aplikace klikněte na Konfigurovat přihlašovací údaje Gitu nebo aplikaci upravte a přidejte přihlašovací údaje v kroku Konfigurace úložiště Git . Abyste mohli přidat přihlašovací údaje Gitu, musíte mít CAN MANAGE oprávnění k aplikaci. Veřejná úložiště nevyžadují přihlašovací údaje Gitu. Pokyny pro jednotlivé poskytovatele najdete v tématu Připojení poskytovatele Git k Databricks.

Pak aplikaci nasaďte:

  1. Na stránce přehledu aplikace klikněte na Nasadit.
  2. Vyberte z Gitu.
  3. Jako referenci gitu zadejte název větve, značku nebo potvrzení SHA (například main, v1.0.0nebo hodnotu hash potvrzení).
  4. Jako typ odkazu zadejte typ odkazu, například větev, značku nebo potvrzení.
  5. (Volitelné) Jako cestu ke zdrojovému kódu zadejte cestu ke konkrétnímu adresáři v rámci úložiště. Aplikace tento adresář považuje za adresář nejvyšší úrovně a nemůže přistupovat k souborům mimo něj. Pokud nezadáte cestu, Databricks použije kořen úložiště.
  6. Klikněte na Deploy.

Příkazové rozhraní Databricks

Nasazení aplikace z Gitu pomocí rozhraní příkazového řádku:

  1. Nahrajte soubory aplikace do úložiště Git.

  2. Při vytváření aplikace nakonfigurujte úložiště Git nebo ho přidejte do existující aplikace. Mezi podporované poskytovatele patří gitHub, , gitHubEnterprise, gitLabgitLabEnterpriseEdition, bitbucketCloudbitbucketServer, , azureDevOpsServices, a awsCodeCommit.

    Pokud chcete vytvořit novou aplikaci s nakonfigurovaným úložištěm Git, použijte příkaz create :

    databricks apps create my-app \
       --json '{"git_repository": {"url": "https://github.com/org/repo", "provider": "gitHub"}}'
    

    Pokud chcete přidat nebo aktualizovat úložiště Git v existující aplikaci, použijte příkaz create-update :

    databricks apps create-update my-app \
       --json '{"update_mask": "git_repository", "git_repository": {"url": "https://github.com/org/repo", "provider": "gitHub"}}'
    
  3. Pro privátní úložiště nakonfigurujte Git pověření pro servisní principal aplikace. Abyste mohli přidat přihlašovací údaje Gitu, musíte mít CAN MANAGE oprávnění k aplikaci. Veřejná úložiště nevyžadují přihlašovací údaje Gitu.

    Pokud chcete k instančnímu objektu aplikace přidat přihlašovací údaje Gitu pomocí rozhraní příkazového řádku, spusťte:

    databricks git-credentials create --json '{
      "git_provider": "gitHub",
      "git_email": "your-email@example.com",
      "personal_access_token": "YOUR_TOKEN",
      "principal_id": YOUR_SP_ID,
      "name": "GitHub credentials for SP"
    }'
    

    Nahraďte YOUR_SP_ID služebním identifikátorem aplikace (Service Principal ID). Pokyny k získání osobního přístupového tokenu pro každého zprostředkovatele najdete v tématu Připojení poskytovatele Gitu k Databricks.

  4. Nasaďte aplikaci zadáním odkazu na Git. Můžete zadat hodnotu branch, tag nebo commit, které se navzájem vylučují. Volitelně můžete zahrnout source_code_path pro nasazení z podadresáře v úložišti.

    databricks apps deploy my-app \
       --json '{"git_source": {"branch": "main"}}'
    

    Nasazení konkrétní značky nebo potvrzení:

    databricks apps deploy my-app \
       --json '{"git_source": {"tag": "v1.0.0"}}'
    
    databricks apps deploy my-app \
       --json '{"git_source": {"commit": "abc123def456"}}'
    

    Nasadit z podadresáře v repozitáři:

    databricks apps deploy my-app \
       --json '{"git_source": {"branch": "main", "source_code_path": "apps/my-app"}}'
    

    Rozhraní příkazového řádku zobrazí průběh nasazení a potvrdí, kdy je aplikace spuštěná.

Azure Databricks v případě odkazů na větev nebo tag nasadí nejnovější commit z dané větve nebo tagu. Pro Azure Databricks se u odkazů na SHA potvrzení vždy nasadí toto konkrétní potvrzení. Pokud jsou přihlašovací údaje Git služby neplatné nebo vypršela jejich platnost, nasazení selže.

Poznámka:

Aplikace vytvořené předtím, než se nasazení Gitu stalo obecně dostupným, automaticky neudělují autorům CAN MANAGE oprávnění k služebnímu principálu aplikace. Pokud potřebujete přidat přihlašovací údaje Gitu do starší aplikace, požádejte správce pracovního prostoru, aby vám udělil oprávnění k uživatelskému účtu služby.

Servisní identity podporují jeden přihlašovací údaj Git na poskytovatele. Pokud přihlašovací údaje aktualizujete jinde, například prostřednictvím konzoly účtu, nahradí stávající přihlašovací údaje tohoto poskytovatele.

Chování po nasazení

Po dokončení nasazení Azure Databricks spustí aplikaci na základě definovaného command v souboru app.yaml nebo ve výchozím nastavení spustí python app.py. Stránka podrobností aplikace zobrazuje aktuální stav a poskytuje přístup k protokolům, historii nasazení a informacím o prostředí.

Zobrazení stránky podrobností aplikace po nasazení aplikace

Pokud chcete zobrazit výstup nasazené aplikace, klikněte na odkaz aplikace.

Přejděte na kartu Protokoly pro diagnostiku a monitorování běhu. Viz Protokolování a monitorování pro aplikace Databricks.

Aktualizace nebo opětovné nasazení aplikace

Znovu nasaďte aplikaci po provedení změn zdrojového kódu nebo konfigurace. Opětovné nasazení použije nejnovější aktualizace bez opětovného vytvoření aplikace. Kdykoli můžete znovu nasadit z pracovního prostoru nebo úložiště Git.

Opětovné nasazení ze složky pracovního prostoru

Pro opětovné nasazení ze složky pracovního prostoru:

  1. Aktualizujte soubory aplikace ve složce pracovního prostoru.
  2. Vyberte aplikaci a klikněte na Nasadit.
  3. Pokud se cesta ke zdrojovému kódu změnila nebo přecházíte ze zdroje Gitu, klikněte na šipku vedle možnosti Nasadit a vyberte Nasadit pomocí jiného zdroje.

Opětovné nasazení z úložiště Git

Znovu nasadit z úložiště Git:

  1. Nasdílejte změny do úložiště Git.
  2. V pracovním prostoru Azure Databricks vyberte aplikaci a klikněte na Deploy.
  3. Pokud se Git reference změnila nebo přecházíte ze zdroje pracovní plochy, klikněte na šipku vedle Nasadit a vyberte Nasadit z jiného zdroje.

Pokud chcete změnit úložiště Git nebo přihlašovací údaje, upravte konfiguraci aplikace. Pokud chcete aktualizovat úložiště Git pomocí rozhraní příkazového řádku nebo rozhraní API, použijte příkaz create-update . Odebrání úložiště Git z aplikace vynucuje nasazení z pracovního prostoru.

Důležité

Změna úložiště Git nebo přepnutí mezi zdroji nasazení (Git a pracovní prostor) odstraní všechny přihlašovací údaje Gitu pro instanční objekt aplikace. Změna pouze odkazu na Git neodstraní přihlašovací údaje. Před opětovnou nasazením z Gitu je nutné znovu nakonfigurovat přihlašovací údaje.

Řešení potíží s nasazením

Pokud se vaší aplikaci nepodaří nasadit nebo se nespustí podle očekávání, vyzkoušejte následující kroky pro řešení potíží:

  • Zkontrolujte logy na chybové zprávy nebo výstup běhového prostředí.
  • Ověřte app.yaml syntaxi a nastavení.
  • Ověřte, zda se tajné údaje a proměnné prostředí v části env správně vyhodnocují.
  • Ověřte, že jsou zahrnuté nebo nainstalované všechny požadované závislosti.
  • Pokud váš pracovní prostor používá Private Link nebo omezené zásady odchozí sítě, ověřte, že jsou požadované domény povolené. Chybějící položky seznamu povolených pro egress jsou běžnou příčinou problémů s nasazením v prostředích Private Link. Viz nasazení aplikací v prostředích Private Link.

Pro nasazení úložiště Git:

  • V případě privátních úložišť ověřte, že instanční objekt aplikace má nakonfigurované přihlašovací údaje Gitu.
  • Ověřte, že je adresa URL úložiště Git správná a že v úložišti existuje odkaz Gitu (větev, značka nebo potvrzení).
  • Pokud správce pracovního prostoru vynucuje nasazení pouze přes Git, nemůžete nasadit ani spustit aplikaci, pokud nemá nakonfigurované úložiště Git.
  • Pokud nasazujete z rozhraní příkazového řádku, API nebo bundlů deklarativní automatizace, nejprve vytvořte aplikaci a poté přidejte přihlašovací údaje pro Git ke služebnímu hlavnímu objektu aplikace.

Další kroky