Implementatiemodi voor declaratieve Automation-bundels

Op deze pagina wordt de syntaxis voor de declaratieve Automation Bundles implementatiemodi beschreven. Bundels maken programmatisch beheer van Azure Databricks-werkstromen mogelijk. Zie Wat zijn declaratieve automatiseringsbundels?

In CI/CD-werkstromen coden, testen, implementeren en uitvoeren ontwikkelaars doorgaans oplossingen in verschillende fasen of modi. De eenvoudigste set modi bevat bijvoorbeeld een ontwikkelingsmodus voor preproductievalidatie, gevolgd door een productiemodus voor gevalideerde producten. Declaratieve Automation-bundels biedt een optionele verzameling standaardgedrag dat overeenkomt met elk van deze modi.

Implementatiemodi zijn optioneel. U kunt bundels implementeren zonder een mode in te stellen of presets te configureren. Implementatiemodi zijn handig voor het toepassen van een groep veelgebruikte instellingen tegelijk.

Ontwikkelingsmodus

Als u uw bundel wilt implementeren in de ontwikkelingsmodus, voeg de mode mapping toe, ingesteld op development, aan het gewenste doel. Zie toewijzing van bundelconfiguratiedoelen. Dit doel met de naam dev wordt bijvoorbeeld behandeld als een ontwikkelingsdoel:

targets:
  dev:
    mode: development

Het implementeren van een doel in de ontwikkelingsmodus door de databricks bundle deploy -t <target-name> opdracht uit te voeren implementeert het volgende gedrag, dat kan worden aangepast met behulp van voorinstellingen:

Hiermee worden alle resources die niet als bestanden of notebooks zijn geïmplementeerd, voorafgegaan door het voorvoegsel [dev ${workspace.current_user.short_name}] en worden alle geïmplementeerde taken en pijplijnen voorzien van een dev Azure Databricks-tag.
Markeert alle gerelateerde geïmplementeerde Lakeflow Spark-declaratieve pijplijnen als development: true.
Hiermee kan het gebruik van --cluster-id <cluster-id> in gerelateerde oproepen naar het bundle deploy commando worden ingeschakeld, die alle bestaande clusterdefinities overschrijft die al zijn gespecificeerd in het gerelateerde bundelconfiguratiebestand. In plaats van --cluster-id <cluster-id> te gebruiken in gerelateerde aanroepen naar de opdracht bundle deploy, kunt u de cluster_id-toewijzing hier instellen, of als onderliggende toewijzing van de bundle-toewijzing, naar de ID van het te gebruiken cluster.
Pauzeert alle planningen en triggers voor ingezette middelen, zoals taken of kwaliteitsmonitors. Maak planningen en triggers voor een afzonderlijke taak ongedaan door in te stellen schedule.pause_status op UNPAUSED.
Maakt gelijktijdige uitvoeringen voor alle geïmplementeerde taken mogelijk voor snellere iteratie. Schakel gelijktijdige uitvoeringen voor een afzonderlijke taak uit door in te stellen max_concurrent_runs op 1.
Hiermee wordt de implementatievergrendeling uitgeschakeld voor snellere iteratie. Deze vergrendeling voorkomt implementatieconflicten die waarschijnlijk niet voorkomen in de ontwikkelmodus. Schakel de vergrendeling opnieuw in door in te stellen bundle.deployment.lock.enabled op true.

Productiemodus

Als u uw bundel in de productiemodus wilt implementeren, voegt u de mode toewijzing toe, ingesteld op production, aan het beoogde doel. Zie toewijzing van bundelconfiguratiedoelen. Dit doel met de naam prod wordt bijvoorbeeld behandeld als een productiedoel:

targets:
  prod:
    mode: production

Het implementeren van een doel in de productiemodus door de databricks bundle deploy -t <target-name> opdracht uit te voeren, implementeert het volgende gedrag:

Valideert dat alle gerelateerde geïmplementeerde Lakeflow Spark-declaratieve pijplijnen zijn gemarkeerd als development: false.
Valideert of de huidige Git-vertakking gelijk is aan de Git-vertakking die is opgegeven in het doel. Het opgeven van een Git-vertakking in het doel is optioneel en kan als volgt worden uitgevoerd met een extra git eigenschap:
```
git:
  branch: main
```
Deze validatie kan worden overschreven door --force te specificeren tijdens de implementatie.
Databricks raadt u aan om service-principals te gebruiken voor productie-implementaties. U kunt dit afdwingen door run_as in te stellen op een service-principal. Zie Service-principals en geef een uitvoeringsidentiteit op voor een declaratieve Automation Bundles-werkstroom. Als u geen service-principals gebruikt, moet u rekening houden met het volgende aanvullende gedrag:
- Valideert of artifact_path, file_path, root_path, of state_path toewijzingen niet worden overschreven voor een specifieke gebruiker.
- Valideert of de run_as- en permissions-toewijzingen zijn gespecificeerd om te verduidelijken welke identiteiten specifieke machtigingen hebben voor implementaties.
In tegenstelling tot het voorgaande gedrag voor het instellen van de mode toewijzing naar development, staat het instellen van de mode toewijzing naar production niet toe dat bestaande clusterdefinities worden overschreven, zoals gespecificeerd in het gerelateerde bundelconfiguratiebestand, bijvoorbeeld met behulp van de --compute-id <cluster-id> optie of de compute_id toewijzing.

Aangepaste voorinstellingen

Declaratieve Automation-bundels ondersteunen configureerbare voorinstellingen voor doelen, waarmee u het gedrag voor doelen kunt aanpassen. Zie de configuratiereferentie voor beschikbare voorinstellingen.

Notitie

Tenzij er voor een voorinstelling een uitzondering is opgegeven, overschrijven voorinstellingen het gedrag van de standaardmodus als zowel mode als presets zijn ingesteld, en overschrijden de instellingen van individuele resources de voorinstellingen. Voorbeeld:

Als de max_concurrent_runs voor een taak 10 is, maar de jobs_max_concurrent_runs voorinstelling staat op 20, is het maximale aantal gelijktijdige uitvoeringen van de taak 10.
Als een schema is ingesteld op UNPAUSED, maar de trigger_pause_status voorinstelling is ingesteld PAUSEDop , wordt het schema niet weergegeven.

In het volgende voorbeeld ziet u een aangepaste configuratie van vooraf ingestelde instellingen voor het doel met de naam dev:

targets:
  dev:
    presets:
      name_prefix: 'testing_' # prefix all resource names with testing_
      pipelines_development: true # set development to true for pipelines
      trigger_pause_status: PAUSED # set pause_status to PAUSED for all triggers and schedules
      jobs_max_concurrent_runs: 10 # set max_concurrent runs to 10 for all jobs
      tags:
        department: finance

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-04