Delen via


Verbinding maken met AI Runtime

Belangrijk

AI Runtime voor taken met één knooppunt bevindt zich in openbare preview. De gedistribueerde trainings-API voor workloads met meerdere GPU's blijft bèta.

In dit artikel wordt beschreven hoe u verbinding maakt met AI Runtime vanuit interactieve notebooks, geplande taken en de Taken-API.

Interactief (Notebooks)

Dit is de primaire manier om AI Runtime te gebruiken. Uw notebook verbinden en de omgeving configureren:

  1. Klik in een notebook op de vervolgkeuzelijst Verbinding maken bovenaan en selecteer Serverloze GPU.
  2. Klik op het pictogram Omgeving om het deelvenster Omgeving te openen.
  3. Selecteer A10 of H100 in het veld Accelerator .
  4. Selecteer Geen voor de standaardomgeving of AI v4 voor de AI-omgeving in het veld Basisomgeving .
  5. Klik op Toepassenen bevestig vervolgens dat u de AI Runtime wilt toepassen op uw notebookomgeving.

Opmerking

De verbinding met uw berekening wordt automatisch beëindigd na 60 minuten inactiviteit.

Aanbeveling

Voor bewerkingen waarvoor geen GPU's zijn vereist (bijvoorbeeld het klonen van een Git-opslagplaats, het converteren van gegevensindelingen of verkennende gegevensanalyse), koppelt u uw notebook aan een CPU-cluster om GPU-resources te behouden.

Werkopdrachten (Gepland)

U kunt notebooks die gebruikmaken van serverloze GPU plannen als terugkerende jobs. Zie Geplande notebooktaken maken en beheren voor meer informatie.

Nadat u het notitieblok hebt geopend dat u wilt gebruiken:

  1. Selecteer de knop Planning rechtsboven.
  2. Selecteer Planning toevoegen.
  3. Vul het formulier Nieuw schema in met de taaknaam, Planning en Compute.
  4. Klik op Creëren.

U kunt ook taken maken en plannen vanuit de gebruikersinterface voor taken en pijplijnen . Zie Een nieuwe taak maken voor stapsgewijze instructies.

Opmerking

Het toevoegen van afhankelijkheden met behulp van het deelvenster Omgevingen wordt niet ondersteund voor serverloze GPU-geplande taken. Afhankelijkheden moeten programmatisch worden geïnstalleerd in uw notebook (bijvoorbeeld %pip install). Automatisch herstel wordt niet ondersteund. Als uw taak mislukt vanwege incompatibele pakketten, moet u handmatig herstellen en opnieuw uitvoeren. Voor workloads die de maximale runtime van zeven dagen kunnen overschrijden, implementeert u handmatige controlepunten om hervatting toe te staan.

Jobs API en Databricks Asset Bundles

U kunt programmatisch AI Runtime-taken maken en beheren met behulp van de Databricks Jobs-API of Databricks Asset Bundles. Configureer het rekentype als serverloze GPU in uw taak of bundeldefinitie om implementatiepijplijnen te automatiseren.

In het volgende voorbeeld ziet u een Databricks Asset Bundle-configuratie voor een AI Runtime op een serverloze GPU-taak:

resources:
  jobs:
    sample_job:
      name: sample_job_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: default
          spec:
            environment_version: '4'

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: default
          compute:
            hardware_accelerator: GPU_8xH100