Connettersi al runtime di intelligenza artificiale

Importante

Il runtime di intelligenza artificiale per le attività a nodo singolo è disponibile in anteprima pubblica. L'API di training distribuita per i carichi di lavoro con più GPU rimane in beta.

Questo articolo descrive come connettersi all'AI Runtime da notebook interattivi, processi pianificati e la Jobs API.

Interattivo (notebook)

Questo è il modo principale per usare il runtime di intelligenza artificiale. Per connettere il notebook e configurare l'ambiente:

Da un notebook fare clic sul menu a discesa di calcolo nella parte superiore e selezionare GPU serverless.
Fare clic aprire il pannello laterale Ambiente .
Selezionare un acceleratore nel campo Acceleratore . Per i carichi di lavoro di training distribuiti, selezionare 8xH100. Per indicazioni sulla scelta di un acceleratore, vedere Opzioni hardware .
Selezionare Nessuno per l'ambiente predefinito o IA v4 per l'ambiente di intelligenza artificiale nel campo Ambiente di base.
Fare clic su Applica e quindi confermare che si vuole applicare il runtime di intelligenza artificiale all'ambiente notebook.

Annotazioni

La connessione al calcolo termina automaticamente dopo 60 minuti di inattività.

Suggerimento

Per le operazioni che non richiedono GPU (ad esempio, clonazione di un repository Git, conversione di formati di dati o analisi esplorativa dei dati), collegare il notebook a un cluster CPU per mantenere le risorse GPU.

Operazioni (pianificate)

È possibile pianificare i notebook che utilizzano GPU serverless come compiti ricorrenti. Per altri dettagli, vedere Creare e gestire processi di notebook pianificati .

Dopo aver aperto il notebook da usare:

Selezionare il pulsante Pianifica in alto a destra.
Selezionare Aggiungi pianificazione.
Popolare il modulo Nuova pianificazione con il nome dell'attività, la pianificazione e le risorse di calcolo.
Fare clic su Crea.

È anche possibile creare e pianificare lavori dall'interfaccia utente Jobs e pipeline. Per istruzioni dettagliate, vedere Creare una nuova attività .

Annotazioni

L'aggiunta di dipendenze tramite il pannello Ambienti non è supportata per i job programmati serverless GPU. Le dipendenze devono essere installate programmaticamente all'interno del notebook, ad esempio %pip install. Il ripristino automatico non è supportato: se il processo non riesce a causa di pacchetti incompatibili, è necessario correggere e ripetere manualmente l'esecuzione. Per i carichi di lavoro che possono superare la durata massima di esecuzione di 7 giorni, introdurre il checkpoint manuale per consentire la ripresa.

API di Jobs e Bundle di asset di Databricks

È possibile creare e gestire processi di runtime di intelligenza artificiale a livello di codice usando l'API Processi di Databricks o i bundle di asset di Databricks. Configurare il tipo di calcolo come GPU serverless nella definizione del processo o del bundle per automatizzare le pipeline di distribuzione.

L'esempio seguente illustra una configurazione del bundle di asset di Databricks per un runtime di intelligenza artificiale in un processo GPU serverless usando l'ambiente di base predefinito:

resources:
  jobs:
    sample_job:
      name: sample_job_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: default
          spec:
            environment_version: '4'

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: default
          compute:
            hardware_accelerator: GPU_8xH100

Per usare l'ambiente AI di Databricks anziché l'ambiente di base predefinito, impostare base_environment sull'identificatore dell'ambiente AI (ad esempio, databricks_ai_v5 per AI v5) nell'ambiente spec e farvi riferimento dal campo environment_key dell'attività:

Importante

La selezione di un ambiente di intelligenza artificiale di Databricks come ambiente di base dell'area di lavoro è in versione beta e richiede che un amministratore dell'area di lavoro acconsenta esplicitamente. Vedere Creare per il calcolo serverless su GPU (AI Runtime).

resources:
  jobs:
    sample_job:
      name: sample_job_aiv5_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: aiv5
          spec:
            base_environment: databricks_ai_v5

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: aiv5
          compute:
            hardware_accelerator: GPU_8xH100

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-06-01