Condividi tramite


Connettersi al runtime di intelligenza artificiale

Importante

Il runtime di intelligenza artificiale per le attività a nodo singolo è disponibile in anteprima pubblica. L'API di training distribuita per i carichi di lavoro con più GPU rimane in beta.

Questo articolo descrive come connettersi all'AI Runtime da notebook interattivi, processi pianificati e la Jobs API.

Interattivo (notebook)

Questo è il modo principale per usare il runtime di intelligenza artificiale. Per connettere il notebook e configurare l'ambiente:

  1. In un notebook fare clic sul menu a discesa Connetti nella parte superiore e selezionare GPU serverless.
  2. Fare clic sull'icona Ambiente per aprire il pannello laterale Ambiente .
  3. Selezionare A10 o H100 nel campo Acceleratore .
  4. Selezionare Nessuno per l'ambiente predefinito o IA v4 per l'ambiente di intelligenza artificiale nel campo Ambiente di base.
  5. Fare clic su Applica e quindi confermare che si vuole applicare il runtime di intelligenza artificiale all'ambiente notebook.

Annotazioni

La connessione al calcolo termina automaticamente dopo 60 minuti di inattività.

Suggerimento

Per le operazioni che non richiedono GPU (ad esempio, clonazione di un repository Git, conversione di formati di dati o analisi esplorativa dei dati), collegare il notebook a un cluster CPU per mantenere le risorse GPU.

Operazioni (pianificate)

È possibile pianificare i notebook che utilizzano GPU serverless come compiti ricorrenti. Per altri dettagli, vedere Creare e gestire processi di notebook pianificati .

Dopo aver aperto il notebook da usare:

  1. Selezionare il pulsante Pianifica in alto a destra.
  2. Selezionare Aggiungi pianificazione.
  3. Popolare il modulo Nuova pianificazione con il nome dell'attività, la pianificazione e le risorse di calcolo.
  4. Fare clic su Crea.

È anche possibile creare e pianificare lavori dall'interfaccia utente Jobs e pipeline. Per istruzioni dettagliate, vedere Creare una nuova attività .

Annotazioni

L'aggiunta di dipendenze tramite il pannello Ambienti non è supportata per i job programmati serverless GPU. Le dipendenze devono essere installate programmaticamente all'interno del notebook, ad esempio %pip install. Il ripristino automatico non è supportato: se il processo non riesce a causa di pacchetti incompatibili, è necessario correggere e ripetere manualmente l'esecuzione. Per i carichi di lavoro che possono superare la durata massima di esecuzione di 7 giorni, introdurre il checkpoint manuale per consentire la ripresa.

API di Jobs e Bundle di asset di Databricks

È possibile creare e gestire processi di runtime di intelligenza artificiale a livello di codice usando l'API Processi di Databricks o i bundle di asset di Databricks. Configurare il tipo di calcolo come GPU serverless nella definizione del processo o del bundle per automatizzare le pipeline di distribuzione.

L'esempio seguente illustra una configurazione del Bundle di Asset di Databricks per un Runtime AI in un incarico GPU serverless.

resources:
  jobs:
    sample_job:
      name: sample_job_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: default
          spec:
            environment_version: '4'

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: default
          compute:
            hardware_accelerator: GPU_8xH100