Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Il runtime di intelligenza artificiale per le attività a nodo singolo è disponibile in anteprima pubblica. L'API di training distribuita per i carichi di lavoro con più GPU rimane in beta.
Questo articolo descrive come connettersi all'AI Runtime da notebook interattivi, processi pianificati e la Jobs API.
Interattivo (notebook)
Questo è il modo principale per usare il runtime di intelligenza artificiale. Per connettere il notebook e configurare l'ambiente:
- In un notebook fare clic sul menu a discesa Connetti nella parte superiore e selezionare GPU serverless.
- Fare clic
aprire il pannello laterale Ambiente .
- Selezionare A10 o H100 nel campo Acceleratore .
- Selezionare Nessuno per l'ambiente predefinito o IA v4 per l'ambiente di intelligenza artificiale nel campo Ambiente di base.
- Fare clic su Applica e quindi confermare che si vuole applicare il runtime di intelligenza artificiale all'ambiente notebook.
Annotazioni
La connessione al calcolo termina automaticamente dopo 60 minuti di inattività.
Suggerimento
Per le operazioni che non richiedono GPU (ad esempio, clonazione di un repository Git, conversione di formati di dati o analisi esplorativa dei dati), collegare il notebook a un cluster CPU per mantenere le risorse GPU.
Operazioni (pianificate)
È possibile pianificare i notebook che utilizzano GPU serverless come compiti ricorrenti. Per altri dettagli, vedere Creare e gestire processi di notebook pianificati .
Dopo aver aperto il notebook da usare:
- Selezionare il pulsante Pianifica in alto a destra.
- Selezionare Aggiungi pianificazione.
- Popolare il modulo Nuova pianificazione con il nome dell'attività, la pianificazione e le risorse di calcolo.
- Fare clic su Crea.
È anche possibile creare e pianificare lavori dall'interfaccia utente Jobs e pipeline. Per istruzioni dettagliate, vedere Creare una nuova attività .
Annotazioni
L'aggiunta di dipendenze tramite il pannello Ambienti non è supportata per i job programmati serverless GPU. Le dipendenze devono essere installate programmaticamente all'interno del notebook, ad esempio %pip install. Il ripristino automatico non è supportato: se il processo non riesce a causa di pacchetti incompatibili, è necessario correggere e ripetere manualmente l'esecuzione. Per i carichi di lavoro che possono superare la durata massima di esecuzione di 7 giorni, introdurre il checkpoint manuale per consentire la ripresa.
API di Jobs e Bundle di asset di Databricks
È possibile creare e gestire processi di runtime di intelligenza artificiale a livello di codice usando l'API Processi di Databricks o i bundle di asset di Databricks. Configurare il tipo di calcolo come GPU serverless nella definizione del processo o del bundle per automatizzare le pipeline di distribuzione.
L'esempio seguente illustra una configurazione del Bundle di Asset di Databricks per un Runtime AI in un incarico GPU serverless.
resources:
jobs:
sample_job:
name: sample_job_h100
trigger:
periodic:
interval: 1
unit: DAYS
parameters:
- name: catalog
default: ${var.catalog}
- name: schema
default: ${var.schema}
environments:
- environment_key: default
spec:
environment_version: '4'
tasks:
- task_key: notebook_task
notebook_task:
notebook_path: /Workspace/Users/your_email/your_notebook
environment_key: default
compute:
hardware_accelerator: GPU_8xH100