Calcolo di GPU senza server

Importante

Questa funzionalità è in versione beta. Gli amministratori dell'area di lavoro possono controllare l'accesso a questa funzionalità dalla pagina Anteprime . Vedere Gestire le anteprime di Azure Databricks.

Questo articolo descrive il calcolo GPU serverless in Databricks e fornisce casi d'uso consigliati, indicazioni su come configurare risorse di calcolo GPU e limitazioni delle funzionalità.

Che cos'è il calcolo GPU serverless?

Il calcolo serverless con GPU è parte dell'offerta di calcolo serverless. Il calcolo GPU serverless è specializzato per carichi di lavoro di Deep Learning a nodo singolo e multinodo personalizzati. È possibile usare il calcolo GPU serverless per eseguire il training e ottimizzare i modelli personalizzati usando i framework preferiti e ottenere efficienza, prestazioni e qualità all'avanguardia.

L'elaborazione GPU senza server include:

Un'esperienza integrata tra notebook, catalogo Unity e MLflow: È possibile sviluppare il codice in modo interattivo usando notebook.
Acceleratori GPU A10: LE GPU A10 sono progettate per accelerare carichi di lavoro di Machine Learning di piccole e medie dimensioni e deep learning, inclusi i modelli di Machine Learning classici e l'ottimizzazione dei modelli linguistici più piccoli. A10s sono ideali per le attività con requisiti di calcolo moderati.
Supporto multi-GPU e multinodo: È possibile eseguire carichi di lavoro di training distribuiti più GPU e più nodi usando l'API Python gpu serverless. Vedere Training distribuito.

I pacchetti preinstallati nel calcolo GPU serverless non sono una sostituzione di Databricks Runtime ML. Anche se sono presenti pacchetti comuni, non tutte le dipendenze e le librerie di Machine Learning di Databricks Runtime si riflettono nell'ambiente di calcolo GPU serverless.

Ambienti Python nel calcolo GPU serverless

Databricks offre due ambienti gestiti per gestire casi d'uso diversi.

Annotazioni

Gli ambienti di base dell'area di lavoro non sono supportati per il calcolo GPU serverless. Usare invece l'ambiente predefinito o di intelligenza artificiale e specificare dipendenze aggiuntive direttamente nel pannello laterale Ambienti o pip install in esse.

Ambiente di base predefinito

In questo modo è disponibile un ambiente minimo con UN'API client stabile per garantire la compatibilità delle applicazioni. Vengono installati solo i pacchetti Python necessari. Questo consente a Databricks di aggiornare il server in modo indipendente, migliorando le prestazioni, potenziando la sicurezza e correggendo errori, senza richiedere modifiche al codice dei carichi di lavoro. Si tratta dell'ambiente predefinito quando si sceglie il calcolo GPU serverless. Scegliere questo ambiente se si vuole personalizzare completamente l'ambiente per il training.

Per ulteriori dettagli sulle versioni dei pacchetti installate nelle diverse versioni, consultare le note sulla versione:

Ambiente di intelligenza artificiale

L'ambiente di intelligenza artificiale di Databricks è disponibile nell'ambiente GPU serverless 4. L'ambiente di intelligenza artificiale si basa sull'ambiente di base predefinito con pacchetti comuni di runtime e pacchetti specifici per il machine learning sulle GPU. Contiene librerie di Machine Learning più diffuse, tra cui PyTorch, LangChain, Transformers, Ray e XGBoost per il training e l'inferenza del modello. Scegliere questo ambiente per l'esecuzione di carichi di lavoro di training. Per altri dettagli, vedere la documentazione.

Per ulteriori dettagli sulle versioni dei pacchetti installate nelle diverse versioni, consultare le note sulla versione:

Casi d'uso consigliati

Databricks consiglia il calcolo GPU serverless per qualsiasi caso d'uso di addestramento del modello che richiede personalizzazioni e GPU per l'addestramento.

Per esempio:

Messa a punto LLM
Visione artificiale
sistemi di raccomandazione
Apprendimento per rinforzo
Previsione di serie temporali basate su Deep Learning

Requisiti

Un'area di lavoro in una delle aree supportate da Azure seguenti:
- eastus
- eastus2
- centralus
- northcentralus
- westcentralus
- westus
- westus2

Configurare il calcolo GPU serverless

Per collegare il tuo notebook al servizio di calcolo GPU senza server e configurare l'ambiente:

In un notebook fare clic sul menu a discesa Connetti nella parte superiore e selezionare GPU serverless.
Fare clic aprire il pannello laterale Ambiente .
Selezionare A10 nel campo Acceleratore .
Selezionare Nessuno per l'ambiente predefinito o IA v4 per l'ambiente di intelligenza artificiale nel campo Ambiente di base.
Fare clic su Applica e quindi confermare di voler applicare il calcolo GPU serverless all'ambiente notebook.

Annotazioni

La connessione al calcolo termina automaticamente dopo 60 minuti di inattività.

Aggiungere librerie all'ambiente

È possibile installare librerie aggiuntive nell'ambiente di calcolo GPU serverless. Vedere Aggiungere dipendenze al notebook.

Annotazioni

L'aggiunta di dipendenze tramite il pannello Ambienti come illustrato in Aggiungere dipendenze al notebook non è supportata per i processi pianificati di calcolo GPU serverless.

Creare e pianificare un'attività

I passaggi seguenti illustrano come creare e pianificare processi per i carichi di lavoro di calcolo GPU serverless. Per altri dettagli, vedere Creare e gestire processi di notebook pianificati .

Dopo aver aperto il notebook da usare:

Selezionare il pulsante Pianifica in alto a destra.
Selezionare Aggiungi pianificazione.
Popolare il modulo Nuova pianificazione con il nome dell'attività, la pianificazione e le risorse di calcolo.
Fare clic su Crea.

È anche possibile creare e pianificare lavori dall'interfaccia utente Jobs e pipeline. Per istruzioni dettagliate, vedere Creare una nuova attività .

Creare e pianificare un processo programmaticamente

È anche possibile creare un'attività con il calcolo GPU serverless direttamente tramite l'API Jobs. Specificare l'acceleratore GPU nel tasks > compute > hardware_accelerator campo . La Specifica API completa è disponibile nella documentazione dell'API Jobs. Ciò è utile per la creazione programmatica di processi, l'integrazione continua e il recapito (CI/CD) e le distribuzioni basate su DAB.

Training distribuito

Vedi Formazione distribuita.

Limitazioni

Il calcolo GPU serverless supporta solo acceleratori A10.
Collegamento privato non è supportato. I repository di archiviazione o pip dietro Private Link non sono supportati.
Le risorse di calcolo GPU serverless non sono supportate per le aree di lavoro conformi ai profili di sicurezza (ad esempio HIPAA o PCI). L'elaborazione dei dati regolamentati non è attualmente supportata.
Per i processi pianificati su GPU serverless, il comportamento di ripristino automatico per le versioni dei pacchetti incompatibili associate al notebook non è supportato.
Il runtime massimo per un carico di lavoro è di sette giorni. Per i processi di training del modello che superano questo limite, implementare il checkpoint e riavviare il processo una volta raggiunto il runtime massimo.

Passaggi successivi

Per informazioni sul caricamento dei dati, vedere Caricare dati in calcolo GPU serverless.
Per le procedure consigliate, vedere Procedure consigliate per il calcolo GPU serverless.
Per problemi comuni, soluzioni alternative e risorse di supporto, vedere la guida alla risoluzione dei problemi.
Per esempi di notebook e tutorial, vedere notebooks di esempio di calcolo GPU serverless.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-03-15

Condividi tramite

Calcolo di GPU senza server

Che cos'è il calcolo GPU serverless?

Ambienti Python nel calcolo GPU serverless

Ambiente di base predefinito

Ambiente di intelligenza artificiale

Casi d'uso consigliati

Requisiti

Configurare il calcolo GPU serverless

Aggiungere librerie all'ambiente

Creare e pianificare un'attività

Creare e pianificare un processo programmaticamente

Training distribuito

Limitazioni

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive