Definizione di area di lavoro di Azure Machine Learning
Le aree di lavoro sono luoghi in cui collaborare con i colleghi per creare artefatti di machine learning e lavoro correlato al gruppo. Ad esempio, esperimenti, processi, set di dati, modelli, componenti ed endpoint di inferenza. Questo articolo descrive le aree di lavoro, come gestire l'accesso e come usarle per organizzare il lavoro.
Pronti per iniziare? Creare un'area di lavoro.
Attività eseguite all'interno di un'area di lavoro
Per i team di machine learning, l'area di lavoro è un luogo in cui organizzare il lavoro. Ecco alcune delle attività che è possibile avviare da un'area di lavoro:
- Creare processi: i processi sono esecuzioni di training usate per compilare i modelli. È possibile raggruppare i processi in esperimenti per confrontare le metriche.
- Pipeline di creazione: le pipeline sono flussi di lavoro riutilizzabili per il training e la ripetizione del training del modello.
- Registrare gli asset di dati: gli asset di dati facilitano la gestione dei dati usati per il training del modello e la creazione di pipeline.
- Registrare i modelli: dopo aver creato un modello da distribuire, si crea un modello registrato.
- Creare endpoint online: usare un modello registrato e uno script di assegnazione dei punteggi per creare un endpoint online.
- Distribuire un modello: usare il modello registrato e uno script di assegnazione dei punteggi per distribuire un modello.
Oltre a raggruppare i risultati di machine learning, anche le aree di lavoro ospitano le configurazioni delle risorse:
- Le destinazioni di calcolo vengono usate per eseguire gli esperimenti.
- Gli archivi dati definiscono il modo in cui è possibile connettersi alle origini dati quando si usano asset di dati.
- Impostazioni di sicurezza: impostazioni di rete, identità e controllo di accesso e impostazioni di crittografia.
Organizzazione delle aree di lavoro
Per i leader e gli amministratori del team di machine learning, le aree di lavoro fungono da contenitori per la gestione degli accessi, la gestione dei costi e l'isolamento dei dati. Ecco alcuni suggerimenti per organizzare le aree di lavoro:
- Usare i ruoli utente per la gestione delle autorizzazioni nell'area di lavoro tra gli utenti. Ad esempio, uno scienziato dei dati, un tecnico di machine learning o un amministratore.
- Assegnare l'accesso ai gruppi di utenti: quando si usano i gruppi di utenti di Microsoft Entra, non è necessario aggiungere singoli utenti a ogni area di lavoro, mentre per altre risorse lo stesso gruppo di utenti richiede l'accesso.
- Creare un'area di lavoro per ogni progetto: anche se un'area di lavoro può essere usata per diversi progetti, la sua limitazione a un progetto per area di lavoro consente la creazione di report sui costi accumulati a livello di progetto. Consente anche di gestire configurazioni come archivi dati nell'ambito di ogni progetto.
- Condividere le risorse di Azure: le aree di lavoro richiedono la creazione di diverse risorse associate. Condividere queste risorse tra aree di lavoro per salvare i passaggi di configurazione ripetitivi.
- Abilitare self-service: pre-creare e proteggere le risorse associate come amministratore IT e usare i ruoli utente per consentire agli scienziati dei dati di creare aree di lavoro autonomamente.
- Condividere gli asset: è possibile condividere gli asset tra aree di lavoro usando i registri di Azure Machine Learning.
Come vengono archiviati i contenuti in un'area di lavoro?
L'area di lavoro mantiene una cronologia di tutte le esecuzioni di training, con log, metriche, output, metadati di derivazione e uno snapshot degli script. Quando si eseguono attività in Azure Machine Learning, vengono generati artefatti. I metadati e i dati vengono archiviati nell'area di lavoro e nelle risorse associate.
Risorse associate
Quando si crea una nuova area di lavoro, è necessario portare altre risorse di Azure per archiviare i dati. Se non viene fornito dall'utente, queste risorse vengono create automaticamente da Azure Machine Learning.
Account di archiviazione di Azure. Archivia gli artefatti di machine learning, ad esempio i log dei processi. Per impostazione predefinita, questo account di archiviazione viene usato quando si caricano dati nell'area di lavoro. Anche i Jupyter Notebook usati con le istanze di ambiente di calcolo di Azure Machine Learning vengono archiviati qui.
Importante
Non è possibile usare un account di archiviazione di Azure esistente se è:
- Un account di tipo BlobStorage
- Un account Premium (Premium_LRS e Premium_GRS)
- Un account con spazio dei nomi gerarchico (usato con Azure Data Lake Storage Gen2).
È possibile usare l'archiviazione Premium o lo spazio dei nomi gerarchico come risorsa di archiviazione aggiuntiva creando un archivio dati.
Non abilitare lo spazio dei nomi gerarchico nell'account di archiviazione dopo l'aggiornamento alla versione 2 per utilizzo generico.
Se si usa un account di archiviazione per utilizzo generico v1 esistente, è possibile eseguire l'aggiornamento alla versione 2 per utilizzo generico dopo la creazione dell'area di lavoro.
Registro Azure Container Archivia i contenitori Docker creati quando si creano ambienti personalizzati tramite Azure Machine Learning. La distribuzione di modelli e profili di dati AutoML attiverà anche la creazione di ambienti personalizzati.
Le aree di lavoro possono essere create senza Registro Azure Container come dipendenza se non è necessario creare contenitori Docker personalizzati. Azure Machine Learning può leggere da registri contenitori esterni.
Il provisioning del Registro Azure Container verrà eseguito automaticamente quando si compilano immagini Docker personalizzate. Usare il controllo degli accessi in base al ruolo di Azure per impedire la compilazione dei contenitori Docker dei clienti.
Importante
Se l'impostazione della sottoscrizione richiede l'aggiunta di tag alle risorse, Registro Azure Machine Learning creato da Azure Machine Learning avrà esito negativo perché non è possibile impostare i tag su Registro Azure Container.
Azure Application Insights. Consente di monitorare e raccogliere informazioni di diagnostica dagli endpoint di inferenza.
Per altre informazioni, vedere Monitorare gli endpoint online.
Azure Key Vault. conserva segreti usati dalle destinazioni di calcolo e altre informazioni riservate richieste dall'area di lavoro.
Creare un'area di lavoro
Esistono diversi modi per creare un'area di lavoro. Per iniziare a usare una delle opzioni seguenti:
- Studio di Azure Machine Learning consente di creare rapidamente un'area di lavoro con le impostazioni predefinite.
- Usare il portale di Azure per un'interfaccia punto-e-clic con altre opzioni di sicurezza.
- Se si lavora in Visual Studio Code, usare l'estensione VS Code.
Per automatizzare la creazione dell'area di lavoro usando le impostazioni di sicurezza preferite:
- I modelli di Azure Resource Manager/Bicep forniscono una sintassi dichiarativa per distribuire le risorse di Azure. Un'opzione alternativa consiste nell'usare Terraform. Vedere anche il modello Bicep o il modello Terraform.
- Usare l'interfaccia della riga di comando di Azure Machine Learning o Azure Machine Learning SDK per Python per la creazione di prototipi e come parte dei flussi di lavoro MLOps.
- Usare l'interfaccia della riga di comando di Azure Machine Learning o Azure Machine Learning SDK per Python per la creazione di prototipi e come parte dei flussi di lavoro MLOps.
- Usare le API REST direttamente nell'ambiente di scripting per l'integrazione nella piattaforma o nei flussi di lavoro MLOps.
Strumenti per l'interazione e la gestione dell'area di lavoro
Dopo aver configurato l'area di lavoro, è possibile interagire con essa nei modi seguenti:
- In qualsiasi ambiente Python con Azure Machine Learning SDK.
- Nella riga di comando usando l'estensione dell'interfaccia della riga di comando di Azure Machine Learning v2
- In qualsiasi ambiente Python con Azure Machine Learning SDK
- Nella riga di comando, usando l'estensione dell'interfaccia della riga di comando di Azure Machine Learning v1
In ogni interfaccia sono disponibili le seguenti attività di gestione dell'area di lavoro.
Attività di gestione dell'area di lavoro | Portale | Studio | Python SDK | Interfaccia della riga di comando di Azure | Visual Studio Code |
---|---|---|---|---|---|
Creare un'area di lavoro | ✓ | ✓ | ✓ | ✓ | ✓ |
Gestisci l'accesso all'area di lavoro | ✓ | ✓ | |||
Creare e gestire risorse di calcolo | ✓ | ✓ | ✓ | ✓ | ✓ |
Creare un'istanza di ambiente di calcolo | ✓ | ✓ | ✓ | ✓ |
Avviso
Lo spostamento dell’area di lavoro di Azure Machine Learning in una diversa sottoscrizione o della sottoscrizione proprietaria su un nuovo tenant non è supportato in quanto ciò può provocare errori.
Risorse secondarie
Quando si creano cluster di elaborazione e istanze di ambiente di calcolo in Azure Machine Learning, vengono create risorse secondarie.
- Macchine virtuali: offrono potenza di elaborazione per le istanze di ambiente di calcolo e i cluster di elaborazione, usati per eseguire i processi.
- Load Balancer: viene creato un servizio di bilanciamento del carico di rete per ogni istanza di ambiente di calcolo e cluster di elaborazione per gestire il traffico anche quando si arresta l'istanza di ambiente di calcolo/il cluster di elaborazione.
- Rete virtuale: consentono alle risorse di Azure di comunicare tra loro, Internet e altre reti locali.
- Larghezza di banda: incapsula tutti i trasferimenti di dati in uscita tra aree.
Passaggi successivi
Per altre informazioni sulla pianificazione di un'area di lavoro per i requisiti dell'organizzazione, vedere Organizzare e configurare Azure Machine Learning.
Per un'introduzione ad Azure Machine Learning, vedere: