Condividi tramite


Usare l'etichettatura di Azure Machine Learning in Language Studio

L’etichettatura dei dati è una parte importante della preparazione del set di dati. L’esperienza di etichettatura in Azure Machine Learning permette di semplificare la collaborazione, migliorare la flessibilità ed esternalizzare le attività di etichettatura ai fornitori esterni di servizi di etichettatura tramite Azure Marketplace. È possibile usare l'etichettatura di Azure Machine Learning per:

Prerequisiti

Prima di connettere il progetto di etichettatura ad Azure Machine Learning, è necessario:

  • Un progetto di Language Studio creato correttamente con un account di archiviazione BLOB di Azure configurato.
  • Dati del testo caricati nell'account di archiviazione.
  • Almeno:
    • Un'etichetta di entità per il riconoscimento di entità denominate personalizzate; o
    • Etichette di due classi per i progetti di classificazione personalizzata del testo.
  • Un'area di lavoro di Azure Machine Learning connessa allo stesso account di archiviazione BLOB di Azure usato dall'account di Language Studio.

Limiti

  • La connessione del progetto di etichettatura ad Azure Machine Learning è una connessione uno-a-uno. Se si disconnette il progetto, non sarà possibile riconnetterlo allo stesso progetto di Azure Machine Learning
  • Non è possibile etichettare contemporaneamente in Language Studio e Azure Machine Learning. L'esperienza di etichettatura è abilitata in uno studio alla volta.
  • I file di test e training nell'esperienza di etichettatura che si abbandona verranno ignorati durante il training del modello.
  • È possibile importare in Language Studio solo il formato file JSONL di Azure Machine Learning.
  • I progetti con l'opzione multilingue abilitata non possono essere connessi ad Azure Machine Learning e non sono supportate tutte le lingue.
  • L'area di lavoro di Azure Machine Learning a cui ci si connette deve essere assegnata allo stesso account di archiviazione di Azure a cui è connesso Language Studio. Assicurarsi che l'area di lavoro di Azure Machine Learning disponga dell'autorizzazione di lettura dei dati per i BLOB di archiviazione nell'account di archiviazione. L'area di lavoro deve essere stata collegata all'account di archiviazione durante il processo di creazione nel portale di Azure.
  • Il passaggio tra le due esperienze di etichettatura non è istantaneo. Il completamento dell'operazione può richiedere tempo.

Importare le etichette di Azure Machine Learning in Language Studio

Language Studio supporta il formato file JSONL usato da Azure Machine Learning. Se i dati sono stati etichettati in Azure Machine Learning, è possibile importare le etichette aggiornate in un nuovo progetto personalizzato per usare le funzionalità di entrambi gli studi.

  1. Per iniziare, creare un nuovo progetto per la classificazione personalizzata del testo o il riconoscimento di entità denominate personalizzate.

    1. Nella schermata Crea un progetto visualizzata seguire i prompt per connettere l'account di archiviazione e immettere le informazioni di base sul progetto. Assicurarsi che la risorsa di Azure in uso non sia già connessa a un altro account di archiviazione.

    2. Nella sezione Scegli contenitore scegliere l'opzione che indica che è già presente un file formattato correttamente. Selezionare quindi il file di etichette di Azure Machine Learning più recente.

      Screenshot che mostra la selezione per un file etichetta in Language Studio.

Connettersi ad Azure Machine Learning

Prima di connettersi ad Azure Machine Learning, è necessario disporre di un account Azure Machine Learning con un piano tariffario in grado di soddisfare le esigenze di calcolo del progetto. Vedere la sezione dei prerequisiti per assicurarsi di aver soddisfatto correttamente tutti i requisiti per iniziare a connettere il progetto di Language Studio ad Azure Machine Learning.

  1. Usare il portale di Azure per passare all'account di Archiviazione BLOB di Azure connesso alla risorsa linguistica.

  2. Assicurarsi che il ruolo Collaboratore dati BLOB di archiviazione sia assegnato all'area di lavoro AML all'interno delle assegnazioni di ruolo per l'account di Archiviazione BLOB di Azure.

  3. Passare al progetto in Language Studio. Nel menu di spostamento a sinistra del progetto selezionare Etichettatura dati.

  4. Selezionare Usa Azure Machine Learning per etichettare nella descrizione Etichettatura dati o sotto al riquadro Attività.

    Screenshot che mostra la posizione del collegamento di Azure Machine Learning.

  5. Selezionare Connetti ad Azure Machine Learning per avviare il processo di connessione.

    Screenshot che mostra il pulsante di connessione di Azure Machine Learning in Language Studio.

  6. Seguire i prompt nella finestra visualizzata. Selezionare l'area di lavoro di Azure Machine Learning creata in precedenza nella stessa sottoscrizione di Azure. Immettere un nome per il nuovo progetto di Azure Machine Learning da creare per abilitare l'etichettatura in Azure Machine Learning.

    Suggerimento

    Prima di continuare, assicurarsi che l'area di lavoro sia collegata allo stesso account di archiviazione BLOB di Azure e alla stessa risorsa linguistica. È possibile creare una nuova area di lavoro e collegarsi all'account di archiviazione tramite il portale di Azure. Assicurarsi che l'account di archiviazione sia collegato correttamente all'area di lavoro.

  7. (Facoltativo) Attivare l'interruttore di etichettatura dei fornitori per usare le aziende fornitrici di servizi di etichettatura. Prima di scegliere le aziende fornitrici di servizi di etichettatura, contattarle in Azure Marketplace per concludere i relativi contratti. Per altre informazioni sull'uso delle aziende fornitrici, vedere Come esternalizzare l'etichettatura dei dati.

    È anche possibile lasciare istruzioni di etichettatura per gli etichettatori umani che contribuiranno al processo di etichettatura. Queste istruzioni possono aiutarli a comprendere l'attività poiché consentono di lasciare definizioni chiare delle etichette e includere esempi per ottimizzare i risultati.

  8. Esaminare le impostazioni per la connessione ad Azure Machine Learning e apportare le eventuali modifiche necessarie.

    Importante

    La finalizzazione della connessione è permanente. Il tentativo di disconnettere la connessione stabilita in qualsiasi momento disabiliterà definitivamente il progetto di Language Studio dalla connessione allo stesso progetto di Azure Machine Learning.

  9. Dopo l'avvio della connessione, la possibilità di etichettare i dati in Language Studio verrà disabilitata per alcuni minuti in preparazione della nuova connessione.

Passare all'etichettatura con Azure Machine Learning da Language Studio

Dopo aver stabilito la connessione, è possibile passare in qualsiasi momento ad Azure Machine Learning tramite il riquadro Attività in Language Studio.

Screenshot che mostra il pulsante per passare all'etichettatura con Azure Machine Learning.

Al momento del passaggio, la possibilità di etichettare i dati in Language Studio verrà disabilitata e sarà possibile etichettare i dati in Azure Machine Learning. È possibile tornare all'etichettatura in Language Studio in qualsiasi momento tramite Azure Machine Learning.

Per informazioni su come etichettare il testo, vedere Come etichettare in Azure Machine Learning. Per informazioni sulla gestione e il rilevamento del progetto di etichettatura del testo, vedere Configurare e gestire un progetto di etichettatura del testo in Azure Machine Learning.

Eseguire il training del modello usando le etichette da Azure Machine Learning

Quando si passa all'etichettatura in Azure Machine Learning, è comunque possibile eseguire il training, valutare e distribuire il modello in Language Studio. Per eseguire il training del modello con le etichette aggiornate da Azure Machine Learning:

  1. Selezionare Processi di training dal menu di spostamento a sinistra della schermata Language Studio del progetto.

  2. Selezionare Importa etichette più recenti da Azure Machine Learning nella sezione Scegliere l'origine dell'etichetta nella pagina di training. In questo modo le etichette vengono sincronizzate da Azure Machine Learning prima dell’avvio del processo di training.

    Screenshot che mostra il selettore per l'uso delle etichette di Azure Machine Learning.

Passare all'etichettatura in Language Studio da Azure Machine Learning

Dopo essere passati all'etichettatura in Azure Machine Learning, è possibile tornare in qualsiasi momento all'etichettatura con il progetto di Language Studio.

Nota

  • Solo gli utenti con i ruoli corretti in Azure Machine Learning possono passare da uno studio a un altro per l’etichettatura.
  • Quando si passa all'uso di Language Studio, l'etichettatura in Azure Machine Learning verrà disabilitata.

Per tornare all'etichettatura in Language Studio:

  1. Passare al progetto in Azure Machine Learning e selezionare Etichettatura dei dati dal menu di spostamento a sinistra.

  2. Selezionare la scheda Language Studio e selezionare Passa a Language Studio.

    Screenshot che mostra il selettore per l'uso delle etichette da Language Studio.

  3. Il completamento del processo richiede alcuni minuti e la possibilità di etichettare in Azure Machine Learning verrà disabilitata fino a quando non viene riattivata da Language Studio.

Disconnessione da Azure Machine Learning

La disconnessione del progetto da Azure Machine Learning è un processo permanente e irreversibile che non può essere annullato. Non sarà più possibile accedere alle etichette in Azure Machine Learning e in futuro non sarà possibile riconnettere il progetto di Azure Machine Learning a qualsiasi progetto di Language Studio. Per disconnettersi da Azure Machine Learning:

  1. Assicurarsi che tutte le etichette aggiornate da mantenere siano sincronizzate con Azure Machine Learning passando nuovamente all'esperienza di etichettatura in Language Studio.
  2. Selezionare Impostazioni progetto dal menu di spostamento a sinistra in Language Studio.
  3. Selezionare il pulsante Disconnetti da Azure Machine Learning nella sezione Gestisci connessioni di Azure Machine Learning.

Passaggi successivi

Altre informazioni sull'etichettatura dei dati per la classificazione personalizzata del testo e il riconoscimento di entità denominate personalizzate.