Creare e ripetere il training di un classificatore sottoponibile a training
Un classificatore sottoponibile a training di Microsoft 365 è uno strumento che un'organizzazione può "addestrare" a riconoscere vari tipi di contenuti. L'organizzazione può farlo fornendo allo strumento diversi campioni di dati da esaminare. Una volta terminato il training di un classificatore, cioè una volta creato ed eseguito il training iniziale, un'organizzazione può continuare a "riqualificarlo" per migliorarne la precisione nell'identificare vari tipi di classificazioni di dati.
Questa unità esamina come creare un classificatore sottoponibile a training e come ripetere il training di un classificatore esistente.
Come creare un classificatore sottoponibile a training
Completare i seguenti passaggi per creare, testare e pubblicare un classificatore sottoponibile a training personalizzato:
Raccogliere tra i 50-500 elementi di contenuto di inizializzazione. Questi elementi di contenuto devono essere solo esempi. Devono anche rappresentare fortemente il tipo di contenuto che il classificatore sottoponibile a training deve identificare in modo positivo come incluso nella categoria di classificazione.
Importante
È necessario verificare che gli elementi nel set di inizializzazione siano esempi forti della categoria. Il classificatore sottoponibile a training compila inizialmente il modello in base al valore di inizializzazione. Il classificatore presuppone che tutti i campioni di inizializzazione siano corrispondenze positive forti. Non è possibile sapere se un campione è una corrispondenza debole o negativa con la categoria.
Inserire il contenuto di inizializzazione in una cartella di SharePoint Online dedicata a contenere solo il contenuto di inizializzazione. Prendere nota dell'URL del sito, della raccolta e della cartella.
Consiglio
Se si crea un nuovo sito e una nuova cartella per i dati di inizializzazione, consentire al sistema di indicizzare tale percorso almeno un'ora prima di creare il classificatore sottoponibile a training che usa tali dati di inizializzazione.
Accedere al Portale di conformità di Microsoft Purview con accesso al ruolo Amministratore di conformità o Amministratore della sicurezza. Selezionare quindi Classificazione dati nel riquadro di navigazione per espandere il gruppo.
Nel gruppo Classificazione dati selezionare Classificatori.
Nella pagina Classificatori la scheda Classificatori sottoponibili a training deve essere visualizzata per impostazione predefinita.
Nella scheda Classificatori sottoponibili a training selezionare +Crea classificatore sottoponibile a training sulla barra del menu.
Compilare i valori appropriati per i campi Nome e Descrizione della categoria di elementi che si desidera identificare da questo classificatore sottoponibile a training.
Selezionare l'URL del sito, della raccolta e della cartella di SharePoint Online per il sito di contenuto di inizializzazione del passaggio 2. Selezionare Aggiungi.
Esaminare le impostazioni e selezionare Crea classificatore sottoponibile a training.
Il classificatore sottoponibile a training può richiedere fino a 24 ore per elaborare i dati di inizializzazione e creare un modello di stima. Lo stato del classificatore è In corso durante l'elaborazione dei dati di inizializzazione. Quando il classificatore termina l'elaborazione dei dati di inizializzazione, lo stato diventa Elementi di test necessari.
Al termine dell'elaborazione dei dati di inizializzazione, selezionare il classificatore per visualizzarne la pagina dei dettagli.
Raccogliere almeno 200 elementi di contenuto di test per ottenere risultati ottimali (massimo 10.000). Questi elementi devono essere una combinazione di elementi che sono positivi forti, negativi forti e alcuni che sono un po' meno evidenti per loro natura.
Inserire il contenuto di test in una cartella di SharePoint Online dedicata a contenere solo il contenuto di test. Prendere nota dell'URL del sito, della raccolta e della cartella di SharePoint Online.
Consiglio
Se si crea un nuovo sito e una nuova cartella per i dati di test, consentire al sistema di indicizzare tale percorso almeno un'ora prima di creare il classificatore sottoponibile a training che usa tali dati di inizializzazione.
Selezionare Aggiungi elementi da testare.
Selezionare l'URL del sito, della raccolta e della cartella di SharePoint Online per il sito del contenuto di test del passaggio 12. Selezionare Aggiungi.
Completare la procedura guidata selezionando Fine. Il classificatore sottoponibile a training richiede fino a un'ora per elaborare i file di test.
Quando il classificatore sottoponibile a training termina l'elaborazione dei file di test, lo stato nella pagina dei dettagli diventa Pronto per la revisione. Per aumentare le dimensioni del campione di test, selezionare Aggiungere elementi da testare e consentire al classificatore sottoponibile a training di elaborare gli elementi aggiuntivi.
Selezionare la scheda Elementi testati da revisionare per revisionare gli elementi.
Microsoft 365 visualizza 30 elementi alla volta. Esaminare ogni elemento. Per ogni elemento viene visualizzata una finestra di dialogo che chiede se si è d'accordo con la valutazione dell'elemento. Lo screenshot seguente mostra la valutazione Prevediamo che questo elemento sia "Rilevante". Sei d'accordo?. È possibile rispondere selezionando Sì, No, o Non sono sicuro, passare all'elemento successivo. Il sistema aggiorna automaticamente l'accuratezza del modello ogni 30 elementi.
Esaminare almeno 200 elementi. Dopo che il sistema ha stabilizzato il punteggio di accuratezza, l'opzione Pubblica diventa disponibile e lo stato del classificatore diventa Pronto per l'uso.
Selezionare l'opzione Pubblica per pubblicare il classificatore.
Dopo aver pubblicato il classificatore, quest’ultimo diventa disponibile come condizione in:
Come ripetere il training di un classificatore
Poiché un'organizzazione usa i classificatori sottoponibili a training personalizzati, può voler aumentare la precisione delle classificazioni eseguite dai classificatori. È possibile aumentare la precisione valutando la qualità delle classificazioni "match" e "not a match" effettuate dal classificatore. Dopo aver effettuato 30 valutazioni per un classificatore, quest'ultimo accetta il feedback e ripete automaticamente il training.
Un'organizzazione può migliorare l'accuratezza dei classificatori sottoponibili a training personalizzati. Il miglioramento dell'accuratezza di un classificatore sottoponibile a training è noto come “ripetizione del training” del classificatore. Per ripetere il training di un classificatore sottoponibile a training, l'organizzazione deve fornire feedback sull'accuratezza delle classificazioni eseguite.
Nota
Un'organizzazione non può ripetere il training dei classificatori con training preliminare forniti con il tenant Microsoft 365.
Il diagramma seguente illustra il processo del flusso di lavoro per la ripetizione del training di un classificatore sottoponibile a training.
Le organizzazioni possono ripetere il training dei classificatori sottoponibili a training personalizzati nella sezione Classificazione dei dati del Portale di conformità di Microsoft Purview. Le organizzazioni devono completare i passaggi seguenti per ripetere il training di un classificatore:
Nel Portale di conformità di Microsoft Purview selezionare Classificazione dei dati nel riquadro di spostamento per espandere il gruppo.
Nel gruppo Classificazione dei dati selezionare Esplora contenuto.
Nella pagina Esplora contenuto, nell'elenco Filtro su etichette, tipi di informazioni o categorie, scorrere fino alla sezione Classificatori sottoponibili a training.
Importante
La visualizzazione degli elementi aggregati nella sezione Classificatori sottoponibili a training può richiedere fino a otto giorni.
Selezionare il classificatore sottoponibile a training di cui ripetere il training.
Nota
Se un elemento ha una voce nella colonna Etichetta di conservazione, significa che il sistema ha classificato l'elemento come corrispondente. Se un elemento non ha una voce nella colonna Etichetta di conservazione, significa che il sistema lo ha classificato come una corrispondenza stretta. È possibile migliorare la precisione del classificatore fornendo un feedback sugli elementi che hanno una corrispondenza stretta.
Scegliere un elemento e aprirlo.
Selezionare Fornire un feedback.
Nel riquadro Feedback dettagliato, se l'elemento è un vero positivo, selezionare Match. Se l'elemento è un falso positivo, ovvero è stato incluso erroneamente nella categoria, selezionare Not a match.
Se è presente un altro classificatore più appropriato per l'elemento, è possibile sceglierlo dall'elenco Suggerisci altri classificatori sottoponibili a training. In questo modo viene attivato l'altro classificatore per valutare l'elemento.
Selezionare Invia feedback per inviare la valutazione delle classificazioni "match" e "not a match". È anche possibile suggerire altri elementi per questo classificatore sottoponibile a training. Dopo aver fornito 30 istanze di feedback a un classificatore, viene avviato automaticamente il processo di ripetizione del training. La ripetizione del training può richiedere da una a quattro ore. È possibile ripetere il training dei classificatori solo due volte al giorno.
Importante
Queste informazioni vengono indirizzate al classificatore nel tenant. Non vengono restituite a Microsoft.
Nella pagina Classificatori selezionare la scheda Classificatori sottoponibili a training.
Il classificatore usato nei criteri di conformità delle comunicazioni viene visualizzato sotto l'intestazione Ripetizione del training.
Al termine della ripetizione del training, scegliere il classificatore per aprire la panoramica della ripetizione del training.
Esaminare l'azione consigliata e il confronto delle previsioni della versione del classificatore che ha ripetuto il training e di quella attualmente pubblicata.
Se si è soddisfatti dei risultati della ripetizione del training, selezionare Ripubblicare.
Se non si è soddisfatti dei risultati della ripetizione del training, è possibile scegliere di fornire più commenti e suggerimenti al classificatore nella scheda Esplora contenuto e avviare un altro ciclo di ripetizione del training. In alternativa, si può scegliere di non fare nulla, in questo caso il sistema continuerà a utilizzare la versione attualmente pubblicata del classificatore.