Een model voor voorspellende codering trainen (preview)

Nadat u een voorspellend coderingsmodel hebt gemaakt in Microsoft Purview eDiscovery (Premium), is de volgende stap het uitvoeren van de eerste trainingsronde om het model te trainen op wat relevante en niet-relevante inhoud in uw beoordelingsset is. Nadat u de eerste trainingsronde hebt voltooid, kunt u volgende trainingsrondes uitvoeren om het model beter in staat te maken om relevante en niet-relevante inhoud te voorspellen.

Zie Meer informatie over voorspellende codering in eDiscovery (Premium) voor meer informatie over de werkstroom voor voorspellende codering

Tip

Als u geen E5-klant bent, kunt u alle premium-functies in Microsoft Purview gratis uitproberen. Gebruik de 90-daagse proefversie van Purview-oplossingen om te ontdekken hoe robuuste Purview-mogelijkheden uw organisatie kunnen helpen bij het beheren van gegevensbeveiliging en nalevingsbehoeften. Begin nu bij de hub Microsoft Purview-nalevingsportal proefversies. Meer informatie over registratie- en proefvoorwaarden.

Voordat u een model traint

  • Tijdens een trainingsronde labelt u items als Relevant of Niet relevant op basis van de relevantie van de inhoud in het document. Baseer uw beslissing niet op de waarden in de metagegevensvelden. Voor e-mailberichten of Teams-gesprekken moet u bijvoorbeeld uw labelbeslissing niet baseren op de deelnemers aan het bericht.

Een model voor de eerste keer trainen

  1. Open in de Microsoft Purview-nalevingsportal een eDiscovery-case (Premium) en selecteer vervolgens het tabblad Sets controleren.

  2. Open een beoordelingsset en selecteer vervolgens Analyse>Voorspellende codering beheren (preview).

  3. Selecteer op de pagina Voorspellende coderingsmodellen (preview) het model dat u wilt trainen.

  4. Selecteer op het tabblad Overzicht onder Ronde 1de optie Volgende trainingsronde starten.

    Het tabblad Training wordt weergegeven en bevat 50 items die u kunt labelen.

  5. Controleer elk document en selecteer vervolgens de knop Relevant of Niet relevant onderaan het leesvenster om het te labelen.

    Label elk document als relevant of niet-relevant.

  6. Nadat u alle 50 items hebt gelabeld, selecteert u Voltooien.

    Het duurt een paar minuten voordat het systeem 'leert' van uw labeling en het model bijwerkt. Wanneer dit proces is voltooid, wordt de status Gereed weergegeven voor het model op de pagina Voorspellende coderingsmodellen (preview).

Aanvullende trainingsrondes uitvoeren

Nadat u de eerste trainingsronde hebt uitgevoerd, kunt u volgende trainingsrondes uitvoeren door de stappen in de vorige sectie te volgen. Het enige verschil is dat het nummer van de trainingsronde wordt bijgewerkt op het tabblad Overzicht van het model. Nadat u bijvoorbeeld de eerste trainingsronde hebt uitgevoerd, kunt u Volgende trainingsronde starten selecteren om de tweede trainingsronde te starten. Enzovoort.

Elke trainingsronde (zowel actieve als voltooide) wordt weergegeven op het tabblad Training voor het model. Wanneer u een trainingsronde selecteert, wordt een flyoutpagina met informatie en metrische gegevens voor de ronde weergegeven.

Wat gebeurt er nadat u een trainingsronde hebt uitgevoerd

Nadat u de eerste trainingsronde hebt uitgevoerd, wordt er een taak gestart die het volgende doet:

  • Op basis van hoe u de 40 items in de trainingsset hebt gelabeld, leert het model van uw labeling en werkt het zichzelf bij om nauwkeuriger te worden.

  • Het model verwerkt vervolgens elk item in de hele beoordelingsset en wijst een voorspellingsscore toe tussen 0 (niet relevant) en 1 (relevant).

  • Het model wijst een voorspellingsscore toe aan de tien items in de besturingsset die u tijdens de trainingsronde hebt gelabeld. Het model vergelijkt de voorspellingsscore van deze 10 items met het werkelijke label dat u tijdens de trainingsronde aan het item hebt toegewezen. Op basis van deze vergelijking identificeert het model de volgende classificatie (de verwarringsmatrix van de besturingsset genoemd) om de voorspellingsprestaties van het model te beoordelen:



Label Model voorspelt dat item relevant is Model voorspelt item is niet relevant
Revisor labelt item als relevant Waar positief Fout-positief
Revisor labelt item als niet relevant Fout-negatief Waar negatief

Op basis van deze vergelijkingen leidt het model waarden af voor de F-score, precisie en recall-metrische gegevens en de foutmarge voor elke waarde. Scores voor deze metrische gegevens over modelprestaties worden weergegeven op een flyoutpagina voor de trainingsronde. Zie Naslaginformatie over voorspellende codering voor een beschrijving van deze metrische gegevens.

  • Ten slotte bepaalt het model de volgende 50 items die worden gebruikt voor de volgende trainingsronde. Deze keer kan het model 20 items uit de besturingsset en 30 nieuwe items uit de beoordelingsset selecteren en deze aanwijzen als de trainingsset voor de volgende ronde. De steekproeven voor de volgende trainingsronde worden niet uniform bemonsterd. Het model optimaliseert de steekproefselectie van items uit de beoordelingsset om items te selecteren waarvoor de voorspelling dubbelzinnig is, wat betekent dat de voorspellingsscore zich in het bereik van 0,5 bevindt. Dit proces staat bekend als bevooroordeende selectie.

Wat gebeurt er nadat u volgende trainingsrondes hebt uitgevoerd

Nadat u volgende trainingsrondes hebt uitgevoerd (na de eerste trainingsronde), doet het model het volgende:

  • Het model wordt bijgewerkt op basis van de labels die u hebt toegepast op de trainingsset in die trainingsronde.
  • Het systeem evalueert de voorspellingsscore van het model op de items in de besturingsset en controleert of de score overeenkomt met de wijze waarop u items in de besturingsset hebt gelabeld. De evaluatie wordt uitgevoerd op alle gelabelde items uit de besturingsset voor alle trainingsrondes. De resultaten van deze evaluatie zijn opgenomen in het dashboard op het tabblad Overzicht voor het model.
  • Het bijgewerkte model verwerkt elk item in de beoordelingsset opnieuw en wijst elk item een bijgewerkte voorspellingsscore toe.

Volgende stappen

Nadat u de eerste trainingsronde hebt uitgevoerd, kunt u meer trainingsrondes uitvoeren of het voorspellingsscorefilter van het model toepassen op de beoordelingsset om de items weer te geven die het model al dan niet relevant heeft voorspeld. Zie Een voorspellingsscorefilter toepassen op een beoordelingsset voor meer informatie.