Delen via


Automatisch labelen gebruiken voor aangepaste benoemde entiteitsherkenning

Labelproces is een belangrijk onderdeel van het voorbereiden van uw gegevensset. Omdat dit proces zowel tijd als moeite kost, kunt u de functie voor automatisch labelen gebruiken om uw entiteiten automatisch te labelen. U kunt taken voor automatisch labelen starten op basis van een model dat u eerder hebt getraind of met behulp van GPT-modellen. Met automatisch labelen op basis van een model dat u eerder hebt getraind, kunt u beginnen met het labelen van een aantal van uw documenten, een model trainen en vervolgens een taak voor automatisch labelen maken om entiteitslabels te produceren voor andere documenten op basis van dat model. Met automatisch labelen met GPT kunt u onmiddellijk een taak voor automatisch labelen activeren zonder enige eerdere modeltraining. Met deze functie kunt u tijd en moeite besparen bij het handmatig labelen van uw entiteiten.

Vereisten

Voordat u automatisch labelen kunt gebruiken op basis van een model dat u hebt getraind, hebt u het volgende nodig:

Een taak voor automatisch labelen activeren

Wanneer u een taak voor automatisch labelen activeert op basis van een model dat u hebt getraind, is er een maandelijkse limiet van 5000 tekstrecords per maand, per resource. Dit betekent dat dezelfde limiet van toepassing is op alle projecten binnen dezelfde resource.

Tip

Een tekstrecord wordt berekend als het maximum van (aantal tekens in een document / 1000). Als een document bijvoorbeeld 8921 tekens bevat, is het aantal tekstrecords:

ceil(8921/1000) = ceil(8.921), dit zijn 9 tekstrecords.

  1. Selecteer Gegevenslabels in het linkernavigatiemenu.

  2. Selecteer de knop Autolabel onder het deelvenster Activiteit rechts van de pagina.

    Een schermopname die laat zien hoe u een autotag-taak activeert.

  3. Kies Automatisch labelen op basis van een model dat u hebt getraind en selecteer Volgende.

    Een schermopname van de modelkeuze voor automatisch labelen.

  4. Kies een getraind model. Het is raadzaam om de prestaties van het model te controleren voordat u deze gebruikt voor automatisch labelen.

    Een schermopname die laat zien hoe u een getraind model kiest voor automatisch opslaan.

  5. Kies de entiteiten die u wilt opnemen in de taak voor automatisch labelen. Standaard zijn alle entiteiten geselecteerd. U kunt de totale labels, precisie en terugroepactie van elke entiteit zien. Het is raadzaam om entiteiten op te nemen die goed presteren om de kwaliteit van de automatisch gelabelde entiteiten te garanderen.

    Een schermopname die laat zien welke entiteiten moeten worden opgenomen in de taak voor automatisch tagen.

  6. Kies de documenten die u automatisch wilt labelen. Het aantal tekstrecords van elk document wordt weergegeven. Wanneer u een of meer documenten selecteert, ziet u het aantal geselecteerde sms-records. Het is raadzaam om de niet-gelabelde documenten in het filter te kiezen.

    Notitie

    • Als een entiteit automatisch is gelabeld, maar een door de gebruiker gedefinieerd label heeft, wordt alleen het door de gebruiker gedefinieerde label gebruikt en zichtbaar.
    • U kunt de documenten weergeven door op de naam van het document te klikken.

    Een schermopname die laat zien welke documenten moeten worden opgenomen in de autotag-taak.

  7. Selecteer Automatisch labelen om de taak voor automatisch labelen te activeren. U ziet het gebruikte model, het aantal documenten dat is opgenomen in de taak voor automatisch labelen, het aantal tekstrecords en entiteiten dat automatisch moet worden gelabeld. Het automatisch labelen van taken kan een paar seconden tot een paar minuten duren, afhankelijk van het aantal documenten dat u hebt opgenomen.

    Een schermopname van het controlescherm voor een autotag-taak.

De automatisch gelabelde documenten controleren

Wanneer de taak voor automatisch labelen is voltooid, ziet u de uitvoerdocumenten op de pagina Gegevenslabeling van Language Studio. Selecteer Documenten met autolabels controleren om de documenten weer te geven waarop het filter Automatisch gelabeld is toegepast.

Een schermopname van de automatisch gelabelde documenten

Entiteiten die automatisch zijn gelabeld, worden weergegeven met een stippellijn. Deze entiteiten hebben twee selectors (een vinkje en een 'X') waarmee u het automatische label kunt accepteren of afwijzen.

Zodra een entiteit is geaccepteerd, verandert de stippellijn in een ononderbroken lijn en wordt het label opgenomen in elke verdere modeltraining en wordt het een door de gebruiker gedefinieerd label.

U kunt ook alle automatisch gelabelde entiteiten in het document accepteren of weigeren met behulp van Alles accepteren of Alles negeren in de rechterbovenhoek van het scherm.

Nadat u de gelabelde entiteiten hebt geaccepteerd of geweigerd, selecteert u Labels opslaan om de wijzigingen toe te passen.

Notitie

  • U wordt aangeraden automatisch gelabelde entiteiten te valideren voordat u ze accepteert.
  • Alle labels die niet zijn geaccepteerd, worden verwijderd wanneer u uw model traint.

Een schermopname die laat zien hoe u automatisch gelabelde entiteiten accepteert en afwijst.

Volgende stappen