Delen via


Automatisch labelen gebruiken voor aangepaste tekstclassificatie

Het labelproces is een belangrijk onderdeel van het voorbereiden van uw gegevensset. Omdat dit proces veel tijd en moeite kost, kunt u de functie voor automatisch labelen gebruiken om uw documenten automatisch te labelen met de klassen waar u ze in wilt categoriseren. U kunt momenteel taken automatisch labelen op basis van een model met behulp van GPT-modellen, waarbij u onmiddellijk een taak voor automatisch labelen kunt activeren zonder voorafgaande modeltraining. Met deze functie kunt u tijd en moeite besparen bij het handmatig labelen van uw documenten.

Vereisten

Voordat u autolabeling met GPT kunt gebruiken, hebt u het volgende nodig:


Een taak voor automatisch labelen activeren

Wanneer u een taak voor automatisch labelen activeert met GPT, worden er kosten in rekening gebracht bij uw Azure OpenAI-resource op basis van uw verbruik. Er wordt een schatting in rekening gebracht van het aantal tokens in elk document dat automatisch wordt gelabeld. Raadpleeg de pagina met prijzen voor Azure OpenAI voor een gedetailleerde specificatie van de prijzen per token van verschillende modellen.

  1. Selecteer gegevenslabels in het linkernavigatiemenu.

  2. Selecteer de knop Autolabel onder het deelvenster Activiteit rechts van de pagina.

    Een schermopname die laat zien hoe u een taak met automatische tag kunt activeren vanuit het activiteitsvenster.

  3. Kies Automatisch labelen met GPT en selecteer Volgende.

    Een schermopname van de modelkeuze voor automatisch labelen.

  4. Kies uw Azure OpenAI-resource en -implementatie. U moet een Azure OpenAI-resource maken en een model implementeren om door te gaan.

    Een schermopname die laat zien hoe u OpenAI-resource en -implementaties kiest

  5. Selecteer de klassen die u wilt opnemen in de taak voor automatisch labelen. Standaard zijn alle klassen geselecteerd. Het gebruik van beschrijvende namen voor klassen en het opnemen van voorbeelden voor elke klasse wordt aanbevolen om goede kwaliteitslabels te bereiken met GPT.

    Een schermopname die laat zien welke labels moeten worden opgenomen in de autotag-taak.

  6. Kies de documenten die u automatisch wilt labelen. Het is raadzaam om de niet-gelabelde documenten in het filter te kiezen.

    Notitie

    • Als een document automatisch is gelabeld, maar dit label al door de gebruiker is gedefinieerd, wordt alleen het door de gebruiker gedefinieerde label gebruikt.
    • U kunt de documenten weergeven door op de naam van het document te klikken.

    Een schermopname die laat zien welke documenten moeten worden opgenomen in de autotag-taak.

  7. Selecteer Taak starten om de taak voor automatisch labelen te activeren. U wordt omgeleid naar de pagina voor automatisch labelen met de gestarte taken voor automatisch labelen. Het automatisch labelen van taken kan enkele seconden tot een paar minuten duren, afhankelijk van het aantal documenten dat u hebt opgenomen.

    Een schermopname van het controlescherm voor een taak met automatische markering.


De automatisch gelabelde documenten controleren

Wanneer de taak voor automatisch labelen is voltooid, ziet u de uitvoerdocumenten op de pagina Gegevenslabeling van Language Studio. Selecteer Documenten met automatische labels controleren om de documenten weer te geven waarop het filter Automatisch is toegepast.

Een schermopname van de automatisch gelabelde documenten

Documenten die automatisch zijn geclassificeerd, hebben voorgestelde labels in het activiteitsvenster paars gemarkeerd. Elk voorgesteld label heeft twee selectors (een vinkje en een annuleringspictogram) waarmee u het automatische label kunt accepteren of weigeren.

Zodra een label is geaccepteerd, verandert de paarse kleur in de standaardblauwe kleur en wordt het label opgenomen in elke verdere modeltraining om een door de gebruiker gedefinieerd label te worden.

Nadat u de labels voor de automatisch gelabelde documenten hebt geaccepteerd of afgewezen, selecteert u Labels opslaan om de wijzigingen toe te passen.

Notitie

  • U wordt aangeraden automatisch gelabelde documenten te valideren voordat u ze accepteert.
  • Alle labels die niet zijn geaccepteerd, worden verwijderd wanneer u uw model traint.

Een schermopname die laat zien hoe u automatisch gelabelde documenten kunt accepteren en weigeren.

Volgende stappen