Jak používat automatické popisování pro vlastní rozpoznávání pojmenovaných entit

Proces popisování je důležitou součástí přípravy datové sady. Vzhledem k tomu, že tento proces vyžaduje čas i úsilí, můžete k automatickému označení entit použít funkci automatického označování. Úlohy automatického popisování můžete spustit na základě modelu, který jste dříve vytrénovali, nebo pomocí modelů GPT. Pomocí automatického popisování založeného na modelu, který jste dříve vytrénovali, můžete začít označovat několik dokumentů, vytrénovat model a pak vytvořit úlohu automatického označování, která vytvoří popisky entit pro další dokumenty založené na daném modelu. Při automatickém popisování pomocí GPT můžete okamžitě aktivovat úlohu automatického popisování bez předchozího trénování modelu. Tato funkce vám může ušetřit čas a úsilí při ručním označování entit.

Požadavky

Než budete moct používat automatické popisky na základě vytrénovaného modelu, potřebujete:

Aktivace úlohy automatického popisování

Když na základě vytrénovaného modelu aktivujete úlohu automatického popisování, platí měsíční limit 5 000 textových záznamů za měsíc a prostředek. To znamená, že stejný limit platí pro všechny projekty v rámci stejného zdroje.

Tip

Textový záznam se vypočítá jako horní mez (Počet znaků v dokumentu / 1 000). Pokud má dokument například 8921 znaků, počet textových záznamů je:

ceil(8921/1000) = ceil(8.921), což je 9 textových záznamů.

  1. V levé navigační nabídce vyberte Popisování dat.

  2. V podokně Aktivita napravo od stránky vyberte tlačítko Automatické popisky .

    Snímek obrazovky znázorňující, jak aktivovat úlohu automatické značky

  3. Zvolte Automatické popisky na základě modelu, který jste natrénovali, a vyberte Další.

    Snímek obrazovky znázorňující volbu modelu pro automatické popisování

  4. Zvolte vytrénovaný model. Než ho použijete k automatickému popisování, doporučujeme zkontrolovat výkon modelu.

    Snímek obrazovky znázorňující, jak zvolit vytrénovaný model pro automatické označování

  5. Zvolte entity, které chcete zahrnout do úlohy automatického popisování. Ve výchozím nastavení jsou vybrány všechny entity. Můžete zobrazit popisky celkového součtu, přesnost a úplnost každé entity. Doporučuje se zahrnout entity, které dobře fungují, aby se zajistila kvalita automaticky označených entit.

    Snímek obrazovky znázorňující entity, které se mají zahrnout do úlohy automatické značky

  6. Vyberte dokumenty, u které chcete automaticky označovat popisky. Zobrazí se počet textových záznamů každého dokumentu. Když vyberete jeden nebo více dokumentů, měl by se zobrazit počet vybraných textových záznamů. Doporučujeme zvolit neoznačené dokumenty z filtru.

    Poznámka

    • Pokud byla entita označena automaticky, ale má popisek definovaný uživatelem, použije se a zobrazí se pouze popisek definovaný uživatelem.
    • Dokumenty můžete zobrazit kliknutím na název dokumentu.

    Snímek obrazovky znázorňující dokumenty, které se mají zahrnout do úlohy automatické značky

  7. Výběrem možnosti Autolabel (Automatický popisek ) aktivujte úlohu automatického popisování. Měli byste vidět použitý model, počet dokumentů zahrnutých v úloze automatického označování, počet textových záznamů a entit, které se mají automaticky označovat. Úlohy automatického popisování můžou v závislosti na počtu zahrnutých dokumentů trvat od několika sekund až po několik minut.

    Snímek obrazovky zobrazující obrazovku revize pro úlohu automatické značky

Kontrola dokumentů s automatickým popiskem

Po dokončení úlohy automatického označování uvidíte výstupní dokumenty na stránce Popisování dat v nástroji Language Studio. Výběrem možnosti Zkontrolovat dokumenty pomocí automatických popisků zobrazíte dokumenty s použitým filtrem Automaticky označené .

Snímek obrazovky zobrazující automaticky označené dokumenty

Automaticky označené entity se zobrazí s tečkovanou čárou. Tyto entity mají dva selektory (zaškrtnutí a X), které umožňují přijmout nebo odmítnout automatický popisek.

Jakmile entitu přijmete, tečkovaná čára se změní na plnou a popisek se zahrne do dalšího trénování modelu a stane se popiskem definovaným uživatelem.

Alternativně můžete přijmout nebo odmítnout všechny automaticky označené entity v dokumentu pomocí možnosti Přijmout vše nebo Odmítnout vše v pravém horním rohu obrazovky.

Po přijetí nebo odmítnutí označených entit vyberte Uložit popisky , aby se změny použily.

Poznámka

  • Před přijetím automaticky označených entit doporučujeme ověřovat.
  • Všechny popisky, které nebyly přijaty, se při trénování modelu odstraní.

Snímek obrazovky znázorňující, jak přijímat a odmítat automaticky oznamované entity

Další kroky