Jak používat automatické popisování pro vlastní rozpoznávání pojmenovaných entit
Proces popisování je důležitou součástí přípravy datové sady. Vzhledem k tomu, že tento proces vyžaduje čas i úsilí, můžete k automatickému označení entit použít funkci automatického označování. Úlohy automatického popisování můžete spustit na základě modelu, který jste dříve vytrénovali, nebo pomocí modelů GPT. Pomocí automatického popisování založeného na modelu, který jste dříve vytrénovali, můžete začít označovat několik dokumentů, vytrénovat model a pak vytvořit úlohu automatického označování, která vytvoří popisky entit pro další dokumenty založené na daném modelu. Při automatickém popisování pomocí GPT můžete okamžitě aktivovat úlohu automatického popisování bez předchozího trénování modelu. Tato funkce vám může ušetřit čas a úsilí při ručním označování entit.
Požadavky
Než budete moct používat automatické popisky na základě vytrénovaného modelu, potřebujete:
- Úspěšně vytvořený projekt s nakonfigurovaným účtem úložiště objektů blob v Azure
- Textová data, která se nahrála do vašeho účtu úložiště.
- Popsaná data
- Úspěšně natrénovaný model
Aktivace úlohy automatického popisování
Když na základě vytrénovaného modelu aktivujete úlohu automatického popisování, platí měsíční limit 5 000 textových záznamů za měsíc a prostředek. To znamená, že stejný limit platí pro všechny projekty v rámci stejného zdroje.
Tip
Textový záznam se vypočítá jako horní mez (Počet znaků v dokumentu / 1 000). Pokud má dokument například 8921 znaků, počet textových záznamů je:
ceil(8921/1000) = ceil(8.921)
, což je 9 textových záznamů.
V levé navigační nabídce vyberte Popisování dat.
V podokně Aktivita napravo od stránky vyberte tlačítko Automatické popisky .
Zvolte Automatické popisky na základě modelu, který jste natrénovali, a vyberte Další.
Zvolte vytrénovaný model. Než ho použijete k automatickému popisování, doporučujeme zkontrolovat výkon modelu.
Zvolte entity, které chcete zahrnout do úlohy automatického popisování. Ve výchozím nastavení jsou vybrány všechny entity. Můžete zobrazit popisky celkového součtu, přesnost a úplnost každé entity. Doporučuje se zahrnout entity, které dobře fungují, aby se zajistila kvalita automaticky označených entit.
Vyberte dokumenty, u které chcete automaticky označovat popisky. Zobrazí se počet textových záznamů každého dokumentu. Když vyberete jeden nebo více dokumentů, měl by se zobrazit počet vybraných textových záznamů. Doporučujeme zvolit neoznačené dokumenty z filtru.
Poznámka
- Pokud byla entita označena automaticky, ale má popisek definovaný uživatelem, použije se a zobrazí se pouze popisek definovaný uživatelem.
- Dokumenty můžete zobrazit kliknutím na název dokumentu.
Výběrem možnosti Autolabel (Automatický popisek ) aktivujte úlohu automatického popisování. Měli byste vidět použitý model, počet dokumentů zahrnutých v úloze automatického označování, počet textových záznamů a entit, které se mají automaticky označovat. Úlohy automatického popisování můžou v závislosti na počtu zahrnutých dokumentů trvat od několika sekund až po několik minut.
Kontrola dokumentů s automatickým popiskem
Po dokončení úlohy automatického označování uvidíte výstupní dokumenty na stránce Popisování dat v nástroji Language Studio. Výběrem možnosti Zkontrolovat dokumenty pomocí automatických popisků zobrazíte dokumenty s použitým filtrem Automaticky označené .
Automaticky označené entity se zobrazí s tečkovanou čárou. Tyto entity mají dva selektory (zaškrtnutí a X), které umožňují přijmout nebo odmítnout automatický popisek.
Jakmile entitu přijmete, tečkovaná čára se změní na plnou a popisek se zahrne do dalšího trénování modelu a stane se popiskem definovaným uživatelem.
Alternativně můžete přijmout nebo odmítnout všechny automaticky označené entity v dokumentu pomocí možnosti Přijmout vše nebo Odmítnout vše v pravém horním rohu obrazovky.
Po přijetí nebo odmítnutí označených entit vyberte Uložit popisky , aby se změny použily.
Poznámka
- Před přijetím automaticky označených entit doporučujeme ověřovat.
- Všechny popisky, které nebyly přijaty, se při trénování modelu odstraní.
Další kroky
- Přečtěte si další informace o označování dat.
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro