Formátování dat pro rozpoznávání pojmenovaných entit (NER)
Obrazce datové sady NER:
- Soubor s informacemi o klíči: Soubor informací o klíči obsahuje seznam entit, které slouží jako klíčové informace pro trénovací data.
- Trénovací data: Trénovací data se skládají ze souboru (.txt, .tsv) obsahujícího sloupce oddělené znakem tabulátoru. Jeden ze sloupců je sloupec věty, zatímco ostatní představují popisky tokenů ve sloupci věty.
Spolupracujte s námi na GitHubu
Zdroj tohoto obsahu najdete na GitHubu, kde můžete také vytvářet a kontrolovat problémy a žádosti o přijetí změn. Další informace najdete v našem průvodci pro přispěvatele.