Sdílet prostřednictvím


Formátování dat pro rozpoznávání pojmenovaných entit (NER)

Obrazce datové sady NER:

  • Soubor s informacemi o klíči: Soubor informací o klíči obsahuje seznam entit, které slouží jako klíčové informace pro trénovací data.
  • Trénovací data: Trénovací data se skládají ze souboru (.txt, .tsv) obsahujícího sloupce oddělené znakem tabulátoru. Jeden ze sloupců je sloupec věty, zatímco ostatní představují popisky tokenů ve sloupci věty.