Share via


固有表現認識 (NER) のデータを書式設定する方法

NER データセットの図形:

  • キー情報ファイル: キー情報ファイルには、トレーニング データのキー情報として機能するエンティティの一覧が含まれます。
  • トレーニング データ: トレーニング データは、Tab 文字で区切られた列を含むファイル (.txt、.tsv) で構成されます。 これらの列の 1 つは文の列で、他の列はその文の列内のトークンのラベルを表します。