Partager via


Mise en forme des données pour la reconnaissance d’entité nommée (NER)

Formes de jeu de données NER :

  • Fichier d’informations clés : le fichier d’information clé contient une liste d’entités, qui sert d’informations clés pour les données de formation.
  • Données de formation : les données de formation se composent d’un fichier (.txt, .tsv) contenant des colonnes séparées par un caractère de tabulation. L’une de ces colonnes est une colonne de phrase, tandis que les autres représentent des étiquettes pour les jetons de la colonne de phrases.