Megosztás a következőn keresztül:


Elfogadott adatformátumok

Ha egyéni szövegbesorolásba próbálja importálni az adatokat, annak egy adott formátumot kell követnie. Ha nincs importálandó adata, létrehozhatja a projektet , és a Language Studióval címkézheti a dokumentumokat.

Címkék fájlformátuma

A Labels fájlnak az json alábbi formátumban kell lennie. Ez lehetővé teszi, hogy a címkéket egy projektbe importálja .

{
    "projectFileVersion": "2022-05-01",
    "stringIndexType": "Utf16CodeUnit",
    "metadata": {
      "projectKind": "CustomMultiLabelClassification",
      "storageInputContainerName": "{CONTAINER-NAME}",
      "projectName": "{PROJECT-NAME}",
      "multilingual": false,
      "description": "Project-description",
      "language": "en-us"
    },
    "assets": {
      "projectKind": "CustomMultiLabelClassification",
      "classes": [
        {
          "category": "Class1"
        },
        {
          "category": "Class2"
        }
      ],
      "documents": [
          {
              "location": "{DOCUMENT-NAME}",
              "language": "{LANGUAGE-CODE}",
              "dataset": "{DATASET}",
              "classes": [
                  {
                      "category": "Class1"
                  },
                  {
                      "category": "Class2"
                  }
              ]
          }
      ]
  }
Kulcs Helyőrző Érték Példa
Többnyelvű true Logikai érték, amely lehetővé teszi, hogy az adathalmazban több nyelven is legyenek dokumentumok, és a modell üzembe helyezésekor a modellt bármilyen támogatott nyelven lekérdezheti (ez nem feltétlenül szerepel a betanítási dokumentumokban). A többnyelvű támogatásról további információt a nyelvi támogatás című témakörben talál. true
projectName {PROJECT-NAME} Projektnév myproject
storageInputContainerName {CONTAINER-NAME} Tárolónév mycontainer
Osztályok [] A projektben található összes osztályt tartalmazó tömb. Ezek azok az osztályok, amelyekbe a dokumentumokat osztályozni szeretné. []
dokumentumokban [] A projekt összes dokumentumát és a dokumentumhoz címkézett osztályokat tartalmazó tömb. []
location {DOCUMENT-NAME} A dokumentumok helye a tárolóban. Mivel az összes dokumentum a tároló gyökerében található, ennek az értéknek a dokumentum nevének kell lennie. doc1.txt
Adatkészlet {DATASET} Az a tesztkészlet, amelyre a fájl a betanítás előtt felosztáskor kerül. További információért lásd : Modell betanítása . A mező lehetséges értékei a következők: Train és Test. Train

Következő lépések

  • A címkézett adatokat közvetlenül importálhatja a projektbe. A projektek importálásával kapcsolatos további információkért lásd: Projekt létrehozása .
  • Az adatok címkézéséről további információt az útmutatóban talál. Ha végzett az adatok címkézésével, betanítheti a modellt.