Elfogadott adatformátumok
Ha egyéni szövegbesorolásba próbálja importálni az adatokat, annak egy adott formátumot kell követnie. Ha nincs importálandó adata, létrehozhatja a projektet , és a Language Studióval címkézheti a dokumentumokat.
Címkék fájlformátuma
A Labels fájlnak az json
alábbi formátumban kell lennie. Ez lehetővé teszi, hogy a címkéket egy projektbe importálja .
{
"projectFileVersion": "2022-05-01",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectKind": "CustomMultiLabelClassification",
"storageInputContainerName": "{CONTAINER-NAME}",
"projectName": "{PROJECT-NAME}",
"multilingual": false,
"description": "Project-description",
"language": "en-us"
},
"assets": {
"projectKind": "CustomMultiLabelClassification",
"classes": [
{
"category": "Class1"
},
{
"category": "Class2"
}
],
"documents": [
{
"location": "{DOCUMENT-NAME}",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"classes": [
{
"category": "Class1"
},
{
"category": "Class2"
}
]
}
]
}
Kulcs | Helyőrző | Érték | Példa |
---|---|---|---|
Többnyelvű | true |
Logikai érték, amely lehetővé teszi, hogy az adathalmazban több nyelven is legyenek dokumentumok, és a modell üzembe helyezésekor a modellt bármilyen támogatott nyelven lekérdezheti (ez nem feltétlenül szerepel a betanítási dokumentumokban). A többnyelvű támogatásról további információt a nyelvi támogatás című témakörben talál. | true |
projectName | {PROJECT-NAME} |
Projektnév | myproject |
storageInputContainerName | {CONTAINER-NAME} |
Tárolónév | mycontainer |
Osztályok | [] | A projektben található összes osztályt tartalmazó tömb. Ezek azok az osztályok, amelyekbe a dokumentumokat osztályozni szeretné. | [] |
dokumentumokban | [] | A projekt összes dokumentumát és a dokumentumhoz címkézett osztályokat tartalmazó tömb. | [] |
location | {DOCUMENT-NAME} |
A dokumentumok helye a tárolóban. Mivel az összes dokumentum a tároló gyökerében található, ennek az értéknek a dokumentum nevének kell lennie. | doc1.txt |
Adatkészlet | {DATASET} |
Az a tesztkészlet, amelyre a fájl a betanítás előtt felosztáskor kerül. További információért lásd : Modell betanítása . A mező lehetséges értékei a következők: Train és Test . |
Train |
Következő lépések
- A címkézett adatokat közvetlenül importálhatja a projektbe. A projektek importálásával kapcsolatos további információkért lásd: Projekt létrehozása .
- Az adatok címkézéséről további információt az útmutatóban talál. Ha végzett az adatok címkézésével, betanítheti a modellt.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: