Kabul edilen veri biçimleri
Verilerinizi özel metin sınıflandırmasına aktarmaya çalışıyorsanız, bunun belirli bir biçime uyması gerekir. İçeri aktaracak verileriniz yoksa projenizi oluşturabilir ve Language Studio'yu kullanarak belgelerinizi etiketleyebilirsiniz.
Etiketler dosya biçimi
Etiketler dosyanız aşağıdaki biçimde olmalıdır json
. Bu sayede etiketlerinizi projeye aktarabilirsiniz .
{
"projectFileVersion": "2022-05-01",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectKind": "CustomMultiLabelClassification",
"storageInputContainerName": "{CONTAINER-NAME}",
"projectName": "{PROJECT-NAME}",
"multilingual": false,
"description": "Project-description",
"language": "en-us"
},
"assets": {
"projectKind": "CustomMultiLabelClassification",
"classes": [
{
"category": "Class1"
},
{
"category": "Class2"
}
],
"documents": [
{
"location": "{DOCUMENT-NAME}",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"classes": [
{
"category": "Class1"
},
{
"category": "Class2"
}
]
}
]
}
Anahtar | Yer tutucu | Değer | Örnek |
---|---|---|---|
Çok dilli | true |
Veri kümenizde birden çok dilde belgenizin olmasını sağlayan boole değeridir ve modeliniz dağıtıldığında modeli desteklenen herhangi bir dilde sorgulayabilirsiniz (eğitim belgelerinize dahil olması gerekmez). Çok dilli destek hakkında daha fazla bilgi edinmek için bkz. dil desteği. | true |
projectName | {PROJECT-NAME} |
Proje adı | Myproject |
storageInputContainerName | {CONTAINER-NAME} |
Kapsayıcı adı | mycontainer |
Sınıf | [] | Projedeki tüm sınıflarını içeren dizi. Bunlar, belgelerinizi sınıflandırmak istediğiniz sınıflardır. | [] |
belgelerde | [] | Projenizdeki tüm belgeleri ve bu belge için etiketlenmiş sınıfları içeren dizi. | [] |
location | {DOCUMENT-NAME} |
Depolama kapsayıcısında belgelerin konumu. Tüm belgeler kapsayıcının kökünde olduğundan, bu değer belge adı olmalıdır. | doc1.txt |
Dataset | {DATASET} |
Eğitimden önce bölündüğünde bu dosyanın gideceği test kümesi. Daha fazla bilgi için bkz. Modeli eğitme . Bu alanın olası değerleri ve Test 'tirTrain . |
Train |
Sonraki adımlar
- Etiketlenmiş verilerinizi doğrudan projenize aktarabilirsiniz. Projeleri içeri aktarma hakkında daha fazla bilgi edinmek için bkz. Proje oluşturma .
- Verilerinizi etiketleme hakkında daha fazla bilgi için nasıl yapılır makalesine bakın. Verilerinizi etiketlemeyi bitirdiğinizde modelinizi eğitebilirsiniz.