Aracılığıyla paylaş


Kabul edilen veri biçimleri

Verilerinizi özel metin sınıflandırmasına aktarmaya çalışıyorsanız, bunun belirli bir biçime uyması gerekir. İçeri aktaracak verileriniz yoksa projenizi oluşturabilir ve Language Studio'yu kullanarak belgelerinizi etiketleyebilirsiniz.

Etiketler dosya biçimi

Etiketler dosyanız aşağıdaki biçimde olmalıdır json . Bu sayede etiketlerinizi projeye aktarabilirsiniz .

{
    "projectFileVersion": "2022-05-01",
    "stringIndexType": "Utf16CodeUnit",
    "metadata": {
      "projectKind": "CustomMultiLabelClassification",
      "storageInputContainerName": "{CONTAINER-NAME}",
      "projectName": "{PROJECT-NAME}",
      "multilingual": false,
      "description": "Project-description",
      "language": "en-us"
    },
    "assets": {
      "projectKind": "CustomMultiLabelClassification",
      "classes": [
        {
          "category": "Class1"
        },
        {
          "category": "Class2"
        }
      ],
      "documents": [
          {
              "location": "{DOCUMENT-NAME}",
              "language": "{LANGUAGE-CODE}",
              "dataset": "{DATASET}",
              "classes": [
                  {
                      "category": "Class1"
                  },
                  {
                      "category": "Class2"
                  }
              ]
          }
      ]
  }
Anahtar Yer tutucu Değer Örnek
Çok dilli true Veri kümenizde birden çok dilde belgenizin olmasını sağlayan boole değeridir ve modeliniz dağıtıldığında modeli desteklenen herhangi bir dilde sorgulayabilirsiniz (eğitim belgelerinize dahil olması gerekmez). Çok dilli destek hakkında daha fazla bilgi edinmek için bkz. dil desteği. true
projectName {PROJECT-NAME} Proje adı Myproject
storageInputContainerName {CONTAINER-NAME} Kapsayıcı adı mycontainer
Sınıf [] Projedeki tüm sınıflarını içeren dizi. Bunlar, belgelerinizi sınıflandırmak istediğiniz sınıflardır. []
belgelerde [] Projenizdeki tüm belgeleri ve bu belge için etiketlenmiş sınıfları içeren dizi. []
location {DOCUMENT-NAME} Depolama kapsayıcısında belgelerin konumu. Tüm belgeler kapsayıcının kökünde olduğundan, bu değer belge adı olmalıdır. doc1.txt
Dataset {DATASET} Eğitimden önce bölündüğünde bu dosyanın gideceği test kümesi. Daha fazla bilgi için bkz. Modeli eğitme . Bu alanın olası değerleri ve Test'tirTrain. Train

Sonraki adımlar