Özel konuşma için eğitim ve test veri kümelerini karşıya yükleme

Konuşma tanımanın doğruluğunu test etme veya özel modellerinizi eğitma için ses veya metin verilerine ihtiyacınız vardır. Modelinizi test etme veya eğitma için desteklenen veri türleri hakkında bilgi için bkz . Eğitim ve test veri kümeleri.

İpucu

Etiketli ses veri kümelerini oluşturmak ve daraltmak için çevrimiçi transkripsiyon düzenleyicisini de kullanabilirsiniz.

Veri kümelerini karşıya yükleme

Speech Studio'da kendi veri kümelerinizi karşıya yüklemek için şu adımları izleyin:

  1. Speech Studio'da oturum açın.

  2. Özel konuşma Projenizin adı> Konuşma veri kümeleri>Verileri karşıya yükle'yi seçin.>

  3. Eğitim verileri veya Test verileri sekmesini seçin.

  4. Bir veri kümesi türü seçin ve ardından İleri'yi seçin.

  5. Veri kümesi konumunu belirtin ve ardından İleri'yi seçin. Yerel bir dosya seçebilir veya Azure Blob URL'si gibi uzak bir konum girebilirsiniz. Uzak konumu seçerseniz ve güvenilen Azure hizmetleri güvenlik mekanizmasını kullanmıyorsanız, uzak konum basit bir anonim GET isteğiyle alınabilen bir URL olmalıdır. Örneğin, SAS URL'si veya genel olarak erişilebilen bir URL. Ek yetkilendirme gerektiren veya kullanıcı etkileşimi bekleyen URL'ler desteklenmez.

    Not

    Azure Blob URL'sini kullanıyorsanız, güvenilir Azure hizmetleri güvenlik mekanizmasını kullanarak veri kümesi dosyalarınızın en yüksek güvenliğini sağlayabilirsiniz. Batch transkripsiyonu ve veri kümesi dosyalarınız için düz Depolama Hesap URL'leri ile aynı teknikleri kullanacaksınız. Ayrıntılar için buraya bakın.

  6. Veri kümesi adını ve açıklamasını girin ve İleri'yi seçin.

  7. Ayarlarınızı gözden geçirin ve kaydet ve kapat'ı seçin.

Veri kümeniz karşıya yüklendikten sonra özel model eğitmek için Özel modelleri eğit sayfasına gidin.

Konuşma CLI'sıve Konuşmayı metne dönüştürme REST API'siyle, Speech Studio'nun aksine, veri kümesinin karşıya yükleme sırasında test veya eğitim amaçlı olup olmadığını seçmezsiniz. Bir modeli eğitirken veya test çalıştırdığınızda veri kümesinin nasıl kullanılacağını belirtirsiniz.

Veri kümesinin test mi yoksa eğitim için mi olduğunu belirtmeseniz de veri kümesi türünü belirtmeniz gerekir. Veri kümesi türü, hangi veri kümesinin oluşturulduğunu belirlemek için kullanılır. Bazı durumlarda, veri kümesi türü yalnızca test veya eğitim için kullanılır, ancak bu tür bir bağımlılık almamalısınız. Konuşma CLI'sı ve REST API kind değerleri, aşağıdaki tabloda açıklandığı gibi Speech Studio'daki seçeneklere karşılık gelir:

CLI ve API türü Speech Studio seçenekleri
Akustik Eğitim verileri: Ses + insan etiketli transkript
Test verileri: Transkript (otomatik ses sentezi)
Test verileri: Ses + insan etiketli transkript
AudioFiles Test verileri: Ses
Dil Eğitim verileri: Düz metin
LanguageMarkdown Eğitim verileri: Markdown biçiminde yapılandırılmış metin
Telaffuzu Eğitim verileri: Söyleniş
OutputFormatting Eğitim verileri: Çıkış biçimi

Not

Markdown biçimindeki yapılandırılmış metin eğitim veri kümeleri, Konuşmayı metne dönüştürme REST API'sinin 3.0 sürümü tarafından desteklenmez. REST API v3.1'e metin eklemek için Konuşma'nın kullanılması gerekir. Daha fazla bilgi için bkz . Kodu REST API'nin v3.0'dan v3.1'e geçirme.

Veri kümesi oluşturmak ve bunu mevcut bir projeye bağlamak için komutunu spx csr dataset create kullanın. İstek parametrelerini aşağıdaki yönergelere göre oluşturun:

  • parametresini project var olan bir projenin kimliğine ayarlayın. Speech Studio'da veri kümesini görüntüleyebilmeniz ve yönetebilmeniz için bu parametre önerilir. Kullanılabilir projeleri almak için komutunu çalıştırabilirsiniz spx csr project list .

  • Gerekli kind parametreyi ayarlayın. Veri kümesi türü için olası değer kümesi şunlardır: Language, Acoustic, Telaffuz ve AudioFiles.

  • Gerekli contentUrl parametreyi ayarlayın. Bu parametre, veri kümesinin konumudur. Güvenilen Azure hizmetleri güvenlik mekanizmasını kullanmıyorsanız (sonraki Nota bakın) contentUrl parametresi, basit bir anonim GET isteğiyle alınabilen bir URL olmalıdır. Örneğin, SAS URL'si veya genel olarak erişilebilen bir URL. Ek yetkilendirme gerektiren veya kullanıcı etkileşimi bekleyen URL'ler desteklenmez.

    Not

    Azure Blob URL'sini kullanıyorsanız, güvenilir Azure hizmetleri güvenlik mekanizmasını kullanarak veri kümesi dosyalarınızın en yüksek güvenliğini sağlayabilirsiniz. Batch transkripsiyonu ve veri kümesi dosyalarınız için düz Depolama Hesap URL'leri ile aynı teknikleri kullanacaksınız. Ayrıntılar için buraya bakın.

  • Gerekli language parametreyi ayarlayın. Veri kümesi yerel ayarı projenin yerel ayarıyla eşleşmelidir. Yerel ayar daha sonra değiştirilemez. Konuşma CLI language parametresi, JSON isteğindeki ve yanıttaki özelliğine karşılık gelir locale .

  • Gerekli name parametreyi ayarlayın. Bu parametre, Speech Studio'da görüntülenen addır. Konuşma CLI name parametresi, JSON isteğindeki ve yanıttaki özelliğine karşılık gelir displayName .

Aşağıda bir veri kümesi oluşturan ve bunu mevcut projeye bağlayan örnek bir Konuşma CLI komutu verilmiştir:

spx csr dataset create --api-version v3.1 --kind "Acoustic" --name "My Acoustic Dataset" --description "My Acoustic Dataset Description" --project YourProjectId --content YourContentUrl --language "en-US"

Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

Yanıt gövdesindeki en üst düzey self özellik, veri kümesinin URI'sini içerir. Veri kümesinin projesi ve dosyaları hakkındaki ayrıntıları almak için bu URI'yi kullanın. Ayrıca bu URI'yi bir veri kümesini güncelleştirmek veya silmek için de kullanırsınız.

Konuşma CLI'sı veri kümeleriyle ilgili yardım için aşağıdaki komutu çalıştırın:

spx help csr dataset

Konuşma CLI'sıve Konuşmayı metne dönüştürme REST API'siyle, Speech Studio'nun aksine, veri kümesinin karşıya yükleme sırasında test veya eğitim amaçlı olup olmadığını seçmezsiniz. Bir modeli eğitirken veya test çalıştırdığınızda veri kümesinin nasıl kullanılacağını belirtirsiniz.

Veri kümesinin test mi yoksa eğitim için mi olduğunu belirtmeseniz de veri kümesi türünü belirtmeniz gerekir. Veri kümesi türü, hangi veri kümesinin oluşturulduğunu belirlemek için kullanılır. Bazı durumlarda, veri kümesi türü yalnızca test veya eğitim için kullanılır, ancak bu tür bir bağımlılık almamalısınız. Konuşma CLI'sı ve REST API kind değerleri, aşağıdaki tabloda açıklandığı gibi Speech Studio'daki seçeneklere karşılık gelir:

CLI ve API türü Speech Studio seçenekleri
Akustik Eğitim verileri: Ses + insan etiketli transkript
Test verileri: Transkript (otomatik ses sentezi)
Test verileri: Ses + insan etiketli transkript
AudioFiles Test verileri: Ses
Dil Eğitim verileri: Düz metin
LanguageMarkdown Eğitim verileri: Markdown biçiminde yapılandırılmış metin
Telaffuzu Eğitim verileri: Söyleniş
OutputFormatting Eğitim verileri: Çıkış biçimi

Not

Markdown biçimindeki yapılandırılmış metin eğitim veri kümeleri, Konuşmayı metne dönüştürme REST API'sinin 3.0 sürümü tarafından desteklenmez. REST API v3.1'e metin eklemek için Konuşma'nın kullanılması gerekir. Daha fazla bilgi için bkz . Kodu REST API'nin v3.0'dan v3.1'e geçirme.

Veri kümesi oluşturmak ve bunu var olan bir projeye bağlamak için Konuşmayı metne dönüştürme REST API'sinin Datasets_Create işlemini kullanın. İstek gövdesini aşağıdaki yönergelere göre oluşturun:

  • project özelliğini mevcut bir projenin URI'sine ayarlayın. Speech Studio'da veri kümesini de görüntüleyebilmeniz ve yönetebilmeniz için bu özellik önerilir. Kullanılabilir projeleri almak için Projects_List isteğinde bulunabilirsiniz.

  • Gerekli kind özelliği ayarlayın. Veri kümesi türü için olası değer kümesi şunlardır: Language, Acoustic, Telaffuz ve AudioFiles.

  • Gerekli contentUrl özelliği ayarlayın. Bu özellik, veri kümesinin konumudur. Güvenilen Azure hizmetleri güvenlik mekanizmasını kullanmıyorsanız (sonraki Nota bakın) contentUrl parametresi, basit bir anonim GET isteğiyle alınabilen bir URL olmalıdır. Örneğin, SAS URL'si veya genel olarak erişilebilen bir URL. Ek yetkilendirme gerektiren veya kullanıcı etkileşimi bekleyen URL'ler desteklenmez.

    Not

    Azure Blob URL'sini kullanıyorsanız, güvenilir Azure hizmetleri güvenlik mekanizmasını kullanarak veri kümesi dosyalarınızın en yüksek güvenliğini sağlayabilirsiniz. Batch transkripsiyonu ve veri kümesi dosyalarınız için düz Depolama Hesap URL'leri ile aynı teknikleri kullanacaksınız. Ayrıntılar için buraya bakın.

  • Gerekli locale özelliği ayarlayın. Veri kümesi yerel ayarı projenin yerel ayarıyla eşleşmelidir. Yerel ayar daha sonra değiştirilemez.

  • Gerekli displayName özelliği ayarlayın. Bu özellik, Speech Studio'da görüntülenen addır.

Aşağıdaki örnekte gösterildiği gibi URI'yi kullanarak bir HTTP POST isteği oluşturun. değerini Konuşma kaynak anahtarınız ile değiştirin YourSubscriptionKey , değerini Konuşma kaynağı bölgenizle değiştirin YourServiceRegion ve istek gövdesi özelliklerini daha önce açıklandığı gibi ayarlayın.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "kind": "Acoustic",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description",
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "locale": "en-US",
}'  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/datasets"

Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

Yanıt gövdesindeki en üst düzey self özellik, veri kümesinin URI'sini içerir. Veri kümesinin projesi ve dosyaları hakkındaki ayrıntıları almak için bu URI'yi kullanın. Veri kümesini güncelleştirmek veya silmek için de bu URI'yi kullanırsınız.

Önemli

Bir veri kümesini özel konuşma projesine Bağlan, REST API veya Konuşma CLI'sını kullanarak özel modeli eğitmek ve test etmek için gerekli değildir. Ancak veri kümesi herhangi bir projeye bağlı değilse, Speech Studio'da eğitim veya test için bu veri kümesini seçemezsiniz.

Sonraki adımlar