Aracılığıyla paylaş


Özel konuşma projesi oluşturma

Özel konuşma projeleri modeller, eğitim ve test veri kümeleri ve dağıtım uç noktaları içerir. Her proje bir yerel ayara özgüdür. Örneğin, Birleşik Devletler İngilizce için bir proje oluşturabilirsiniz.

Bir proje oluştur

Özel konuşma projesi oluşturmak için şu adımları izleyin:

  1. Speech Studio'da oturum açın.

  2. Çalışmak için aboneliği ve Konuşma kaynağını seçin.

    Önemli

    Ses verileriyle özel bir model eğitecekseniz, ses verilerini eğitecek ayrılmış donanıma sahip bir Konuşma kaynak bölgesi seçin. Daha fazla bilgi için bölgeler tablosundaki dipnotlara bakın.

  3. Özel konuşma>Yeni proje oluştur'u seçin.

  4. Projenizi oluşturmak için sihirbaz tarafından sağlanan yönergeleri izleyin.

Yeni projeyi ada göre seçin veya Projeye git'i seçin. Sol panelde şu menü öğelerini görürsünüz: Konuşma veri kümeleri, Özel modelleri eğitme, Modelleri test et ve Modelleri dağıt.

Proje oluşturmak için komutunu kullanın spx csr project create . İstek parametrelerini aşağıdaki yönergelere göre oluşturun:

  • Gerekli language parametreyi ayarlayın. Projenin yerel ayarı ve kapsanan veri kümeleri aynı olmalıdır. Yerel ayar daha sonra değiştirilemez. Konuşma CLI language parametresi, JSON isteğindeki ve yanıttaki özelliğine karşılık gelir locale .
  • Gerekli name parametreyi ayarlayın. Bu, Speech Studio'da görüntülenen addır. Konuşma CLI name parametresi, JSON isteğindeki ve yanıttaki özelliğine karşılık gelir displayName .

Aşağıda proje oluşturan örnek bir Konuşma CLI komutu verilmişti:

spx csr project create --api-version v3.1 --name "My Project" --description "My Project Description" --language "en-US"

Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed",
  "links": {
    "evaluations": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/evaluations",
    "datasets": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/datasets",
    "models": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/models",
    "endpoints": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/endpoints",
    "transcriptions": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/transcriptions"       
  },
  "properties": {
    "datasetCount": 0,
    "evaluationCount": 0,
    "modelCount": 0,
    "transcriptionCount": 0,
    "endpointCount": 0
  },
  "createdDateTime": "2022-05-17T22:15:18Z",
  "locale": "en-US",
  "displayName": "My Project",
  "description": "My Project Description"
}

Yanıt gövdesindeki en üst düzey self özellik, projenin URI'sini oluşturur. Projenin değerlendirmeleri, veri kümeleri, modelleri, uç noktaları ve transkripsiyonlarıyla ilgili ayrıntıları almak için bu URI'yi kullanın. Ayrıca bu URI'yi bir projeyi güncelleştirmek veya silmek için de kullanırsınız.

Projelerle ilgili Konuşma CLI'sı yardımı için aşağıdaki komutu çalıştırın:

spx help csr project

Proje oluşturmak için Konuşmayı metne dönüştürme REST API'sinin Projects_Create işlemini kullanın. İstek gövdesini aşağıdaki yönergelere göre oluşturun:

  • Gerekli locale özelliği ayarlayın. Bu, kapsanan veri kümelerinin yerel ayarı olmalıdır. Yerel ayar daha sonra değiştirilemez.
  • Gerekli displayName özelliği ayarlayın. Bu, Speech Studio'da görüntülenen proje adıdır.

Aşağıdaki Projects_Create örnekte gösterildiği gibi URI kullanarak bir HTTP POST isteği oluşturun. değerini Konuşma kaynak anahtarınız ile değiştirin YourSubscriptionKey , değerini Konuşma kaynağı bölgenizle değiştirin YourServiceRegion ve istek gövdesi özelliklerini daha önce açıklandığı gibi ayarlayın.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "displayName": "My Project",
  "description": "My Project Description",
  "locale": "en-US"
} '  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/projects"

Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed",
  "links": {
    "evaluations": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/evaluations",
    "datasets": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/datasets",
    "models": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/models",
    "endpoints": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/endpoints",
    "transcriptions": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/transcriptions"       
  },
  "properties": {
    "datasetCount": 0,
    "evaluationCount": 0,
    "modelCount": 0,
    "transcriptionCount": 0,
    "endpointCount": 0
  },
  "createdDateTime": "2022-05-17T22:15:18Z",
  "locale": "en-US",
  "displayName": "My Project",
  "description": "My Project Description"
}

Yanıt gövdesindeki en üst düzey self özellik, projenin URI'sini oluşturur. Projenin değerlendirmeleri, veri kümeleri, modelleri, uç noktaları ve transkripsiyonlarıyla ilgili ayrıntıları almak için bu URI'yi kullanın. Ayrıca bu URI'yi bir projeyi güncelleştirmek veya silmek için de kullanırsınız.

Modelinizi seçin

Özel konuşma modellerini kullanmaya yönelik birkaç yaklaşım vardır:

  • Temel model, çeşitli senaryolar için kullanıma hazır doğru konuşma tanıma sağlar. Temel modeller, doğruluğu ve kaliteyi artırmak için düzenli aralıklarla güncelleştirilir. Temel modelleri kullanıyorsanız en son varsayılan temel modelleri kullanmanızı öneririz. Gerekli özelleştirme özelliği yalnızca eski bir modelde kullanılabiliyorsa, eski bir temel model seçebilirsiniz.
  • Özel model, temel modeli özel etki alanının tüm alanlarında paylaşılan etki alanına özgü sözcük dağarcığını içerecek şekilde genişleter.
  • Özel etki alanının her birinin belirli bir kelime dağarcığına sahip birden çok alanı olduğunda birden çok özel model kullanılabilir.

Temel modelin yeterli olup olmadığını görmenin önerilen yollarından biri, temel modelden üretilen transkripsiyonu analiz etmek ve aynı ses için insan tarafından oluşturulan transkriptle karşılaştırmaktır. Transkriptleri karşılaştırabilir ve sözcük hata oranı (WER) puanı alabilirsiniz. WER puanı yüksekse, yanlış tanımlanmış sözcükleri tanımak için özel bir model eğitmek önerilir.

Sözcük dağarcığı etki alanı alanları arasında farklılık gösteriyorsa birden çok model önerilir. Örneğin, Olimpiyat yorumcuları her biri kendi omurgasıyla ilişkili çeşitli olayları rapor eder. Her Olimpik olay sözlüğü diğerlerinden önemli ölçüde farklı olduğundan, bir olaya özgü özel model oluşturmak, konuşma verilerini ilgili olaya göre sınırlayarak doğruluğu artırır. Sonuç olarak, modelin eşleşme yapmak için ilişkisiz verileri elemesi gerekmez. Ne olursa olsun, eğitim yine de iyi bir eğitim verileri gerektirir. Farklı aksanları, cinsiyeti, yaşı vb. olan çeşitli yorumcuların sesini ekleyin.

Model kararlılığı ve yaşam döngüsü

Özel konuşma kullanarak uç noktaya dağıtılan temel model veya özel model, siz güncelleştirmeye karar verinceye kadar düzeltilir. Yeni bir temel model yayınlandığında bile konuşma tanıma doğruluğu ve kalitesi tutarlı olmaya devam ediyor. Bu, daha yeni bir model kullanmaya karar verene kadar belirli bir modelin davranışını kilitlemenizi sağlar.

İster kendi modelinizi eğitin ister temel modelin anlık görüntüsünü kullanın, modeli sınırlı bir süre için kullanabilirsiniz. Daha fazla bilgi için bkz . Model ve uç nokta yaşam döngüsü.

Sonraki adımlar