Veri kümelerini eğitma ve test etme

Özel konuşma projesinde eğitim, nitel inceleme ve nicel ölçüm için veri kümelerini karşıya yükleyebilirsiniz. Bu makale, özel konuşma için kullanabileceğiniz eğitim ve test verilerinin türlerini kapsar.

Özel bir modeli test etmek ve eğitmek için kullandığınız metin ve ses, modelinizin tanımasını istediğiniz çeşitli konuşmacılardan ve senaryolardan örnekler içermelidir. Özel model testi ve eğitimi için veri toplarken şu faktörleri göz önünde bulundurun:

  • Kullanıcılarınızın modelinizle etkileşim kurarken yaptıkları sözlü ifade türlerini kapsayacak şekilde metin ve ses verileri ekleyin. Örneğin, sıcaklığı yükselten ve düşüren bir model, insanların bu tür değişiklikler istemek için gerçekleştirebileceği deyimler üzerinde eğitime ihtiyaç duyar.
  • Modelinizin tanımasını istediğiniz tüm konuşma farklarını ekleyin. Vurgular, diyalektler, dil karıştırma, yaş, cinsiyet, ses perdesi, stres düzeyi ve günün saati gibi birçok faktör konuşmayı değiştirebilir.
  • Modelinizin kullanıldığı iç mekan, dış mekan ve yol gürültüsü gibi farklı ortamlardan örnekler ekleyin.
  • Üretim sisteminin kullandığı donanım cihazlarıyla ses kaydedin. Modelinizin farklı kalitede cihazlarda kaydedilmiş konuşmaları tanımlaması gerekiyorsa, modelinizi eğitmek için sağladığınız ses verileri de bu farklı senaryoları temsil etmelidir.
  • Veri kümesini farklı tutun ve proje gereksinimlerinizi temsil edin. Modelinize daha sonra daha fazla veri ekleyebilirsiniz.
  • Yalnızca modelinizin dökümünü alması gereken verileri ekleyin. Özel modelinizin tanıma gereksinimleri içinde olmayan verileri dahil etmek, genel olarak tanıma kalitesine zarar verebilir.

Veri türleri

Aşağıdaki tabloda kabul edilen veri türleri, her veri türünün ne zaman kullanılması gerektiği ve önerilen miktar listelenmiştir. Model oluşturmak için her veri türü gerekmez. Veri gereksinimleri, bir test oluşturup oluşturmadığınıza veya model eğittiğiniz duruma bağlı olarak değişir.

Veri türü Test için kullanılır Test için önerilir Eğitim için kullanılır Eğitim için önerilir
Yalnızca ses Evet (görsel inceleme) 5'den fazla ses dosyası Evet (için en-USönizleme) 1-20 saatlik ses
Ses + insan etiketli transkriptler Evet (doğruluğun değerlendirilmesi) 0,5-5 saatlik ses Yes 1-20 saatlik ses
Düz metin Hayır Uygulanamaz Yes 1-200 MB ilgili metin
Yapılandırılmış metin Hayır Uygulanamaz Yes 4.000 öğeye ve 50.000'e kadar eğitim cümlesine sahip en fazla 10 sınıf
Telaffuzu Hayır Uygulanamaz Yes 1 KB - 1 MB telaffuz metni
Görüntüleme biçimi Hayır Uygulanamaz Yes ITN için en fazla 200 satır, yeniden yazma için 1.000 satır, küfür filtresi için 1.000 satır

Düz metin veya yapılandırılmış metinle eğitim genellikle birkaç dakika içinde tamamlar.

İpucu

Düz metin verileri veya yapılandırılmış metin verileriyle başlayın. Bu veriler özel terimlerin ve tümceciklerin tanınmasını geliştirecektir. Metinlerle eğitim, sesli eğitimden çok daha hızlıdır (dakikalar ve günler).

Modelinizin kullanılacağı dil, akustik ve donanımla eşleşen küçük örnek veri kümeleriyle başlayın. Küçük temsili veri kümeleri, eğitim için daha büyük veri kümeleri toplamaya yatırım yapmadan önce sorunları ortaya çıkarabilir. Örnek özel konuşma verileri için bu GitHub deposuna bakın.

Ses verileriyle özel bir model eğitiyorsanız, ses verilerini eğitecek ayrılmış donanıma sahip bir Konuşma kaynak bölgesi seçin. Daha fazla bilgi için bkz. bölgeler tablosundaki dipnotlar. Özel konuşma eğitimi için ayrılmış donanıma sahip bölgelerde Konuşma tanıma hizmeti, ses eğitimi verilerinizin 20 saatine kadar kullanır ve günde yaklaşık 10 saatlik verileri işleyebilir. Diğer bölgelerde Konuşma hizmeti, ses verilerinizin en fazla 8 saatini kullanır ve günde yaklaşık 1 saatlik verileri işleyebilir. Model eğitildikten sonra, Models_CopyTo REST API ile gerektiğinde modeli başka bir bölgeye kopyalayabilirsiniz.

Senaryoya göre veri kümelerini göz önünde bulundurun

Senaryoların bir alt kümesinde eğitilen bir model, yalnızca bu senaryolarda iyi performans sergileyebilir. Özel modelinizin tanıması gereken senaryoların tam kapsamını temsil eden verileri dikkatle seçin. Aşağıdaki tabloda bazı konuşma tanıma senaryolarında dikkate alınması gereken veri kümeleri gösterilmektedir:

Senaryo Düz metin verileri ve yapılandırılmış metin verileri Ses + insan etiketli transkriptler Söylenişli yeni sözcükler
Çağrı merkezi Çağrı merkezi etkinliğiyle ilgili pazarlama belgeleri, web sitesi, ürün incelemeleri çağrı merkezi çağrıları insanlar tarafından yazılmış Belirsiz söylenişleri olan terimler (önceki bölümdeki Xbox örneğine bakın)
Sesli yardımcı Çeşitli komut ve varlık bileşimlerini kullanan tümcelerin listesi Cihaza komutların konuşulan sesleri kaydedildi, metne dönüştürüldü Benzersiz söylenişleri olan adlar (filmler, şarkılar, ürünler)
Dikte Anlık iletiler veya e-postalar gibi yazılı girişler Önceki örneklere benzer Önceki örneklere benzer
Video kapalı başlık TV programı betikleri, filmler, pazarlama içeriği, video özetleri Videoların tam dökümleri Önceki örneklere benzer

Sorunlarınızı gidermek için hangi veri kümesini kullanacağınızı saptamaya yardımcı olmak için aşağıdaki tabloya bakın:

Kullanım örneği Veri türü
Tıbbi terminoloji veya BT jargonu gibi sektöre özgü sözlük ve dil bilgisi üzerinde tanıma doğruluğunu geliştirin. Düz metin veya yapılandırılmış metin verileri
Ürün adları veya kısaltmalar gibi standart olmayan söylenişi olan bir sözcüğün veya terimin fonetik ve görüntülenen biçimini tanımlayın. Yapılandırılmış metinde söyleniş verileri veya fonetik telaffuz
Konuşma stillerinde, vurgularda veya belirli arka plan seslerinde tanıma doğruluğunu geliştirin. Ses + insan etiketli transkriptler

Eğitim veya test için ses + insan etiketli transkript verileri

Hem eğitim hem de test amacıyla ses + insan etiketli transkript verilerini kullanabilirsiniz. Karşılaştırma için insan etiketli transkripsiyonlar (sözcük sözcük) sağlamanız gerekir:

  • Hafif aksan, konuşma stilleri ve arka plan gürültüsü gibi akustik özellikleri geliştirmek için.
  • Microsoft'un ses dosyalarınızı işlerken metin doğruluğuna yaptığı konuşmanın doğruluğunu ölçmek için.

Ses verileriyle eğitimi destekleyen temel modellerin listesi için bkz . Dil desteği. Temel model ses verileriyle eğitimi desteklese bile hizmet sesin yalnızca bir bölümünü kullanabilir. Ve hala tüm transkriptleri kullanıyor.

Önemli

Temel model ses verileriyle özelleştirmeyi desteklemiyorsa eğitim için yalnızca transkripsiyon metni kullanılır. Ses verileriyle özelleştirmeyi destekleyen bir temel modele geçerseniz, eğitim süresi birkaç saatten birkaç güne çıkabilir. Eğitim süresindeki değişiklik, eğitim için ayrılmış donanım içermeyen bir bölgede temel modele geçtiğinizde en belirgin şekilde görülür. Ses verileri gerekli değilse, eğitim süresini azaltmak için verileri kaldırmanız gerekir.

İnsan etiketli transkriptler içeren ses, ses hedef kullanım örneğinden geliyorsa en yüksek doğruluk iyileştirmelerini sunar. Örnekler, konuşmanın tüm kapsamını kapsamalıdır. Örneğin, bir perakende mağazasının çağrı merkezi yaz aylarında mayo ve güneş gözlüğü hakkında en çok çağrıyı alır. Örneğinizin algılamak istediğiniz konuşma kapsamının tamamını içerdiğinden emin olun.

Şu ayrıntıları göz önünde bulundurun:

  • Ses ile eğitim, insanlar için sesin de anlaşılması zorsa en fazla faydayı getirir. Çoğu durumda, eğitime yalnızca ilgili metni kullanarak başlamalısınız.
  • ABD İngilizcesi gibi en yoğun kullanılan dillerden birini kullanıyorsanız, ses verileriyle eğitim almanız pek olası olmaz. Bu tür diller için temel modeller çoğu senaryoda iyi tanıma sonuçları sunar, bu nedenle ilgili metinlerle eğitmek büyük olasılıkla yeterlidir.
  • Özel konuşma, ekleme veya silme hatalarını değil, yalnızca değiştirme hatalarını azaltmak için sözcük bağlamını yakalayabilir.
  • Transkripsiyon hataları içeren ancak çeşitli ses kalitesi içeren örneklerden kaçının.
  • Sorun etki alanınızla ilgili olmayan tümcelerden kaçının. İlişkisiz cümleler modelinize zarar verebilir.
  • Transkript kalitesi değiştiğinde, ağırlıklarını artırmak için anahtar ifadeler içeren mükemmel transkripsiyonlar gibi son derece iyi cümleleri çoğaltabilirsiniz.
  • Konuşma hizmeti, etki alanına özgü sözcüklerin ve tümceciklerin ilgili metin olarak eklenmiş gibi tanınmasını geliştirmek için transkriptleri otomatik olarak kullanır.
  • Eğitim işleminin tamamlanması birkaç gün sürebilir. Eğitim hızını artırmak için Konuşma hizmeti aboneliğinizi eğitim için ayrılmış donanıma sahip bir bölgede oluşturduğunuzdan emin olun.

Tanımayı geliştirmek için büyük bir eğitim veri kümesi gereklidir. Genel olarak, 1 ile 20 saat arası ses için tek tek transkripsiyonlar sağlamanızı öneririz. Ancak, 30 dakika kadar kısa bir süre bile tanıma sonuçlarını iyileştirmeye yardımcı olabilir. İnsan etiketli transkripsiyon oluşturmak zaman alsa da, tanıma iyileştirmeleri yalnızca sağladığınız veriler kadar iyidir. Yalnızca yüksek kaliteli transkriptleri karşıya yüklemelisiniz.

Ses dosyaları kaydın başında ve sonunda sessizliğe sahip olabilir. Mümkünse, her örnek dosyaya konuşmadan önce ve sonra en az yarım saniye sessizlik ekleyin. Düşük kayıt ses düzeyine veya kesintiye neden olan arka plan gürültüsüne sahip ses yararlı olmasa da, özel modelinizi sınırlamamalı veya düşürmemelidir. Ses örnekleri toplamadan önce her zaman mikrofonlarınızı ve sinyal işleme donanımlarınızı yükseltmeyi göz önünde bulundurun.

Önemli

İnsan etiketli transkriptleri hazırlamaya yönelik en iyi yöntemler hakkında daha fazla bilgi için bkz . Ses ile insan etiketli transkriptler.

Özel konuşma projeleri için şu özelliklere sahip ses dosyaları gerekir:

Önemli

Bunlar Ses + insan etiketli transkript eğitimi ve testi gereksinimleridir. Yalnızca Ses eğitim ve testlerinden farklıdır. Yalnızca Ses eğitim ve testlerini kullanmak istiyorsanız bu bölüme bakın.

Özellik Değer
Dosya biçimi RIFF (WAV)
Örnekleme hızı 8.000 Hz veya 16.000 Hz
Kanallar 1 (mono)
Ses başına maksimum uzunluk İki saat (test) / 60 sn (eğitim)

Ses ile eğitim, dosya başına en fazla 60 saniyelik ses uzunluğuna sahiptir. 60 saniyeden uzun ses dosyaları için eğitim için yalnızca ilgili transkripsiyon dosyaları kullanılır. Tüm ses dosyaları 60 saniyeden uzunsa eğitim başarısız olur.
Örnek biçimi PCM, 16 bit
Arşiv biçimi .zip
En büyük zip boyutu 2 GB veya 10.000 dosya

Eğitim için düz metin verileri

Etki alanına özgü sözcüklerin ve tümceciklerin tanınmasını geliştirmek için ilgili metnin düz metin cümlelerini ekleyebilirsiniz. İlgili metin cümleleri, ortak sözcüklerin ve etki alanına özgü sözcüklerin yanlış tanınması ile ilgili değiştirme hatalarını bağlam içinde göstererek azaltabilir. Etki alanına özgü sözcükler yaygın veya uydurulmayan sözcükler olabilir, ancak telaffuzlarının tanınması kolay olmalıdır.

Etki alanıyla ilgili tümceleri tek bir metin dosyasında sağlayın. Beklenen konuşmalara yakın metin verilerini kullanın. Konuşmaların eksiksiz veya dil bilgisi açısından doğru olması gerekmez, ancak modelin tanımasını beklediğiniz konuşulan girişi doğru şekilde yansıtması gerekir. Mümkün olduğunda, ayrı bir satırda tek bir tümce veya anahtar sözcüğü denetlemeyi deneyin. Ürün adları gibi bir terimin ağırlığını artırmak için terimi içeren birkaç cümle ekleyin. Ama çok fazla kopyalamayın, çünkü bu genel olarak tanıma hızını etkileyebilir.

Not

Tanınmayan karakterler veya sözcükler gibi kirlilik içeren ilgili metin cümlelerinden kaçının.

Düz metin veri kümesi dosyanızın doğru biçimlendirildiğinden emin olmak için bu tabloyu kullanın:

Özellik Değer
Metin kodlaması UTF-8 BOM
Satır başına konuşma sayısı 1
En büyük dosya boyutu 200 MB

Ayrıca aşağıdaki kısıtlamalara da uymalısınız:

  • Karakterleri, sözcükleri veya sözcük gruplarını üçten fazla kez tekrarlamaktan kaçının. Örneğin, "aaaa", "evet evet evet evet evet" veya "hepsi bu kadar" kullanmayın. Konuşma hizmeti çok fazla yineleme içeren satırları bırakabilir.
  • Özel karakterleri veya U+00A1 karakterinin üzerindeki UTF-8 karakterlerini kullanmayın.
  • URI'ler reddedilir.
  • Japonca veya Korece gibi bazı diller için büyük miktarda metin verilerini içeri aktarmak uzun sürebilir veya zaman aşımına neden olabilir. Veri kümesini, her birinde en fazla 20.000 satır bulunan birden çok metin dosyalarına bölmeyi göz önünde bulundurun.

Eğitim için yapılandırılmış metin verileri

Not

Eğitim için yapılandırılmış metin verileri genel önizleme aşamasındadır.

Verileriniz yalnızca listedeki sözcüklere veya tümceciklere göre farklılık gösteren belirli konuşmalarda belirli bir desene uyduğunda yapılandırılmış metin verilerini kullanın. Eğitim verilerinin oluşturulmasını basitleştirmek ve Özel Dil modelinin içinde daha iyi modelleme sağlamak için Markdown biçiminde yapılandırılmış bir metin kullanarak öğe listelerini ve sözcüklerin fonetik söylenişini tanımlayabilirsiniz. Daha sonra eğitim konuşmalarınızda bu listelere başvurabilirsiniz.

Beklenen konuşmalar genellikle belirli bir deseni izler. Yaygın desenlerden biri, konuşmaların yalnızca listedeki sözcüklere veya tümceciklere göre farklılık göstermeleridir. Bu desene örnek olarak şunlar verilebilir:

  • "Hakkında bir sorum productvar," nerede product olası ürünlerin listesidir.
  • "Bunu objectcoloryap," burada object geometrik şekillerin listesidir ve color renklerin listesidir.

Yapılandırılmış metin içeren eğitim için desteklenen temel modellerin ve yerel ayarların listesi için bkz . Dil desteği. Bu yerel ayarlar için en son temel modeli kullanmanız gerekir. Yapılandırılmış metinlerle eğitimi desteklemeyen yerel ayarlar için, hizmet düz metin verileriyle eğitimin bir parçası olarak hiçbir sınıfa başvurmadan tüm eğitim cümlelerini alır.

Yapılandırılmış metin dosyasının bir .md uzantısı olmalıdır. En büyük dosya boyutu 200 MB'tır ve metin kodlaması UTF-8 BOM olmalıdır. Markdown'ın söz dizimi, Language Understanding modellerindeki, özellikle liste varlıklarının ve örnek konuşmaların söz dizimi ile aynıdır. Markdown söz diziminin tamamı hakkında daha fazla bilgi için bkz . Language Understanding Markdown.

Desteklenen Markdown biçimiyle ilgili önemli ayrıntılar şunlardır:

Özellik Açıklama Sınırlar
@list Örnek tümcede başvurulabilecek öğelerin listesi. En fazla 20 liste. Liste başına en fazla 35.000 öğe.
speech:phoneticlexicon Universal Telefon Kümesine göre fonetik söylenişlerin listesi. Söyleniş, sözcüğün bir listede veya eğitim cümlesinde göründüğü her örnek için ayarlanır. Örneğin, kulağa "kedi" gibi gelen bir kelimeniz varsa ve söylenişi "k ae t" olarak ayarlamak istiyorsanız, listeye ekleyebilirsiniz - cat/k ae tspeech:phoneticlexicon . En fazla 15.000 girdi. Sözcük başına en fazla iki telaffuz.
#ExampleSentences Pound simgesi (#), örnek cümlelerin bir bölümünü sınırlandırıyor. Bölüm başlığı yalnızca harf, rakam ve alt çizgi içerebilir. Örnek cümleler, modelinizin beklemesi gereken konuşma aralığını yansıtmalıdır. Eğitim cümlesi, çevresindeki sol ve sağ küme ayraçlarını ({@list name} ) kullanarak altındaki @list öğelere başvurabilir. Aynı eğitim tümcesinde birden çok listelere başvurabilir veya hiç başvuramayabilirsiniz. En fazla 200 MB dosya boyutu.
// Açıklamalar çift eğik çizgi (// ) izler. Uygulanamaz

Aşağıda örnek bir yapılandırılmış metin dosyası verilmişti:

// This is a comment because it follows a double slash (`//`).

// Here are three separate lists of items that can be referenced in an example sentence. You can have up to 10 of these.
@ list food =
- pizza
- burger
- ice cream
- soda

@ list pet =
- cat
- dog
- fish

@ list sports =
- soccer
- tennis
- cricket
- basketball
- baseball
- football

// List of phonetic pronunciations
@ speech:phoneticlexicon
- cat/k ae t
- fish/f ih sh

// Here are two sections of training sentences. 
#TrainingSentences_Section1
- you can include sentences without a class reference
- what {@pet} do you have
- I like eating {@food} and playing {@sports}
- my {@pet} likes {@food}

#TrainingSentences_Section2
- you can include more sentences without a class reference
- or more sentences that have a class reference like {@pet} 

Eğitim için söyleniş verileri

Özel veya uyduru sözcüklerin benzersiz söylenişleri olabilir. Bu sözcükler, telaffuz etmek için daha küçük sözcüklere ayrılabiliyorsa tanınabilir. Örneğin, "Xbox"ı tanımak için "X kutusu" olarak telaffuz edin. Bu yaklaşım genel doğruluğu artırmaz, ancak bu ve diğer anahtar sözcüklerin tanınması geliştirilebilir.

Tanımayı geliştirmek için özel bir telaffuz dosyası sağlayabilirsiniz. Sık kullanılan sözcüklerin söylenişini değiştirmek için özel telaffuz dosyaları kullanmayın. Özel söylenişi destekleyen dillerin listesi için bkz . dil desteği.

Not

Yapılandırılmış metin eğitim verileri dışında diğer eğitim veri kümelerinin yanı sıra bir söyleniş dosyası kullanabilirsiniz. Söyleniş verilerini yapılandırılmış metinle kullanmak için yapılandırılmış bir metin dosyası içinde olmalıdır.

Konuşulan form fonetik sıranın yazıldığını gösterir. Harflerden, sözcüklerden, hecelerden veya üçünün birleşiminden oluşabilir. Bu tablo bazı örnekler içerir:

Tanınan görüntülenen form Konuşulan form
3CPO üç c p o
CNTK c n t k
IEEE i triple e

Söylenişleri tek bir metin dosyasında sağlarsınız. Konuşulan ifadeyi ve her birine özel bir söylenişi ekleyin. Dosyadaki her satır tanınan formla, sonra bir sekme karakteriyle ve sonra boşlukla ayrılmış fonetik diziyle başlamalıdır.

3CPO    three c p o
CNTK    c n t k
IEEE    i triple e

Söyleniş veri kümesi dosyalarınızın geçerli ve doğru biçimlendirildiğinden emin olmak için aşağıdaki tabloya bakın.

Özellik Değer
Metin kodlaması UTF-8 BOM (ANSI İngilizce için de desteklenir)
Satır başına söyleniş sayısı 1
En büyük dosya boyutu 1 MB (ücretsiz katman için 1 KB)

Eğitim veya test için ses verileri

Ses verileri, Microsoft'un metin modeline veya özel modele yönelik temel konuşma doğruluğunu test etmek için idealdir. Ses verilerinin belirli bir modelin performansıyla ilgili konuşma doğruluğunu incelemek için kullanıldığını unutmayın. Modelin doğruluğunu ölçmek istiyorsanız ses + insan etiketli transkriptler kullanın.

Not

Yerel ayar için önizlemede yalnızca eğitim için en-US ses verileri sağlanır. Diğer yerel ayarlar için ses verileriyle eğitmek için insan etiketli transkriptler de sağlamanız gerekir.

Özel konuşma projeleri için şu özelliklere sahip ses dosyaları gerekir:

Önemli

Bunlar yalnızca Ses eğitimi ve testi için gereksinimlerdir. Bunlar Ses + insan etiketli transkript eğitimi ve testi için olanlardan farklıdır. Ses + insan etiketli transkript eğitimi ve testi kullanmak istiyorsanız bu bölüme bakın.

Özellik Değer
Dosya biçimi RIFF (WAV)
Örnekleme hızı 8.000 Hz veya 16.000 Hz
Kanallar 1 (mono)
Ses başına maksimum uzunluk İki saat
Örnek biçimi PCM, 16 bit
Arşiv biçimi .zip
En büyük arşiv boyutu 2 GB veya 10.000 dosya

Not

Eğitim ve test verilerini karşıya yüklerken, .zip dosya boyutu 2 GB'ı aşamaz. Eğitim için daha fazla veriye ihtiyacınız varsa, bunları birkaç .zip dosyaya bölün ve bunları ayrı olarak karşıya yükleyin. Daha sonra birden çok veri kümesinden eğitmeyi seçebilirsiniz. Ancak, yalnızca tek bir veri kümesinden test edebilirsiniz.

Ses özelliklerini doğrulamak veya mevcut sesi uygun biçimlere dönüştürmek için SoX kullanın. Bazı örnek SoX komutları şunlardır:

Etkinlik SoX komutu
Ses dosyası biçimini denetleyin. sox --i <filename>
Ses dosyasını tek kanala dönüştürün, 16 bit, 16 kHz. sox <input> -b 16 -e signed-integer -c 1 -r 16k -t wav <output>.wav

Eğitim için özel görüntüleme metni biçimlendirme verileri

Metin biçimlendirme verilerini görüntüleme ve konuşmayı metne dönüştürme ile metin biçimlendirmesini görüntüleme hakkında daha fazla bilgi edinin.

Otomatik Konuşma Tanıma çıkış görüntüleme biçimi aşağı akış görevleri için kritik öneme sahiptir ve tek boyut tümüne uymaz. Özel Görüntü Biçimi kuralları eklemek, kullanıcıların Microsoft Azure özel konuşma Tanıma Hizmeti'nin üzerinde konuşma tanıma hizmeti kalitesini geliştirmek için kendi sözcük temelli görüntü biçimi kurallarını tanımlamasına olanak tanır.

Belirli sözcükleri büyük harfe çevirmeye ve yeniden düzenlemeye yönelik yeniden yazma kuralları ekleme, çıkıştan küfür sözcükleri ve maske ekleme, sayılar, tarihler, e-posta adresleri gibi belirli desenler için gelişmiş ITN kuralları tanımlama gibi görüntü çıkışlarını tamamen özelleştirmenize olanak tanır; veya bazı tümcecikleri koruyun ve bunları herhangi bir Görüntüleme işlemine karşı koruyun.

Örneğin:

Özel biçimlendirme Görüntü metni
Hiçbiri Contoso'dan finansal numaram 8BEV3
"Contoso" harfini büyük harfe çevirme (kural aracılığıyla #rewrite )
Finansal sayıyı biçimlendirme (kural aracılığıyla #itn )
Contoso'dan finansal numaram 8B-EV-3

Yapılandırılmış metin içeren eğitim için desteklenen temel modellerin ve yerel ayarların listesi için bkz. Dil desteği. Görüntü Biçimi dosyasının bir .md uzantısı olmalıdır. En büyük dosya boyutu 10 MB'tır ve metin kodlaması UTF-8 BOM olmalıdır. Görüntüleme Biçimi kurallarını özelleştirme hakkında daha fazla bilgi için bkz. Görüntüleme Biçimlendirme Kuralları En İyi Uygulaması.

Özellik Açıklama Sınırlar
#ITN Sayılar, adresler ve tarihler gibi belirli görüntü desenlerini tanımlamak için ters metin normalleştirme kurallarının listesi. En fazla 200 satır
#rewrite Büyük harfe çevirme ve yazım düzeltmesi gibi nedenlerle belirli sözcükleri değiştirmek için yeniden yazma çiftlerinin listesi. En fazla 1.000 satır
#profanity Microsoft'un yerleşik küfür listelerinin üzerinde Görünen ve Maskelenen çıktıda olduğu gibi ****** maskelenecek istenmeyen sözcüklerin listesi. En fazla 1.000 satır
#test Sözcük biçim girişi ve beklenen görüntüleme biçimi çıkışı dahil olmak üzere görüntüleme kurallarının beklendiği gibi çalışıp çalışmadiğini doğrulamak için birim testi çalışmalarının listesi. En fazla 10 MB dosya boyutu

Aşağıda örnek bir görüntüleme biçimi dosyası verilmişti:

// this is a comment line
// each section must start with a '#' character
#itn
// list of ITN pattern rules, one rule for each line
\d-\d-\d
\d-\l-\l-\d
#rewrite
// list of rewrite rules, each rule has two phrases, separated by a tab character
old phrase	new phrase
# profanity
// list of profanity phrases to be tagged/removed/masked, one line one phrase
fakeprofanity
#test
// list of test cases, each test case has two sentences, input lexical and expected display output
// the two sentences are separated by a tab character
// the expected sentence is the display output of DPP+CDPP models
Mask the fakeprofanity word	Mask the ************* word

Sonraki adımlar