Konuşma tanıma sonuçlarını alma
Başvuru belgeleri | Paket (NuGet) | GitHub'da Ek Örnekler
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden
0
başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Bu kod parçacığı, bir Recognizing
olaydan uzaklığı ve süreyi alma işlemini gösterir.
speechRecognizer.Recognizing += (object sender, SpeechRecognitionEventArgs e) =>
{
if (e.Result.Reason == ResultReason.RecognizingSpeech)
{
Console.WriteLine(String.Format ("RECOGNIZING: {0}", e.Result.Text));
Console.WriteLine(String.Format ("Offset in Ticks: {0}", e.Result.OffsetInTicks));
Console.WriteLine(String.Format ("Duration in Ticks: {0}", e.Result.Duration.Ticks));
}
};
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
speechConfig.RequestWordLevelTimestamps();
Bu kod parçacığı, bir Recognized
olaydan uzaklığı ve süreyi alma işlemini gösterir.
speechRecognizer.Recognized += (object sender, SpeechRecognitionEventArgs e) =>
{
if (ResultReason.RecognizedSpeech == e.Result.Reason && e.Result.Text.Length > 0)
{
Console.WriteLine($"RECOGNIZED: Text={e.Result.Text}");
Console.WriteLine(String.Format ("Offset in Ticks: {0}", e.Result.OffsetInTicks));
Console.WriteLine(String.Format ("Duration in Ticks: {0}", e.Result.Duration.Ticks));
var detailedResults = e.Result.Best();
if(detailedResults != null && detailedResults.Any())
{
// The first item in detailedResults corresponds to the recognized text.
// This is not necessarily the item with the highest confidence number.
var bestResults = detailedResults?.ToList()[0];
Console.WriteLine(String.Format("\tConfidence: {0}\n\tText: {1}\n\tLexicalForm: {2}\n\tNormalizedForm: {3}\n\tMaskedNormalizedForm: {4}",
bestResults.Confidence, bestResults.Text, bestResults.LexicalForm, bestResults.NormalizedForm, bestResults.MaskedNormalizedForm));
// You must set speechConfig.RequestWordLevelTimestamps() to get word-level timestamps.
Console.WriteLine($"\tWord-level timing:");
Console.WriteLine($"\t\tWord | Offset | Duration");
Console.WriteLine($"\t\t----- | ----- | ----- ");
foreach (var word in bestResults.Words)
{
Console.WriteLine($"\t\t{word.Word} | {word.Offset} | {word.Duration}");
}
}
}
};
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursu 201'e hoş geldiniz | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Şimdi tamam | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Başvuru belgeleri | Paket (NuGet) | GitHub'da Ek Örnekler
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma hizmeti tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Ofset, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden başlayarak
0
değer değerlerinde ölçülür. Örneğin tanımayı başlattığınızda uzaklık başlar çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. İşaretlerdeki süre, sondaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu alamazsınız. Olayları tanımak, ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınmış metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla, tanınmakta Recognizing
olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Bu kod parçacığı, bir Recognizing
olaydan uzaklığı ve süreyi nasıl elde etmek için gösterir.
speechRecognizer->Recognizing.Connect([](const SpeechRecognitionEventArgs& e)
{
cout << "Recognizing:" << e.Result->Text << std::endl;
cout << "Offset in Ticks:" << e.Result->Offset() << std::endl;
cout << "Duration in Ticks:" << e.Result->Duration() << std::endl;
});
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için, önce ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
speechConfig->RequestWordLevelTimestamps();
Örnek uzaklık ve süre
Aşağıdaki tabloda konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer işaretlerinde) | Süre (değer değerlerinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 201 | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Ses akışının başlangıcından itibaren 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer işaretlerinde) | Süre (değer değerlerinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Tamam şimdi | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyeydi. Algılanan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Başvuru belgeleri | Paket (Go) | GitHub'da Ek Örnekler
Bu nasıl yapılır kılavuzunda, konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma hizmeti tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Ofset, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden başlayarak
0
değer değerlerinde ölçülür. Örneğin tanımayı başlattığınızda uzaklık başlar çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Bu kod parçacığı, bir Recognizing
olaydan uzaklığı ve süreyi alma işlemini gösterir.
func recognizingHandler(event speech.SpeechRecognitionEventArgs) {
defer event.Close()
fmt.Println("Recognizing:", event.Result.Text)
fmt.Println("Offset in Ticks:", event.Result.Offset)
fmt.Println("Duration in Ticks:", event.Result.Duration)
}
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
speechConfig.RequestWordLevelTimestamps();
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursu 201'e hoş geldiniz | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Şimdi tamam | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Başvuru belgeleri | GitHub'da Ek Örnekler
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden
0
başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Bu kod parçacığı, bir Recognizing
olaydan uzaklığı ve süreyi alma işlemini gösterir.
speechRecognizer.recognizing.addEventListener((s, e) -> {
System.out.println("RECOGNIZING: " + e.getResult().getText());
System.out.println("Offset in Ticks: " + e.getResult().getOffset());
System.out.println("Duration in Ticks: " + e.getResult().getDuration());
});
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
speechConfig.requestWordLevelTimestamps();
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursu 201'e hoş geldiniz | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Şimdi tamam | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Başvuru belgeleri | Paket (npm) | GitHub'da | Ek ÖrneklerKitaplık kaynak kodu
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden
0
başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Bu kod parçacığı, bir Recognizing
olaydan uzaklığı ve süreyi alma işlemini gösterir.
speechRecognizer.recognizing = function (s, e) {
console.log("RECOGNIZING: " + e.result.text);
console.log("Offset in Ticks: " + e.result.offset);
console.log("Duration in Ticks: " + e.result.duration);
};
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
speechConfig.requestWordLevelTimestamps();
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursu 201'e hoş geldiniz | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Şimdi tamam | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Başvuru belgeleri | Paket (İndir) | GitHub'da Ek Örnekler
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden
0
başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
[speechConfig requestWordLevelTimestamps];
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursu 201'e hoş geldiniz | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Şimdi tamam | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Başvuru belgeleri | Paket (İndir) | GitHub'da Ek Örnekler
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden
0
başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
[speechConfig requestWordLevelTimestamps];
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursu 201'e hoş geldiniz | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Şimdi tamam | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Başvuru belgeleri | Paket (PyPi) | GitHub'da Ek Örnekler
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden
0
başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Bu kod parçacığı, bir Recognizing
olaydan uzaklığı ve süreyi alma işlemini gösterir.
def recognizing_handler(e : speechsdk.SpeechRecognitionEventArgs) :
if speechsdk.ResultReason.RecognizingSpeech == e.result.reason and len(e.result.text) > 0 :
print("Recognized: {}".format(result.text))
print("Offset in Ticks: {}".format(result.offset))
print("Duration in Ticks: {}".format(result.duration))
Tanınan uzaklık ve süre
Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized
birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig
özelliği burada gösterildiği gibi ayarlamanız gerekir:
speech_config.request_word_level_timestamps()
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursu 201'e hoş geldiniz | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Şimdi tamam | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.
Konuşma eşitleme
Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.
Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.
-
Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden
0
başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder. - Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.
Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.
Uzaklığı ve süreyi tanıma
İster gerçek zamanlı ister önceden kaydedilmiş olsun, açıklamalı alt yazıları ses parçasıyla eşitlemek istersiniz. Olayla Recognizing
, tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing
olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.
Örneğin, tanınan konuşmanın uzaklığını ve süresini almak için aşağıdaki komutu çalıştırın:
spx recognize --file caption.this.mp4 --format any --output each file - @output.each.detailed
@output.each.detailed
Bağımsız değişken ayarlandığından çıkış aşağıdaki sütun başlıklarını içerir:
audio.input.id event event.sessionid result.reason result.latency result.text result.json
result.json
sütununda, ve Recognized
olaylarının uzaklığını ve süresini Recognizing
içeren ayrıntıları bulabilirsiniz:
{
"Id": "492574cd8555481a92c22f5ff757ef17",
"RecognitionStatus": "Success",
"DisplayText": "Welcome to applied Mathematics course 201.",
"Offset": 1800000,
"Duration": 30500000
}
Daha fazla bilgi için bkz. Konuşma CLI veri deposu yapılandırma ve çıkış seçenekleri.
Örnek uzaklık ve süre
Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized
olayları boyunca Recognizing
değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized
olayları arasında Recognizing
aynı kalmak için uzaklığı güvenmeyin.
Olay | Metin | Uzaklık (değer değerlerinde) | Süre (değer işaretleri içinde) |
---|---|---|---|
TANIMA | Hoş geldi -niz | 17000000 | 5000000 |
TANIMA | hoş geldiniz | 17000000 | 6400000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 13600000 |
TANIMA | uygulanan matematiğe hoş geldiniz | 17000000 | 17200000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz | 17000000 | 23700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 2 | 17000000 | 26700000 |
TANIMA | uygulamalı matematik kursuna hoş geldiniz 201 | 17000000 | 33400000 |
TANINAN | Uygulamalı Matematik kursu 201'e hoş geldiniz. | 17000000 | 34500000 |
İlk konuşmanın toplam süresi 3,45 saniyeydi. Ses akışının başlangıcından itibaren 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).
Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.
Olay | Metin | Uzaklık (değer işaretlerinde) | Süre (değer değerlerinde) |
---|---|---|---|
TANIMA | Tamam | 71500000 | 3100000 |
TANIMA | Tamam şimdi | 71500000 | 10300000 |
TANIMA | Tamam şimdi | 71500000 | 14700000 |
TANIMA | Tamam şimdi başlayalım | 71500000 | 18500000 |
TANINAN | Tamam, şimdi başlayalım. | 71500000 | 20600000 |
İkinci konuşmanın toplam süresi 2,06 saniyeydi. Algılanan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin