Konuşma tanıma sonuçlarını alma

Başvuru belgeleri | Paket (NuGet) | GitHub'da Ek Örnekler

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden 0 başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Bu kod parçacığı, bir Recognizing olaydan uzaklığı ve süreyi alma işlemini gösterir.

speechRecognizer.Recognizing += (object sender, SpeechRecognitionEventArgs e) =>
    {
        if (e.Result.Reason == ResultReason.RecognizingSpeech)
        {        
            Console.WriteLine(String.Format ("RECOGNIZING: {0}", e.Result.Text));
            Console.WriteLine(String.Format ("Offset in Ticks: {0}", e.Result.OffsetInTicks));
            Console.WriteLine(String.Format ("Duration in Ticks: {0}", e.Result.Duration.Ticks));
        }
    };

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

speechConfig.RequestWordLevelTimestamps();

Bu kod parçacığı, bir Recognized olaydan uzaklığı ve süreyi alma işlemini gösterir.

speechRecognizer.Recognized += (object sender, SpeechRecognitionEventArgs e) =>
    {
        if (ResultReason.RecognizedSpeech == e.Result.Reason && e.Result.Text.Length > 0)
        {            
            Console.WriteLine($"RECOGNIZED: Text={e.Result.Text}");
            Console.WriteLine(String.Format ("Offset in Ticks: {0}", e.Result.OffsetInTicks));
            Console.WriteLine(String.Format ("Duration in Ticks: {0}", e.Result.Duration.Ticks));
                        
            var detailedResults = e.Result.Best();
            if(detailedResults != null && detailedResults.Any())
            {
                // The first item in detailedResults corresponds to the recognized text.
                // This is not necessarily the item with the highest confidence number.
                var bestResults = detailedResults?.ToList()[0];
                Console.WriteLine(String.Format("\tConfidence: {0}\n\tText: {1}\n\tLexicalForm: {2}\n\tNormalizedForm: {3}\n\tMaskedNormalizedForm: {4}",
                    bestResults.Confidence, bestResults.Text, bestResults.LexicalForm, bestResults.NormalizedForm, bestResults.MaskedNormalizedForm));
                // You must set speechConfig.RequestWordLevelTimestamps() to get word-level timestamps.
                Console.WriteLine($"\tWord-level timing:");
                Console.WriteLine($"\t\tWord | Offset | Duration");
                Console.WriteLine($"\t\t----- | ----- | ----- ");

                foreach (var word in bestResults.Words)
                {
                    Console.WriteLine($"\t\t{word.Word} | {word.Offset} | {word.Duration}");
                }
            }
        }
    };

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursu 201'e hoş geldiniz 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Tamam 71500000 3100000
TANIMA Şimdi tamam 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Başvuru belgeleri | Paket (NuGet) | GitHub'da Ek Örnekler

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma hizmeti tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Ofset, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden başlayarak 0 değer değerlerinde ölçülür. Örneğin tanımayı başlattığınızda uzaklık başlar çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. İşaretlerdeki süre, sondaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu alamazsınız. Olayları tanımak, ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınmış metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla, tanınmakta Recognizing olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Bu kod parçacığı, bir Recognizing olaydan uzaklığı ve süreyi nasıl elde etmek için gösterir.

speechRecognizer->Recognizing.Connect([](const SpeechRecognitionEventArgs& e)
    {
        cout << "Recognizing:" << e.Result->Text << std::endl;
        cout << "Offset in Ticks:" << e.Result->Offset() << std::endl;
        cout << "Duration in Ticks:" << e.Result->Duration() << std::endl;
    });

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için, önce ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

speechConfig->RequestWordLevelTimestamps();

Örnek uzaklık ve süre

Aşağıdaki tabloda konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer işaretlerinde) Süre (değer değerlerinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 201 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Ses akışının başlangıcından itibaren 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer işaretlerinde) Süre (değer değerlerinde)
TANIMA Tamam 71500000 3100000
TANIMA Tamam şimdi 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyeydi. Algılanan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Başvuru belgeleri | Paket (Go) | GitHub'da Ek Örnekler

Bu nasıl yapılır kılavuzunda, konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma hizmeti tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Ofset, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden başlayarak 0 değer değerlerinde ölçülür. Örneğin tanımayı başlattığınızda uzaklık başlar çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Bu kod parçacığı, bir Recognizing olaydan uzaklığı ve süreyi alma işlemini gösterir.

func recognizingHandler(event speech.SpeechRecognitionEventArgs) {
    defer event.Close()
    fmt.Println("Recognizing:", event.Result.Text)
    fmt.Println("Offset in Ticks:", event.Result.Offset)
    fmt.Println("Duration in Ticks:", event.Result.Duration)
}

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

speechConfig.RequestWordLevelTimestamps();

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursu 201'e hoş geldiniz 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Tamam 71500000 3100000
TANIMA Şimdi tamam 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Başvuru belgeleri | GitHub'da Ek Örnekler

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden 0 başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Bu kod parçacığı, bir Recognizing olaydan uzaklığı ve süreyi alma işlemini gösterir.

speechRecognizer.recognizing.addEventListener((s, e) -> {
    System.out.println("RECOGNIZING: " + e.getResult().getText());
    System.out.println("Offset in Ticks: " + e.getResult().getOffset());
    System.out.println("Duration in Ticks: " + e.getResult().getDuration());
});

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

speechConfig.requestWordLevelTimestamps();

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursu 201'e hoş geldiniz 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Tamam 71500000 3100000
TANIMA Şimdi tamam 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Başvuru belgeleri | Paket (npm) | GitHub'da | Ek ÖrneklerKitaplık kaynak kodu

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden 0 başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Bu kod parçacığı, bir Recognizing olaydan uzaklığı ve süreyi alma işlemini gösterir.

speechRecognizer.recognizing = function (s, e) {
    console.log("RECOGNIZING: " + e.result.text);
    console.log("Offset in Ticks: " + e.result.offset);
    console.log("Duration in Ticks: " + e.result.duration);
};

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

speechConfig.requestWordLevelTimestamps();

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursu 201'e hoş geldiniz 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Tamam 71500000 3100000
TANIMA Şimdi tamam 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Başvuru belgeleri | Paket (İndir) | GitHub'da Ek Örnekler

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden 0 başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

[speechConfig requestWordLevelTimestamps];

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursu 201'e hoş geldiniz 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Tamam 71500000 3100000
TANIMA Şimdi tamam 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Başvuru belgeleri | Paket (İndir) | GitHub'da Ek Örnekler

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden 0 başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

[speechConfig requestWordLevelTimestamps];

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursu 201'e hoş geldiniz 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Tamam 71500000 3100000
TANIMA Şimdi tamam 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Başvuru belgeleri | Paket (PyPi) | GitHub'da Ek Örnekler

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden 0 başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Bu kod parçacığı, bir Recognizing olaydan uzaklığı ve süreyi alma işlemini gösterir.

def recognizing_handler(e : speechsdk.SpeechRecognitionEventArgs) :
    if speechsdk.ResultReason.RecognizingSpeech == e.result.reason and len(e.result.text) > 0 :
        print("Recognized: {}".format(result.text))
        print("Offset in Ticks: {}".format(result.offset))
        print("Duration in Ticks: {}".format(result.duration))

Tanınan uzaklık ve süre

Bir konuşma tanındıktan sonra, tanınan konuşmanın uzaklığını ve süresini alabilirsiniz. Olayla Recognized birlikte, sözcük başına uzaklığı ve süreyi de alabilirsiniz. Sözcük başına uzaklık ve süre istemek için öncelikle ilgili SpeechConfig özelliği burada gösterildiği gibi ayarlamanız gerekir:

speech_config.request_word_level_timestamps()

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursu 201'e hoş geldiniz 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Tanınmakta olan ses akışının başlangıcından 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınmakta olan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Tamam 71500000 3100000
TANIMA Şimdi tamam 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyedir. Tanınmakta olan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Bu nasıl yapılır kılavuzunda konuşma tanıma sonuçlarını nasıl kullanabileceğinizi öğreneceksiniz.

Konuşma eşitleme

Transkripsiyonları gerçek zamanlı olarak veya bir ön kayıtla yapılan bir ses parçasıyla eşitlemek isteyebilirsiniz.

Konuşma tanıma hizmeti, tanınan konuşmanın uzaklığını ve süresini döndürür.

  • Uzaklık: Tanınan ses akışına uzaklık, süre olarak ifade edilir. Uzaklık, SDK tarafından işlenen ilk ses baytıyla ilişkili (sıfır) değerden 0 başlayarak değer değerlerinde ölçülür. Örneğin, tanımayı başlattığınızda uzaklık başlar, çünkü SDK ses akışını işlemeye başlar. Bir değer çizgisi yüz nanosaniyeyi veya saniyenin on milyonda birini temsil eder.
  • Süre: Tanınan konuşmanın süresi. Kenelerdeki süre sonundaki veya baştaki sessizliği içermez.

Tek bir konuşmanın sonu, sonundaki sessizliği dinleyerek belirlenir. Konuşma tamamlanana kadar son tanıma sonucunu almazsınız. Olayları tanımak, bir ses akışı işlenirken değiştirilebilir ara sonuçlar sağlar. Tanınan olaylar, konuşmanın işlenmesi tamamlandıktan sonra son dökümü alınan metni sağlar.

Uzaklığı ve süreyi tanıma

İster gerçek zamanlı ister önceden kaydedilmiş olsun, açıklamalı alt yazıları ses parçasıyla eşitlemek istersiniz. Olayla Recognizing , tanınmakta olan konuşmanın uzaklığını ve süresini alabilirsiniz. Tanıma devam ederken sözcük başına uzaklık ve süre kullanılamaz. Her Recognizing olay, şu ana kadar tanınan konuşmanın metinsel bir tahminiyle birlikte gelir.

Örneğin, tanınan konuşmanın uzaklığını ve süresini almak için aşağıdaki komutu çalıştırın:

spx recognize --file caption.this.mp4 --format any --output each file - @output.each.detailed

@output.each.detailed Bağımsız değişken ayarlandığından çıkış aşağıdaki sütun başlıklarını içerir:

audio.input.id  event   event.sessionid result.reason   result.latency  result.text     result.json

result.json sütununda, ve Recognized olaylarının uzaklığını ve süresini Recognizing içeren ayrıntıları bulabilirsiniz:

{
	"Id": "492574cd8555481a92c22f5ff757ef17",
	"RecognitionStatus": "Success",
	"DisplayText": "Welcome to applied Mathematics course 201.",
	"Offset": 1800000,
	"Duration": 30500000
}

Daha fazla bilgi için bkz. Konuşma CLI veri deposu yapılandırma ve çıkış seçenekleri.

Örnek uzaklık ve süre

Aşağıdaki tabloda, konuşmacı "Uygulamalı Matematik kursu 201'e hoş geldiniz" dediğinde, kenelerdeki olası uzaklık ve süre gösterilmektedir. Bu örnekte, uzaklık ve Recognized olayları boyunca Recognizing değişmez. Ancak, son sonuç farklı olabileceğinden ve Recognized olayları arasında Recognizing aynı kalmak için uzaklığı güvenmeyin.

Olay Metin Uzaklık (değer değerlerinde) Süre (değer işaretleri içinde)
TANIMA Hoş geldi -niz 17000000 5000000
TANIMA hoş geldiniz 17000000 6400000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 13600000
TANIMA uygulanan matematiğe hoş geldiniz 17000000 17200000
TANIMA uygulamalı matematik kursuna hoş geldiniz 17000000 23700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 2 17000000 26700000
TANIMA uygulamalı matematik kursuna hoş geldiniz 201 17000000 33400000
TANINAN Uygulamalı Matematik kursu 201'e hoş geldiniz. 17000000 34500000

İlk konuşmanın toplam süresi 3,45 saniyeydi. Ses akışının başlangıcından itibaren 1,7 ile 5,15 saniye uzaklıkta tanındı (00:00:01.700 --> 00:00:05.150).

Konuşmacı "Haydi başlayalım" demeye devam ederse, tanınan ses akışının başlangıcından yeni konuşmanın başlangıcına kadar yeni bir uzaklık hesaplanır. Aşağıdaki tabloda, önceki konuşma sona erdikten iki saniye sonra başlayan bir konuşmanın olası uzaklığı ve süresi gösterilmektedir.

Olay Metin Uzaklık (değer işaretlerinde) Süre (değer değerlerinde)
TANIMA Tamam 71500000 3100000
TANIMA Tamam şimdi 71500000 10300000
TANIMA Tamam şimdi 71500000 14700000
TANIMA Tamam şimdi başlayalım 71500000 18500000
TANINAN Tamam, şimdi başlayalım. 71500000 20600000

İkinci konuşmanın toplam süresi 2,06 saniyeydi. Algılanan ses akışının başlangıcından 7,15 ile 9,21 saniye uzaklıkta tanındı (00:00:07.150 --> 00:00:09.210).

Sonraki adımlar