SpeechRecognitionEngine Klasa
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Zapewnia dostęp do aparatu rozpoznawania mowy w procesie i zarządzania nim.
public ref class SpeechRecognitionEngine : IDisposable
public class SpeechRecognitionEngine : IDisposable
type SpeechRecognitionEngine = class
interface IDisposable
Public Class SpeechRecognitionEngine
Implements IDisposable
- Dziedziczenie
-
SpeechRecognitionEngine
- Implementuje
Przykłady
Poniższy przykład przedstawia część aplikacji konsolowej, która demonstruje podstawowe rozpoznawanie mowy. Ponieważ w tym przykładzie używa Multiple
trybu RecognizeAsync metody, wykonuje rozpoznawanie, dopóki nie zamkniesz okna konsoli lub nie zatrzymasz debugowania.
using System;
using System.Speech.Recognition;
namespace SpeechRecognitionApp
{
class Program
{
static void Main(string[] args)
{
// Create an in-process speech recognizer for the en-US locale.
using (
SpeechRecognitionEngine recognizer =
new SpeechRecognitionEngine(
new System.Globalization.CultureInfo("en-US")))
{
// Create and load a dictation grammar.
recognizer.LoadGrammar(new DictationGrammar());
// Add a handler for the speech recognized event.
recognizer.SpeechRecognized +=
new EventHandler<SpeechRecognizedEventArgs>(recognizer_SpeechRecognized);
// Configure input to the speech recognizer.
recognizer.SetInputToDefaultAudioDevice();
// Start asynchronous, continuous speech recognition.
recognizer.RecognizeAsync(RecognizeMode.Multiple);
// Keep the console window open.
while (true)
{
Console.ReadLine();
}
}
}
// Handle the SpeechRecognized event.
static void recognizer_SpeechRecognized(object sender, SpeechRecognizedEventArgs e)
{
Console.WriteLine("Recognized text: " + e.Result.Text);
}
}
}
Uwagi
Dla dowolnego z zainstalowanych aparatów rozpoznawania mowy można utworzyć wystąpienie tej klasy. Aby uzyskać informacje o zainstalowanych aparatach rozpoznawania, użyj metody statycznej InstalledRecognizers .
Ta klasa jest używana do uruchamiania aparatów rozpoznawania mowy w procesie i zapewnia kontrolę nad różnymi aspektami rozpoznawania mowy w następujący sposób:
Aby utworzyć aparat rozpoznawania mowy w procesie, użyj jednego z SpeechRecognitionEngine konstruktorów.
Aby zarządzać gramatykami rozpoznawania mowy, użyj LoadGrammar metod, LoadGrammarAsync , UnloadGrammar , i UnloadAllGrammars Grammars właściwości.
Aby skonfigurować dane wejściowe do aparatu rozpoznawania, użyj SetInputToAudioStream metody, SetInputToDefaultAudioDevice , SetInputToNull , SetInputToWaveFile lub SetInputToWaveStream .
Aby przeprowadzić rozpoznawanie mowy, użyj Recognize metody lub RecognizeAsync .
Aby zmodyfikować sposób, w jaki rozpoznawanie obsługuje wyciszenie lub nieoczekiwane dane wejściowe, użyj BabbleTimeout właściwości,, InitialSilenceTimeout EndSilenceTimeout i EndSilenceTimeoutAmbiguous .
Aby zmienić liczbę elementów zastępczych zwracanych przez aparat rozpoznawania, użyj MaxAlternates właściwości. Aparat rozpoznawania zwraca wyniki rozpoznawania w RecognitionResult obiekcie.
Aby zsynchronizować zmiany w aparacie rozpoznawania, użyj RequestRecognizerUpdate metody. Aparat rozpoznawania używa więcej niż jednego wątku do wykonywania zadań.
Aby emulować dane wejściowe do aparatu rozpoznawania, użyj EmulateRecognize metod i EmulateRecognizeAsync .
SpeechRecognitionEngineObiekt służy wyłącznie do korzystania z procesu, który tworzy wystąpienie obiektu. Z drugiej strony, SpeechRecognizer współużytkuje jeden aparat rozpoznawania z dowolną aplikacją, która chce jej używać.
Uwaga
Zawsze wywołuj Dispose przed wydaniem ostatniego odwołania do aparatu rozpoznawania mowy. W przeciwnym razie używane zasoby nie zostaną zwolnione do momentu wywołania metody aparatu rozpoznawania elementów bezużytecznych Finalize
.
Konstruktory
SpeechRecognitionEngine() |
Inicjuje nowe wystąpienie SpeechRecognitionEngine klasy przy użyciu domyślnego aparatu rozpoznawania mowy dla systemu. |
SpeechRecognitionEngine(CultureInfo) |
Inicjuje nowe wystąpienie SpeechRecognitionEngine klasy przy użyciu domyślnego aparatu rozpoznawania mowy dla określonych ustawień regionalnych. |
SpeechRecognitionEngine(RecognizerInfo) |
Inicjuje nowe wystąpienie programu SpeechRecognitionEngine przy użyciu informacji w RecognizerInfo obiekcie, aby określić aparat rozpoznawania, który ma być używany. |
SpeechRecognitionEngine(String) |
Inicjuje nowe wystąpienie SpeechRecognitionEngine klasy z parametrem ciągu, który określa nazwę aparatu rozpoznawania do użycia. |
Właściwości
AudioFormat |
Pobiera format dźwięku odbieranego przez SpeechRecognitionEngine . |
AudioLevel |
Pobiera poziom audio odbieranego przez SpeechRecognitionEngine . |
AudioPosition |
Pobiera bieżącą lokalizację w strumieniu audio generowanym przez urządzenie, które udostępnia dane wejściowe SpeechRecognitionEngine . |
AudioState |
Pobiera stan dźwięku odbieranego przez SpeechRecognitionEngine . |
BabbleTimeout |
Pobiera lub ustawia przedział czasu, w którym SpeechRecognitionEngine akceptowane są dane wejściowe zawierające tylko hałas w tle, przed zakończeniem rozpoznawania. |
EndSilenceTimeout |
Pobiera lub ustawia interwał wyciszenia, który SpeechRecognitionEngine zostanie zaakceptowany na końcu niejednoznacznych danych wejściowych przed zakończeniem operacji rozpoznawania. |
EndSilenceTimeoutAmbiguous |
Pobiera lub ustawia interwał wyciszenia, który SpeechRecognitionEngine zostanie zaakceptowany na końcu niejednoznacznych danych wejściowych przed zakończeniem operacji rozpoznawania. |
Grammars |
Pobiera kolekcję Grammar obiektów, które są ładowane w tym SpeechRecognitionEngine wystąpieniu. |
InitialSilenceTimeout |
Pobiera lub ustawia przedział czasu, w którym SpeechRecognitionEngine akceptowane są dane wejściowe zawierające tylko cisz przed finalizowaniem rozpoznawania. |
MaxAlternates |
Pobiera lub ustawia maksymalną liczbę alternatywnych wyników rozpoznawania zwracanych przez funkcję SpeechRecognitionEngine Return dla każdej operacji rozpoznawania. |
RecognizerAudioPosition |
Pobiera bieżącą lokalizację SpeechRecognitionEngine w danych wejściowych audio, która jest przetwarzana. |
RecognizerInfo |
Pobiera informacje o bieżącym wystąpieniu SpeechRecognitionEngine . |
Metody
Dispose() |
Usuwa SpeechRecognitionEngine obiekt. |
Dispose(Boolean) |
Usuwa SpeechRecognitionEngine obiekt i zwalnia zasoby używane podczas sesji. |
EmulateRecognize(RecognizedWordUnit[], CompareOptions) |
Emuluje wprowadzanie określonych słów do aparatu rozpoznawania mowy, przy użyciu tekstu zamiast dźwięku do synchronicznego rozpoznawania mowy i określa, jak aparat rozpoznawania obsługuje porównanie Unicode między wyrazami a załadowanymi gramatykami rozpoznawania mowy. |
EmulateRecognize(String) |
Emuluje wprowadzanie frazy do aparatu rozpoznawania mowy przy użyciu tekstu zamiast dźwięku do synchronicznego rozpoznawania mowy. |
EmulateRecognize(String, CompareOptions) |
Emuluje wprowadzanie frazy do aparatu rozpoznawania mowy, przy użyciu tekstu zamiast dźwięku do synchronicznego rozpoznawania mowy i określa, jak aparat rozpoznawania obsługuje porównanie Unicode między frazą a załadowane gramatyki rozpoznawania mowy. |
EmulateRecognizeAsync(RecognizedWordUnit[], CompareOptions) |
Emuluje wprowadzanie określonych słów do aparatu rozpoznawania mowy przy użyciu tablicy RecognizedWordUnit obiektów zamiast dźwięku na potrzeby asynchronicznego rozpoznawania mowy i określa, jak aparat rozpoznawania obsługuje porównanie Unicode między wyrazami a załadowanymi gramatykami rozpoznawania mowy. |
EmulateRecognizeAsync(String) |
Emuluje wprowadzanie frazy do aparatu rozpoznawania mowy przy użyciu tekstu zamiast dźwięku na potrzeby asynchronicznego rozpoznawania mowy. |
EmulateRecognizeAsync(String, CompareOptions) |
Emuluje wprowadzanie frazy do aparatu rozpoznawania mowy, przy użyciu tekstu zamiast dźwięku na potrzeby asynchronicznego rozpoznawania mowy i określa, jak aparat rozpoznawania obsługuje porównanie Unicode między frazą a załadowane gramatyki rozpoznawania mowy. |
Equals(Object) |
Określa, czy dany obiekt jest taki sam, jak bieżący obiekt. (Odziedziczone po Object) |
GetHashCode() |
Służy jako domyślna funkcja skrótu. (Odziedziczone po Object) |
GetType() |
Type Pobiera wartość bieżącego wystąpienia. (Odziedziczone po Object) |
InstalledRecognizers() |
Zwraca informacje dla wszystkich zainstalowanych aparatów rozpoznawania mowy w bieżącym systemie. |
LoadGrammar(Grammar) |
Synchronicznie ładuje Grammar obiekt. |
LoadGrammarAsync(Grammar) |
Asynchronicznie ładuje gramatykę rozpoznawania mowy. |
MemberwiseClone() |
Tworzy płytkią kopię bieżącego Objectelementu . (Odziedziczone po Object) |
QueryRecognizerSetting(String) |
Zwraca wartości ustawień dla aparatu rozpoznawania. |
Recognize() |
Wykonuje synchroniczną operację rozpoznawania mowy. |
Recognize(TimeSpan) |
Wykonuje synchroniczną operację rozpoznawania mowy z określonym początkowym limitem czasu wyciszenia. |
RecognizeAsync() |
Wykonuje pojedynczą, asynchroniczną operację rozpoznawania mowy. |
RecognizeAsync(RecognizeMode) |
Wykonuje co najmniej jedną asynchroniczne operacje rozpoznawania mowy. |
RecognizeAsyncCancel() |
Kończy rozpoznawanie asynchroniczne bez oczekiwania na zakończenie bieżącej operacji rozpoznawania. |
RecognizeAsyncStop() |
Wyłącza asynchroniczne rozpoznawanie po zakończeniu bieżącej operacji rozpoznawania. |
RequestRecognizerUpdate() |
Żąda, aby aparat rozpoznawania wstrzymał aktualizację stanu. |
RequestRecognizerUpdate(Object) |
Żądania, które aparat rozpoznawania wstrzymuje w celu zaktualizowania jego stanu i udostępnia token użytkownika dla skojarzonego zdarzenia. |
RequestRecognizerUpdate(Object, TimeSpan) |
Żądania, które aparat rozpoznawania wstrzymuje w celu zaktualizowania stanu i zawiera przesunięcie i token użytkownika dla skojarzonego zdarzenia. |
SetInputToAudioStream(Stream, SpeechAudioFormatInfo) |
Konfiguruje SpeechRecognitionEngine obiekt do odbierania danych wejściowych ze strumienia audio. |
SetInputToDefaultAudioDevice() |
Konfiguruje SpeechRecognitionEngine obiekt do odbierania danych wejściowych z domyślnego urządzenia audio. |
SetInputToNull() |
Wyłącza dane wejściowe aparatu rozpoznawania mowy. |
SetInputToWaveFile(String) |
Konfiguruje SpeechRecognitionEngine obiekt do odbierania danych wejściowych z pliku Wave audio format (. wav). |
SetInputToWaveStream(Stream) |
Konfiguruje SpeechRecognitionEngine obiekt do odbierania danych wejściowych ze strumienia zawierającego dane Wave audio (wav). |
ToString() |
Zwraca ciąg reprezentujący bieżący obiekt. (Odziedziczone po Object) |
UnloadAllGrammars() |
Zwalnia wszystkie Grammar obiekty z aparatu rozpoznawania. |
UnloadGrammar(Grammar) |
Zwalnia określony Grammar obiekt z SpeechRecognitionEngine wystąpienia. |
UpdateRecognizerSetting(String, Int32) |
Aktualizuje określone ustawienie dla SpeechRecognitionEngine z określoną wartością całkowitą. |
UpdateRecognizerSetting(String, String) |
Aktualizuje określone ustawienie aparatu rozpoznawania mowy o określonej wartości ciągu. |
Zdarzenia
AudioLevelUpdated |
Uruchamiany, gdy SpeechRecognitionEngine raportuje poziom wejścia audio. |
AudioSignalProblemOccurred |
Uruchamiany po SpeechRecognitionEngine wykryciu problemu w sygnale audio. |
AudioStateChanged |
Uruchamiany po zmianie stanu w dźwięku otrzymywanym przez SpeechRecognitionEngine . |
EmulateRecognizeCompleted |
Uruchamiany, gdy kończy SpeechRecognitionEngine asynchroniczne operacje rozpoznawania emulowanej danych wejściowych. |
LoadGrammarCompleted |
Uruchamiany po SpeechRecognitionEngine zakończeniu asynchronicznego ładowania Grammar obiektu. |
RecognizeCompleted |
Uruchamiany, gdy kończy SpeechRecognitionEngine asynchroniczne operacje rozpoznawania. |
RecognizerUpdateReached |
Uruchamiany, gdy działa SpeechRecognitionEngine wstrzymanie, aby akceptować modyfikacje. |
SpeechDetected |
Uruchamiany, gdy SpeechRecognitionEngine wykryje dane wejściowe, które mogą identyfikować jako mowę. |
SpeechHypothesized |
Uruchamiany, gdy SpeechRecognitionEngine rozpoznany wyraz lub wyraz, który może być składnikiem wielu kompletnych fraz w gramatyce. |
SpeechRecognitionRejected |
Uruchamiany, gdy SpeechRecognitionEngine odbiera dane wejściowe, które nie są zgodne z żadnym z załadowanych i włączonych Grammar obiektów. |
SpeechRecognized |
Uruchamiany, gdy SpeechRecognitionEngine odbiera dane wejściowe, które pasują do dowolnego z załadowanych i włączonych Grammar obiektów. |