Udostępnij za pośrednictwem


SpeechRecognizer Klasa

Rozpoznawanie mowy. Jeśli musisz określić informacje o języku źródłowym, określ tylko jeden z tych trzech parametrów, języka, source_language_config lub auto_detect_source_language_config.

Dziedziczenie
SpeechRecognizer

Konstruktor

SpeechRecognizer(speech_config: SpeechConfig, audio_config: AudioConfig = None, language: str = None, source_language_config: SourceLanguageConfig = None, auto_detect_source_language_config: AutoDetectSourceLanguageConfig = None)

Parametry

Nazwa Opis
speech_config
Wymagane

Konfiguracja rozpoznawania mowy

audio_config

Konfiguracja danych wejściowych dźwięku

wartość domyślna: None
language

Język źródłowy

wartość domyślna: None
source_language_config

Konfiguracja języka źródłowego

wartość domyślna: None
auto_detect_source_language_config

Konfiguracja języka źródłowego automatycznego wykrywania

wartość domyślna: None

Metody

recognize_once

Wykonuje rozpoznawanie w trybie blokowania (synchronicznym). Zwraca wartość po rozpoznaniu pojedynczej wypowiedzi. Koniec pojedynczej wypowiedzi zależy od nasłuchiwania ciszy na końcu lub do momentu przetworzenia maksymalnie 15 sekund dźwięku. Zadanie zwraca tekst rozpoznawania w wyniku. Na potrzeby długotrwałego rozpoznawania wielu wypowiedzi lepiej użyć metody start_continuous_recognition_async.

recognize_once_async

Wykonuje rozpoznawanie w trybie nieblokowania (asynchronicznym). Rozpozna to jedną wypowiedź. Koniec pojedynczej wypowiedzi zależy od nasłuchiwania ciszy na końcu lub do momentu przetworzenia maksymalnie 15 sekund dźwięku. Na potrzeby długotrwałego rozpoznawania wielu wypowiedzi lepiej użyć metody start_continuous_recognition_async.

start_continuous_recognition

Synchronicznie inicjuje operację ciągłego rozpoznawania. Aby otrzymywać wyniki rozpoznawania, użytkownik musi nawiązać połączenie z usługą EventSignal. Wywołaj metodę stop_continuous_recognition_async , aby zatrzymać rozpoznawanie.

start_continuous_recognition_async

Asynchronicznie inicjuje operację ciągłego rozpoznawania. Aby otrzymywać wyniki rozpoznawania, użytkownik musi nawiązać połączenie z usługą EventSignal. Wywołaj metodę stop_continuous_recognition_async , aby zatrzymać rozpoznawanie.

start_keyword_recognition

Synchronicznie konfiguruje rozpoznawanie za pomocą danego modelu słowa kluczowego. Po wywołaniu tej metody rozpoznawanie nasłuchuje słowa kluczowego , aby rozpocząć rozpoznawanie. Wywołaj stop_keyword_recognition(), aby zakończyć rozpoznawanie zainicjowane przez słowo kluczowe.

start_keyword_recognition_async

Asynchronicznie konfiguruje rozpoznawanie za pomocą danego modelu słowa kluczowego. Po wywołaniu tej metody rozpoznawanie nasłuchuje słowa kluczowego , aby rozpocząć rozpoznawanie. Wywołaj stop_keyword_recognition_async(), aby zakończyć rozpoznawanie inicjowane przez słowo kluczowe.

stop_continuous_recognition

Synchronicznie kończy trwającą operację ciągłego rozpoznawania.

stop_continuous_recognition_async

Asynchronicznie kończy ciągłą operację rozpoznawania.

stop_keyword_recognition

Synchronicznie kończy rozpoznawanie inicjowane przez słowo kluczowe.

stop_keyword_recognition_async

Asynchronicznie kończy rozpoznawanie inicjowane przez słowo kluczowe.

recognize_once

Wykonuje rozpoznawanie w trybie blokowania (synchronicznym). Zwraca wartość po rozpoznaniu pojedynczej wypowiedzi. Koniec pojedynczej wypowiedzi zależy od nasłuchiwania ciszy na końcu lub do momentu przetworzenia maksymalnie 15 sekund dźwięku. Zadanie zwraca tekst rozpoznawania w wyniku. Na potrzeby długotrwałego rozpoznawania wielu wypowiedzi lepiej użyć metody start_continuous_recognition_async.

recognize_once() -> SpeechRecognitionResult

Zwraca

Typ Opis

Wartość wyniku synchronicznego rozpoznawania.

recognize_once_async

Wykonuje rozpoznawanie w trybie nieblokowania (asynchronicznym). Rozpozna to jedną wypowiedź. Koniec pojedynczej wypowiedzi zależy od nasłuchiwania ciszy na końcu lub do momentu przetworzenia maksymalnie 15 sekund dźwięku. Na potrzeby długotrwałego rozpoznawania wielu wypowiedzi lepiej użyć metody start_continuous_recognition_async.

recognize_once_async() -> ResultFuture

Zwraca

Typ Opis

Przyszłość zawierająca wartość wynikową rozpoznawania asynchronicznego.

start_continuous_recognition

Synchronicznie inicjuje operację ciągłego rozpoznawania. Aby otrzymywać wyniki rozpoznawania, użytkownik musi nawiązać połączenie z usługą EventSignal. Wywołaj metodę stop_continuous_recognition_async , aby zatrzymać rozpoznawanie.

start_continuous_recognition()

start_continuous_recognition_async

Asynchronicznie inicjuje operację ciągłego rozpoznawania. Aby otrzymywać wyniki rozpoznawania, użytkownik musi nawiązać połączenie z usługą EventSignal. Wywołaj metodę stop_continuous_recognition_async , aby zatrzymać rozpoznawanie.

start_continuous_recognition_async() -> ResultFuture

Zwraca

Typ Opis

Przyszłość, która zostanie spełniona po zainicjowaniu rozpoznawania.

start_keyword_recognition

Synchronicznie konfiguruje rozpoznawanie za pomocą danego modelu słowa kluczowego. Po wywołaniu tej metody rozpoznawanie nasłuchuje słowa kluczowego , aby rozpocząć rozpoznawanie. Wywołaj stop_keyword_recognition(), aby zakończyć rozpoznawanie zainicjowane przez słowo kluczowe.

start_keyword_recognition(model: KeywordRecognitionModel)

Parametry

Nazwa Opis
model
Wymagane

model rozpoznawania słów kluczowych określający słowo kluczowe, które ma zostać rozpoznane.

start_keyword_recognition_async

Asynchronicznie konfiguruje rozpoznawanie za pomocą danego modelu słowa kluczowego. Po wywołaniu tej metody rozpoznawanie nasłuchuje słowa kluczowego , aby rozpocząć rozpoznawanie. Wywołaj stop_keyword_recognition_async(), aby zakończyć rozpoznawanie inicjowane przez słowo kluczowe.

start_keyword_recognition_async(model: KeywordRecognitionModel) -> ResultFuture

Parametry

Nazwa Opis
model
Wymagane

model rozpoznawania słów kluczowych określający słowo kluczowe, które ma zostać rozpoznane.

Zwraca

Typ Opis

Przyszłość, która zostanie spełniona po zainicjowaniu rozpoznawania.

stop_continuous_recognition

Synchronicznie kończy trwającą operację ciągłego rozpoznawania.

stop_continuous_recognition()

stop_continuous_recognition_async

Asynchronicznie kończy ciągłą operację rozpoznawania.

stop_continuous_recognition_async()

Zwraca

Typ Opis

Przyszłość, która zostanie spełniona po zatrzymaniu rozpoznawania.

stop_keyword_recognition

Synchronicznie kończy rozpoznawanie inicjowane przez słowo kluczowe.

stop_keyword_recognition()

stop_keyword_recognition_async

Asynchronicznie kończy rozpoznawanie inicjowane przez słowo kluczowe.

stop_keyword_recognition_async()

Zwraca

Typ Opis

Przyszłość, która zostanie spełniona po zatrzymaniu rozpoznawania.

Atrybuty

authorization_token

Token autoryzacji, który będzie używany do nawiązywania połączenia z usługą.

Uwaga

Obiekt wywołujący musi upewnić się, że token autoryzacji jest prawidłowy. Przed

Token autoryzacji wygasa, obiekt wywołujący musi go odświeżyć, wywołując ten setter za pomocą elementu

nowy prawidłowy token. W przeciwnym razie podczas rozpoznawania wystąpią błędy rozpoznawania.

canceled

Sygnał dla zdarzeń zawierających anulowane wyniki rozpoznawania (wskazujący próbę rozpoznania, która została anulowana w wyniku lub żądanie anulowania bezpośredniego lub, alternatywnie, niepowodzenie transportu lub protokołu).

Wywołania zwrotne połączone z tym sygnałem SpeechRecognitionCanceledEventArgssą wywoływane za pomocą wystąpienia , jako pojedynczego argumentu.

endpoint_id

Identyfikator punktu końcowego dostosowanego modelu mowy używanego do rozpoznawania lub niestandardowego modelu głosu na potrzeby syntezy mowy.

properties

Kolekcja właściwości i ich wartości zdefiniowanych dla tego rozpoznawania.

recognized

Sygnał dla zdarzeń zawierających końcowe wyniki rozpoznawania (wskazujący pomyślną próbę rozpoznawania).

Wywołania zwrotne połączone z tym sygnałem są wywoływane z wystąpieniem SpeechRecognitionEventArgs jako pojedynczy argument zależny od typu rozpoznawania.

recognizing

Sygnał dla zdarzeń zawierających wyniki rozpoznawania pośredniego.

Wywołania zwrotne połączone z tym sygnałem są wywoływane z wystąpieniem SpeechRecognitionEventArgs jako pojedynczy argument.

session_started

Sygnał dla zdarzeń wskazujących początek sesji rozpoznawania (operacja).

Wywołania zwrotne połączone z tym sygnałem są wywoływane z wystąpieniem SessionEventArgs jako pojedynczy argument.

session_stopped

Sygnał dla zdarzeń wskazujących koniec sesji rozpoznawania (operacja).

Wywołania zwrotne połączone z tym sygnałem są wywoływane z wystąpieniem SessionEventArgs jako pojedynczy argument.

speech_end_detected

Sygnał dla zdarzeń wskazujących koniec mowy.

Wywołania zwrotne połączone z tym sygnałem są wywoływane z wystąpieniem RecognitionEventArgs jako pojedynczy argument.

speech_start_detected

Sygnał dla zdarzeń wskazujący początek mowy.

Wywołania zwrotne połączone z tym sygnałem są wywoływane z wystąpieniem RecognitionEventArgs jako pojedynczy argument.