speech 패키지
Python용 Microsoft Speech SDK
모듈
audio |
다양한 인식기에 대한 오디오 입력 처리 및 음성 신시사이저의 오디오 출력과 관련된 클래스입니다. |
dialog |
대화 상자 서비스 커넥터와 관련된 클래스입니다. |
enums |
Python용 Microsoft Speech SDK |
intent |
음성의 의도 인식과 관련된 클래스입니다. |
interop |
Python용 Microsoft Speech SDK |
languageconfig |
언어 구성 처리와 관련된 클래스 |
properties |
Python용 Microsoft Speech SDK |
speech |
음성에서 텍스트 인식, 텍스트에서 음성 합성 및 다양한 인식기에서 사용되는 일반 클래스와 관련된 클래스입니다. |
transcription |
대화 기록과 관련된 클래스입니다. |
translation |
다른 언어로 음성 번역과 관련된 클래스입니다. |
version |
Python용 Microsoft Speech SDK |
클래스
AudioDataStream |
오디오 데이터를 스트림으로 작동하는 데 사용되는 오디오 데이터 스트림을 나타냅니다. 음성 합성 결과(SpeechSynthesisResult 형식) 또는 키워드(keyword) 인식 결과(KeywordRecognitionResult 형식)에서 오디오 데이터 스트림을 생성합니다. |
AutoDetectSourceLanguageResult |
자동 검색 원본 언어 결과를 나타냅니다. 결과는 음성 인식 결과에서 초기화할 수 있습니다. |
CancellationDetails |
Python용 Microsoft Speech SDK |
Connection |
지정된 Recognizer의 음성 서비스에 대한 연결을 관리하기 위한 프록시 클래스입니다. 기본적으로 는 Recognizer 필요할 때 서비스에 대한 연결을 자율적으로 관리합니다. 클래스는 Connection 사용자가 명시적으로 연결을 열거나 닫고 연결 상태 변경 내용을 구독하는 추가 메서드를 제공합니다. Connection 사용은 선택 사항입니다. 연결 상태 따라 애플리케이션 동작을 미세 조정해야 하는 시나리오를 위한 것입니다. 사용자는 필요에 따라 를 호출 open 하여 이 Connection와 연결된 에서 Recognizer 인식을 시작하기 전에 서비스 연결을 수동으로 시작할 수 있습니다. 인식을 시작한 후 또는 close 를 호출 open 하지 못할 수 있습니다. 이는 Recognizer 또는 지속적인 인식에 영향을 주지 않습니다. 여러 가지 이유로 인해 연결이 끊어질 수 있습니다. Recognizer는 항상 지속적인 작업을 보장하기 위해 필요에 따라 연결을 다시 구성하려고 합니다. 이러한 모든 경우 connected/disconnected 이벤트는 연결 상태 변경을 나타냅니다. 참고 버전 1.17.0에서 업데이트되었습니다. 내부용 생성자입니다. |
ConnectionEventArgs |
ConnectionEvent에 대한 데이터를 제공합니다. 참고 버전 1.2.0에 추가됨 내부용 생성자입니다. |
EventSignal |
클라이언트는 이벤트 신호에 연결하여 이벤트를 수신하거나 이벤트 신호에서 연결을 끊어 이벤트 수신을 중지할 수 있습니다. 내부용 생성자입니다. |
KeywordRecognitionEventArgs |
키워드(keyword) 인식 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다. |
KeywordRecognitionModel |
키워드(keyword) 인식 모델을 나타냅니다. |
KeywordRecognitionResult |
키워드(keyword) 인식 작업의 결과입니다. 내부용 생성자입니다. |
KeywordRecognizer |
키워드(keyword) 인식기입니다. |
NoMatchDetails |
Python용 Microsoft Speech SDK |
PhraseListGrammar |
음성 인식에 도움이 되는 구 힌트를 런타임에 추가할 수 있는 클래스입니다. 인식기에서 추가된 구는 다음 인식이 시작될 때 또는 다음에 음성 인식기가 음성 서비스에 다시 연결해야 할 때 유효합니다. 참고 버전 1.5.0에 추가되었습니다. 내부용 생성자입니다. |
PronunciationAssessmentConfig |
발음 평가 구성을 나타냅니다. 참고 버전 1.14.0에 추가되었습니다. 구성은 다음 두 가지 방법으로 초기화할 수 있습니다.
매개 변수 세부 정보는 다음을 참조하세요. https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters |
PronunciationAssessmentPhonemeResult |
음소 수준 발음 평가 결과를 포함합니다. 참고 버전 1.14.0에 추가되었습니다. |
PronunciationAssessmentResult |
발음 평가 결과를 나타냅니다. 참고 버전 1.14.0에 추가되었습니다. 결과는 음성 인식 결과에서 초기화할 수 있습니다. |
PronunciationAssessmentWordResult |
단어 수준 발음 평가 결과를 포함합니다. 참고 버전 1.14.0에 추가되었습니다. |
PropertyCollection |
속성 컬렉션에서 속성 값을 검색하거나 설정하는 클래스입니다. |
RecognitionEventArgs |
RecognitionEvent에 대한 데이터를 제공합니다. 내부용 생성자입니다. |
RecognitionResult |
인식 작업의 결과에 대한 자세한 정보입니다. 내부용 생성자입니다. |
Recognizer |
다른 인식자에 대한 기본 클래스 |
ResultFuture |
비동기 작업의 결과입니다. private 생성자 |
SessionEventArgs |
세션 이벤트 인수에 대한 기본 클래스입니다. 내부용 생성자입니다. |
SourceLanguageRecognizer |
원본 언어 인식기 - 독립 실행형 언어 인식기를 단일 언어 또는 연속 언어 감지에 사용할 수 있습니다. 참고 버전 1.18.0에 추가되었습니다. |
SpeechConfig |
음성/의도 인식 및 음성 합성에 대한 구성을 정의하는 클래스입니다. 구성은 다음과 같은 다양한 방법으로 초기화할 수 있습니다.
|
SpeechRecognitionCanceledEventArgs |
음성 인식 취소된 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다. |
SpeechRecognitionEventArgs |
음성 인식 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다. |
SpeechRecognitionResult |
음성 인식 결과에 대한 기본 클래스입니다. 내부용 생성자입니다. |
SpeechRecognizer |
음성 인식기입니다. 원본 언어 정보를 지정해야 하는 경우 언어, source_language_config 또는 auto_detect_source_language_config 세 가지 매개 변수 중 하나만 지정하세요. |
SpeechSynthesisBookmarkEventArgs |
음성 합성 책갈피 이벤트 인수에 대한 클래스입니다. 참고 버전 1.16.0에 추가되었습니다. 내부용 생성자입니다. |
SpeechSynthesisCancellationDetails |
결과가 취소된 이유에 대한 자세한 정보를 포함합니다. |
SpeechSynthesisEventArgs |
음성 합성 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다. |
SpeechSynthesisResult |
음성 합성 작업의 결과입니다. 내부용 생성자입니다. |
SpeechSynthesisVisemeEventArgs |
음성 합성 viseme 이벤트 인수에 대한 클래스입니다. 참고 버전 1.16.0에 추가되었습니다. 내부용 생성자입니다. |
SpeechSynthesisWordBoundaryEventArgs |
음성 합성 단어 경계 이벤트 인수에 대한 클래스입니다. 참고 버전 1.21.0에서 업데이트되었습니다. 내부용 생성자입니다. |
SpeechSynthesizer |
음성 신시사이저입니다. |
SyllableLevelTimingResult |
음절 수준 타이밍 결과를 포함합니다. 참고 버전 1.20.0에 추가되었습니다. |
SynthesisVoicesResult |
검색된 합성 음성 목록에 대한 자세한 정보를 포함합니다. 참고 버전 1.16.0에 추가되었습니다. 내부용 생성자입니다. |
VoiceInfo |
합성 음성 정보에 대한 자세한 정보를 포함합니다. 참고 버전 1.17.0에서 업데이트되었습니다. 내부용 생성자입니다. |
열거형
AudioStreamContainerFormat |
지원되는 오디오 스트림 컨테이너 형식을 정의합니다. |
AudioStreamWaveFormat |
WAV 컨테이너 내에 지정된 형식을 나타냅니다. |
CancellationErrorCode |
CancellationReason이 Error인 경우 오류 코드를 정의합니다. |
CancellationReason |
인식 결과가 취소될 수 있는 가능한 이유를 정의합니다. |
NoMatchReason |
인식 결과가 인식되지 않을 수 있는 가능한 이유를 정의합니다. |
OutputFormat |
출력 형식입니다. |
ProfanityOption |
욕설(욕설)을 제거하거나 불경한 단어의 문자를 별으로 대체합니다. |
PronunciationAssessmentGradingSystem |
발음 점수 보정을 위한 점 시스템을 정의합니다. 기본값은 FivePoint입니다. |
PronunciationAssessmentGranularity |
발음 평가 세분성을 정의합니다. 기본값은 Phoneme입니다. |
PropertyId |
음성 속성 ID를 정의합니다. |
ResultReason |
인식 결과가 생성될 수 있는 가능한 이유를 지정합니다. |
ServicePropertyChannel |
속성 설정을 서비스에 전달하는 데 사용되는 채널을 정의합니다. |
SpeechSynthesisOutputFormat |
가능한 음성 합성 출력 오디오 형식을 정의합니다. |
StreamStatus |
오디오 데이터 스트림의 가능한 상태 정의합니다. |
SynthesisVoiceGender |
합성 음성의 성별을 정의합니다. |
SynthesisVoiceType |
합성 음성의 유형을 정의합니다. |
Azure SDK for Python