speech 패키지

참조

Python용 Microsoft Speech SDK

모듈

audio	다양한 인식기에 대한 오디오 입력 처리 및 음성 신시사이저의 오디오 출력과 관련된 클래스입니다.
dialog	대화 상자 서비스 커넥터와 관련된 클래스입니다.
enums	Python용 Microsoft Speech SDK
intent	음성의 의도 인식과 관련된 클래스입니다.
interop	Python용 Microsoft Speech SDK
languageconfig	언어 구성 처리와 관련된 클래스
properties	Python용 Microsoft Speech SDK
speech	음성에서 텍스트 인식, 텍스트에서 음성 합성 및 다양한 인식기에서 사용되는 일반 클래스와 관련된 클래스입니다.
transcription	대화 기록과 관련된 클래스입니다.
translation	다른 언어로 음성 번역과 관련된 클래스입니다.
version	Python용 Microsoft Speech SDK

클래스

AudioDataStream	오디오 데이터를 스트림으로 작동하는 데 사용되는 오디오 데이터 스트림을 나타냅니다. 음성 합성 결과(SpeechSynthesisResult 형식) 또는 키워드(keyword) 인식 결과(KeywordRecognitionResult 형식)에서 오디오 데이터 스트림을 생성합니다.
AutoDetectSourceLanguageResult	자동 검색 원본 언어 결과를 나타냅니다. 결과는 음성 인식 결과에서 초기화할 수 있습니다.
CancellationDetails	Python용 Microsoft Speech SDK
Connection	지정된 Recognizer의 음성 서비스에 대한 연결을 관리하기 위한 프록시 클래스입니다. 기본적으로 는 Recognizer 필요할 때 서비스에 대한 연결을 자율적으로 관리합니다. 클래스는 Connection 사용자가 명시적으로 연결을 열거나 닫고 연결 상태 변경 내용을 구독하는 추가 메서드를 제공합니다. Connection 사용은 선택 사항입니다. 연결 상태 따라 애플리케이션 동작을 미세 조정해야 하는 시나리오를 위한 것입니다. 사용자는 필요에 따라 를 호출 open 하여 이 Connection와 연결된 에서 Recognizer 인식을 시작하기 전에 서비스 연결을 수동으로 시작할 수 있습니다. 인식을 시작한 후 또는 close 를 호출 open 하지 못할 수 있습니다. 이는 Recognizer 또는 지속적인 인식에 영향을 주지 않습니다. 여러 가지 이유로 인해 연결이 끊어질 수 있습니다. Recognizer는 항상 지속적인 작업을 보장하기 위해 필요에 따라 연결을 다시 구성하려고 합니다. 이러한 모든 경우 connected/disconnected 이벤트는 연결 상태 변경을 나타냅니다. 참고 버전 1.17.0에서 업데이트되었습니다. 내부용 생성자입니다.
ConnectionEventArgs	ConnectionEvent에 대한 데이터를 제공합니다. 참고 버전 1.2.0에 추가됨 내부용 생성자입니다.
EventSignal	클라이언트는 이벤트 신호에 연결하여 이벤트를 수신하거나 이벤트 신호에서 연결을 끊어 이벤트 수신을 중지할 수 있습니다. 내부용 생성자입니다.
KeywordRecognitionEventArgs	키워드(keyword) 인식 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다.
KeywordRecognitionModel	키워드(keyword) 인식 모델을 나타냅니다.
KeywordRecognitionResult	키워드(keyword) 인식 작업의 결과입니다. 내부용 생성자입니다.
KeywordRecognizer	키워드(keyword) 인식기입니다.
NoMatchDetails	Python용 Microsoft Speech SDK
PhraseListGrammar	음성 인식에 도움이 되는 구 힌트를 런타임에 추가할 수 있는 클래스입니다. 인식기에서 추가된 구는 다음 인식이 시작될 때 또는 다음에 음성 인식기가 음성 서비스에 다시 연결해야 할 때 유효합니다. 참고 버전 1.5.0에 추가되었습니다. 내부용 생성자입니다.
PronunciationAssessmentConfig	발음 평가 구성을 나타냅니다. 참고 버전 1.14.0에 추가되었습니다. 구성은 다음 두 가지 방법으로 초기화할 수 있습니다. 매개 변수에서: 참조 텍스트, 채점 시스템, 세분성을 전달하고, 오차 및 시나리오 ID를 사용하도록 설정합니다. from json: json 문자열 전달 매개 변수 세부 정보는 다음을 참조하세요. https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters
PronunciationAssessmentPhonemeResult	음소 수준 발음 평가 결과를 포함합니다. 참고 버전 1.14.0에 추가되었습니다.
PronunciationAssessmentResult	발음 평가 결과를 나타냅니다. 참고 버전 1.14.0에 추가되었습니다. 결과는 음성 인식 결과에서 초기화할 수 있습니다.
PronunciationAssessmentWordResult	단어 수준 발음 평가 결과를 포함합니다. 참고 버전 1.14.0에 추가되었습니다.
PropertyCollection	속성 컬렉션에서 속성 값을 검색하거나 설정하는 클래스입니다.
RecognitionEventArgs	RecognitionEvent에 대한 데이터를 제공합니다. 내부용 생성자입니다.
RecognitionResult	인식 작업의 결과에 대한 자세한 정보입니다. 내부용 생성자입니다.
Recognizer	다른 인식자에 대한 기본 클래스
ResultFuture	비동기 작업의 결과입니다. private 생성자
SessionEventArgs	세션 이벤트 인수에 대한 기본 클래스입니다. 내부용 생성자입니다.
SourceLanguageRecognizer	원본 언어 인식기 - 독립 실행형 언어 인식기를 단일 언어 또는 연속 언어 감지에 사용할 수 있습니다. 참고 버전 1.18.0에 추가되었습니다.
SpeechConfig	음성/의도 인식 및 음성 합성에 대한 구성을 정의하는 클래스입니다. 구성은 다음과 같은 다양한 방법으로 초기화할 수 있습니다. 구독에서: 구독 키 및 지역 전달 엔드포인트에서: 엔드포인트를 전달합니다. 구독 키 또는 권한 부여 토큰은 선택 사항입니다. 호스트에서: 호스트 주소를 전달합니다. 구독 키 또는 권한 부여 토큰은 선택 사항입니다. 권한 부여 토큰에서: 권한 부여 토큰 및 지역 전달
SpeechRecognitionCanceledEventArgs	음성 인식 취소된 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다.
SpeechRecognitionEventArgs	음성 인식 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다.
SpeechRecognitionResult	음성 인식 결과에 대한 기본 클래스입니다. 내부용 생성자입니다.
SpeechRecognizer	음성 인식기입니다. 원본 언어 정보를 지정해야 하는 경우 언어, source_language_config 또는 auto_detect_source_language_config 세 가지 매개 변수 중 하나만 지정하세요.
SpeechSynthesisBookmarkEventArgs	음성 합성 책갈피 이벤트 인수에 대한 클래스입니다. 참고 버전 1.16.0에 추가되었습니다. 내부용 생성자입니다.
SpeechSynthesisCancellationDetails	결과가 취소된 이유에 대한 자세한 정보를 포함합니다.
SpeechSynthesisEventArgs	음성 합성 이벤트 인수에 대한 클래스입니다. 내부용 생성자입니다.
SpeechSynthesisResult	음성 합성 작업의 결과입니다. 내부용 생성자입니다.
SpeechSynthesisVisemeEventArgs	음성 합성 viseme 이벤트 인수에 대한 클래스입니다. 참고 버전 1.16.0에 추가되었습니다. 내부용 생성자입니다.
SpeechSynthesisWordBoundaryEventArgs	음성 합성 단어 경계 이벤트 인수에 대한 클래스입니다. 참고 버전 1.21.0에서 업데이트되었습니다. 내부용 생성자입니다.
SpeechSynthesizer	음성 신시사이저입니다.
SyllableLevelTimingResult	음절 수준 타이밍 결과를 포함합니다. 참고 버전 1.20.0에 추가되었습니다.
SynthesisVoicesResult	검색된 합성 음성 목록에 대한 자세한 정보를 포함합니다. 참고 버전 1.16.0에 추가되었습니다. 내부용 생성자입니다.
VoiceInfo	합성 음성 정보에 대한 자세한 정보를 포함합니다. 참고 버전 1.17.0에서 업데이트되었습니다. 내부용 생성자입니다.

열거형

AudioStreamContainerFormat	지원되는 오디오 스트림 컨테이너 형식을 정의합니다.
AudioStreamWaveFormat	WAV 컨테이너 내에 지정된 형식을 나타냅니다.
CancellationErrorCode	CancellationReason이 Error인 경우 오류 코드를 정의합니다.
CancellationReason	인식 결과가 취소될 수 있는 가능한 이유를 정의합니다.
NoMatchReason	인식 결과가 인식되지 않을 수 있는 가능한 이유를 정의합니다.
OutputFormat	출력 형식입니다.
ProfanityOption	욕설(욕설)을 제거하거나 불경한 단어의 문자를 별으로 대체합니다.
PronunciationAssessmentGradingSystem	발음 점수 보정을 위한 점 시스템을 정의합니다. 기본값은 FivePoint입니다.
PronunciationAssessmentGranularity	발음 평가 세분성을 정의합니다. 기본값은 Phoneme입니다.
PropertyId	음성 속성 ID를 정의합니다.
ResultReason	인식 결과가 생성될 수 있는 가능한 이유를 지정합니다.
ServicePropertyChannel	속성 설정을 서비스에 전달하는 데 사용되는 채널을 정의합니다.
SpeechSynthesisOutputFormat	가능한 음성 합성 출력 오디오 형식을 정의합니다.
StreamStatus	오디오 데이터 스트림의 가능한 상태 정의합니다.
SynthesisVoiceGender	합성 음성의 성별을 정의합니다.
SynthesisVoiceType	합성 음성의 유형을 정의합니다.

다음을 통해 공유

speech 패키지

모듈

클래스

열거형

추가 리소스