다음을 통해 공유


speech 패키지

Python용 Microsoft Speech SDK

모듈

audio

다양한 인식기에 대한 오디오 입력 처리 및 음성 신시사이저의 오디오 출력과 관련된 클래스입니다.

dialog

대화 상자 서비스 커넥터와 관련된 클래스입니다.

enums

Python용 Microsoft Speech SDK

intent

음성의 의도 인식과 관련된 클래스입니다.

interop

Python용 Microsoft Speech SDK

languageconfig

언어 구성 처리와 관련된 클래스

properties

Python용 Microsoft Speech SDK

speech

음성에서 텍스트 인식, 텍스트에서 음성 합성 및 다양한 인식기에서 사용되는 일반 클래스와 관련된 클래스입니다.

transcription

대화 기록과 관련된 클래스입니다.

translation

다른 언어로 음성 번역과 관련된 클래스입니다.

version

Python용 Microsoft Speech SDK

클래스

AudioDataStream

오디오 데이터를 스트림으로 작동하는 데 사용되는 오디오 데이터 스트림을 나타냅니다.

음성 합성 결과(SpeechSynthesisResult 형식) 또는 키워드(keyword) 인식 결과(KeywordRecognitionResult 형식)에서 오디오 데이터 스트림을 생성합니다.

AutoDetectSourceLanguageResult

자동 검색 원본 언어 결과를 나타냅니다.

결과는 음성 인식 결과에서 초기화할 수 있습니다.

CancellationDetails

Python용 Microsoft Speech SDK

Connection

지정된 Recognizer의 음성 서비스에 대한 연결을 관리하기 위한 프록시 클래스입니다.

기본적으로 는 Recognizer 필요할 때 서비스에 대한 연결을 자율적으로 관리합니다. 클래스는 Connection 사용자가 명시적으로 연결을 열거나 닫고 연결 상태 변경 내용을 구독하는 추가 메서드를 제공합니다. Connection 사용은 선택 사항입니다. 연결 상태 따라 애플리케이션 동작을 미세 조정해야 하는 시나리오를 위한 것입니다. 사용자는 필요에 따라 를 호출 open 하여 이 Connection와 연결된 에서 Recognizer 인식을 시작하기 전에 서비스 연결을 수동으로 시작할 수 있습니다. 인식을 시작한 후 또는 close 를 호출 open 하지 못할 수 있습니다. 이는 Recognizer 또는 지속적인 인식에 영향을 주지 않습니다. 여러 가지 이유로 인해 연결이 끊어질 수 있습니다. Recognizer는 항상 지속적인 작업을 보장하기 위해 필요에 따라 연결을 다시 구성하려고 합니다. 이러한 모든 경우 connected/disconnected 이벤트는 연결 상태 변경을 나타냅니다.

참고

버전 1.17.0에서 업데이트되었습니다.

내부용 생성자입니다.

ConnectionEventArgs

ConnectionEvent에 대한 데이터를 제공합니다.

참고

버전 1.2.0에 추가됨

내부용 생성자입니다.

EventSignal

클라이언트는 이벤트 신호에 연결하여 이벤트를 수신하거나 이벤트 신호에서 연결을 끊어 이벤트 수신을 중지할 수 있습니다.

내부용 생성자입니다.

KeywordRecognitionEventArgs

키워드(keyword) 인식 이벤트 인수에 대한 클래스입니다.

내부용 생성자입니다.

KeywordRecognitionModel

키워드(keyword) 인식 모델을 나타냅니다.

KeywordRecognitionResult

키워드(keyword) 인식 작업의 결과입니다.

내부용 생성자입니다.

KeywordRecognizer

키워드(keyword) 인식기입니다.

NoMatchDetails

Python용 Microsoft Speech SDK

PhraseListGrammar

음성 인식에 도움이 되는 구 힌트를 런타임에 추가할 수 있는 클래스입니다.

인식기에서 추가된 구는 다음 인식이 시작될 때 또는 다음에 음성 인식기가 음성 서비스에 다시 연결해야 할 때 유효합니다.

참고

버전 1.5.0에 추가되었습니다.

내부용 생성자입니다.

PronunciationAssessmentConfig

발음 평가 구성을 나타냅니다.

참고

버전 1.14.0에 추가되었습니다.

구성은 다음 두 가지 방법으로 초기화할 수 있습니다.

  • 매개 변수에서: 참조 텍스트, 채점 시스템, 세분성을 전달하고, 오차 및 시나리오 ID를 사용하도록 설정합니다.

  • from json: json 문자열 전달

매개 변수 세부 정보는 다음을 참조하세요. https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters

PronunciationAssessmentPhonemeResult

음소 수준 발음 평가 결과를 포함합니다.

참고

버전 1.14.0에 추가되었습니다.

PronunciationAssessmentResult

발음 평가 결과를 나타냅니다.

참고

버전 1.14.0에 추가되었습니다.

결과는 음성 인식 결과에서 초기화할 수 있습니다.

PronunciationAssessmentWordResult

단어 수준 발음 평가 결과를 포함합니다.

참고

버전 1.14.0에 추가되었습니다.

PropertyCollection

속성 컬렉션에서 속성 값을 검색하거나 설정하는 클래스입니다.

RecognitionEventArgs

RecognitionEvent에 대한 데이터를 제공합니다.

내부용 생성자입니다.

RecognitionResult

인식 작업의 결과에 대한 자세한 정보입니다.

내부용 생성자입니다.

Recognizer

다른 인식자에 대한 기본 클래스

ResultFuture

비동기 작업의 결과입니다.

private 생성자

SessionEventArgs

세션 이벤트 인수에 대한 기본 클래스입니다.

내부용 생성자입니다.

SourceLanguageRecognizer

원본 언어 인식기 - 독립 실행형 언어 인식기를 단일 언어 또는 연속 언어 감지에 사용할 수 있습니다.

참고

버전 1.18.0에 추가되었습니다.

SpeechConfig

음성/의도 인식 및 음성 합성에 대한 구성을 정의하는 클래스입니다.

구성은 다음과 같은 다양한 방법으로 초기화할 수 있습니다.

  • 구독에서: 구독 키 및 지역 전달

  • 엔드포인트에서: 엔드포인트를 전달합니다. 구독 키 또는 권한 부여 토큰은 선택 사항입니다.

  • 호스트에서: 호스트 주소를 전달합니다. 구독 키 또는 권한 부여 토큰은 선택 사항입니다.

  • 권한 부여 토큰에서: 권한 부여 토큰 및 지역 전달

SpeechRecognitionCanceledEventArgs

음성 인식 취소된 이벤트 인수에 대한 클래스입니다.

내부용 생성자입니다.

SpeechRecognitionEventArgs

음성 인식 이벤트 인수에 대한 클래스입니다.

내부용 생성자입니다.

SpeechRecognitionResult

음성 인식 결과에 대한 기본 클래스입니다.

내부용 생성자입니다.

SpeechRecognizer

음성 인식기입니다. 원본 언어 정보를 지정해야 하는 경우 언어, source_language_config 또는 auto_detect_source_language_config 세 가지 매개 변수 중 하나만 지정하세요.

SpeechSynthesisBookmarkEventArgs

음성 합성 책갈피 이벤트 인수에 대한 클래스입니다.

참고

버전 1.16.0에 추가되었습니다.

내부용 생성자입니다.

SpeechSynthesisCancellationDetails

결과가 취소된 이유에 대한 자세한 정보를 포함합니다.

SpeechSynthesisEventArgs

음성 합성 이벤트 인수에 대한 클래스입니다.

내부용 생성자입니다.

SpeechSynthesisResult

음성 합성 작업의 결과입니다.

내부용 생성자입니다.

SpeechSynthesisVisemeEventArgs

음성 합성 viseme 이벤트 인수에 대한 클래스입니다.

참고

버전 1.16.0에 추가되었습니다.

내부용 생성자입니다.

SpeechSynthesisWordBoundaryEventArgs

음성 합성 단어 경계 이벤트 인수에 대한 클래스입니다.

참고

버전 1.21.0에서 업데이트되었습니다.

내부용 생성자입니다.

SpeechSynthesizer

음성 신시사이저입니다.

SyllableLevelTimingResult

음절 수준 타이밍 결과를 포함합니다.

참고

버전 1.20.0에 추가되었습니다.

SynthesisVoicesResult

검색된 합성 음성 목록에 대한 자세한 정보를 포함합니다.

참고

버전 1.16.0에 추가되었습니다.

내부용 생성자입니다.

VoiceInfo

합성 음성 정보에 대한 자세한 정보를 포함합니다.

참고

버전 1.17.0에서 업데이트되었습니다.

내부용 생성자입니다.

열거형

AudioStreamContainerFormat

지원되는 오디오 스트림 컨테이너 형식을 정의합니다.

AudioStreamWaveFormat

WAV 컨테이너 내에 지정된 형식을 나타냅니다.

CancellationErrorCode

CancellationReason이 Error인 경우 오류 코드를 정의합니다.

CancellationReason

인식 결과가 취소될 수 있는 가능한 이유를 정의합니다.

NoMatchReason

인식 결과가 인식되지 않을 수 있는 가능한 이유를 정의합니다.

OutputFormat

출력 형식입니다.

ProfanityOption

욕설(욕설)을 제거하거나 불경한 단어의 문자를 별으로 대체합니다.

PronunciationAssessmentGradingSystem

발음 점수 보정을 위한 점 시스템을 정의합니다. 기본값은 FivePoint입니다.

PronunciationAssessmentGranularity

발음 평가 세분성을 정의합니다. 기본값은 Phoneme입니다.

PropertyId

음성 속성 ID를 정의합니다.

ResultReason

인식 결과가 생성될 수 있는 가능한 이유를 지정합니다.

ServicePropertyChannel

속성 설정을 서비스에 전달하는 데 사용되는 채널을 정의합니다.

SpeechSynthesisOutputFormat

가능한 음성 합성 출력 오디오 형식을 정의합니다.

StreamStatus

오디오 데이터 스트림의 가능한 상태 정의합니다.

SynthesisVoiceGender

합성 음성의 성별을 정의합니다.

SynthesisVoiceType

합성 음성의 유형을 정의합니다.