microsoft-cognitiveservices-speech-sdk package

클래스

ActivityReceivedEventArgs	받은 메시지/이벤트의 콘텐츠를 정의합니다.
AudioConfig	사용할 입력 유형(마이크, 파일, 스트림)을 지정하는 데 사용되는 오디오 입력 구성을 나타냅니다.
AudioInputStream	사용자 지정 오디오 입력 구성에 사용되는 오디오 입력 스트림을 나타냅니다.
AudioOutputStream	사용자 지정 오디오 출력 구성에 사용되는 오디오 출력 스트림을 나타냅니다.
AudioStreamFormat	사용자 지정 오디오 입력 구성에 사용되는 오디오 스트림 형식을 나타냅니다.
AutoDetectSourceLanguageConfig	언어 자동 검색 구성
AutoDetectSourceLanguageResult	출력 형식
AvatarConfig	말하는 아바타 구성을 정의합니다.
AvatarEventArgs	아바타 이벤트를 말하기 위한 콘텐츠를 정의합니다.
AvatarSceneConfig	아바타 위치와 방향을 제어하는 아바타 씬 구성을 정의합니다.
AvatarSynthesizer	아바타 신시사이저를 정의합니다.
AvatarVideoFormat	아바타 출력 비디오 형식을 정의합니다.
AvatarWebRTCConnectionResult	아바타 WebRTC 연결 결과를 정의합니다.
BaseAudioPlayer	기본 오디오 플레이어 클래스 TODO: 지금은 PCM만 재생합니다.
BotFrameworkConfig	Bot Framework 백 엔드를 사용하기 위한 대화 상자 서비스 커넥터 개체에 대한 구성을 정의하는 클래스입니다.
CancellationDetails	결과가 취소된 이유에 대한 자세한 정보를 포함합니다.
CancellationDetailsBase	결과가 취소된 이유에 대한 자세한 정보를 포함합니다.
Connection	연결은 지정된 Recognizer의 음성 서비스에 대한 연결을 관리하기 위한 프록시 클래스입니다. 기본적으로 Recognizer는 필요할 때 서비스에 대한 연결을 자율적으로 관리합니다. Connection 클래스는 사용자가 연결을 명시적으로 열거나 닫고 연결 상태 변경을 구독하는 추가 메서드를 제공합니다. 연결 사용은 선택 사항이며, 주로 연결 상태에 따라 애플리케이션 동작을 미세 조정해야 하는 시나리오를 위한 것입니다. 사용자는 선택적으로 Open()을 호출하여 이 연결과 연결된 인식기에서 인식을 시작하기 전에 사전에 연결을 수동으로 설정할 수 있습니다. Recognizer가 서비스에 연결하거나 연결을 끊어야 하는 경우 연결을 독립적으로 설정하거나 종료합니다. 이 경우 연결/연결 끊김 이벤트를 통해 연결 상태를 변경하여 연결 알림을 받습니다. 버전 1.2.1에 추가되었습니다.
ConnectionEventArgs	연결/연결 끊김과 같은 연결 이벤트에 대한 페이로드를 정의합니다. 버전 1.2.0에 추가됨
ConnectionMessage	ConnectionMessage는 음성 서비스에서 보내고 받은 특정 메시지 구현을 나타냅니다. 이러한 메시지는 디버깅을 위해 제공되며 Azure Cognitive Services Speech Service의 프로덕션 사용 사례에 사용해서는 안 됩니다. Speech Service에서 보내고 받은 메시지는 예고 없이 변경될 수 있습니다. 여기에는 메시지 내용, 헤더, 페이로드, 순서 지정 등이 포함됩니다. 버전 1.11.0에 추가되었습니다.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다.
ConversationParticipantsChangedEventArgs	SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다.
ConversationTranscriber	마이크, 파일 또는 기타 오디오 입력 스트림에서 스피커 분리를 사용하여 음성 인식을 수행하고 그 결과로 전사된 텍스트를 가져옵니다.
ConversationTranscriptionCanceledEventArgs	RecognitionErrorEvent의 콘텐츠를 정의합니다.
ConversationTranscriptionEventArgs	대화 전사/전사 이벤트의 콘텐츠를 정의합니다.
ConversationTranscriptionResult	대화 전사의 결과를 정의합니다.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	Speech Start/End Detected와 같은 세션 이벤트에 대한 페이로드를 정의합니다.
ConversationTranslationResult	번역 텍스트 결과입니다.
ConversationTranslator	대화에 참가, 나가거나 대화에 연결합니다.
Coordinate	2D 공간에서 좌표를 정의합니다.
CustomCommandsConfig	CustomCommands 백 엔드를 사용하기 위한 대화 상자 서비스 커넥터 개체에 대한 구성을 정의하는 클래스입니다.
Diagnostics	버전 1.21.0에 추가된 콘솔 출력을 관리하기 위한 진단 API 정의
DialogServiceConfig	대화 상자 서비스 커넥터에 대한 기본 구성을 정의하는 클래스
DialogServiceConnector	대화 상자 서비스 커넥터
KeywordRecognitionModel	사용자가 추가 음성 인식을 시작하기 위해 키워드를 말하는 경우를 인식하기 위한 키워드 인식 모델을 나타냅니다.
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	MeetingTranscriptionCanceledEvent의 콘텐츠를 정의합니다.
MeetingTranscriptionEventArgs	모임 전사/전사 이벤트의 콘텐츠를 정의합니다.
NoMatchDetails	NoMatch 인식 결과에 대한 자세한 정보를 포함합니다.
Participant	대화의 참가자를 나타냅니다. 버전 1.4.0에 추가됨
PhraseListGrammar	음성 인식을 개선하기 위해 새 구를 추가할 수 있습니다. 인식기에서 추가된 구는 다음 인식이 시작될 때 또는 다음에 SpeechSDK가 음성 서비스에 다시 연결해야 할 때 유효합니다.
PronunciationAssessmentConfig	발음 평가 구성입니다.
PronunciationAssessmentResult	발음 평가 결과입니다.
PropertyCollection	속성 및 해당 값의 컬렉션을 나타냅니다.
PullAudioInputStream	사용자 지정 오디오 입력 구성에 사용되는 오디오 입력 스트림을 나타냅니다.
PullAudioInputStreamCallback	사용자 지정 오디오 입력 스트림에 대한 콜백 메서드(read() 및 close())를 정의하는 추상 기본 클래스입니다.
PullAudioOutputStream	사용자 지정 오디오 출력 구성에 사용되는 메모리 지원 푸시 오디오 출력 스트림을 나타냅니다.
PushAudioInputStream	사용자 지정 오디오 입력 구성에 사용되는 메모리 지원 푸시 오디오 입력 스트림을 나타냅니다.
PushAudioOutputStream	사용자 지정 오디오 출력 구성에 사용되는 오디오 출력 스트림을 나타냅니다.
PushAudioOutputStreamCallback	사용자 지정 오디오 출력 스트림에 대한 콜백 메서드(write() 및 close())를 정의하는 추상 기본 클래스입니다.
RecognitionEventArgs	Speech Start/End Detected와 같은 세션 이벤트에 대한 페이로드를 정의합니다.
RecognitionResult	음성 인식의 결과를 정의합니다.
Recognizer	주로 공통 이벤트 처리기를 포함하는 기본 클래스 Recognizer를 정의합니다.
ServiceEventArgs	버전 1.9.0에 추가된 모든 서비스 메시지 이벤트에 대한 페이로드를 정의합니다.
SessionEventArgs	SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다.
SourceLanguageConfig	원본 언어 구성.
SpeakerAudioDestination	브라우저에서만 작동하는 스피커 재생 오디오 대상을 나타냅니다. 참고: SDK는 미디어 소스 확장 사용하여 오디오를 재생하려고 합니다. Mp3 형식은 Microsoft Edge, Chrome 및 Safari(데스크톱)에서 더 잘 지원되므로 재생을 위해 mp3 형식을 지정하는 것이 좋습니다.
SpeechConfig	음성 구성.
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	음성 인식/인식 이벤트의 콘텐츠를 정의합니다.
SpeechRecognitionResult	음성 인식의 결과를 정의합니다.
SpeechRecognizer	마이크, 파일 또는 기타 오디오 입력 스트림에서 음성 인식을 수행하고 그 결과로 전사된 텍스트를 가져옵니다.
SpeechSynthesisBookmarkEventArgs	음성 합성 책갈피 이벤트의 콘텐츠를 정의합니다.
SpeechSynthesisEventArgs	음성 합성 이벤트의 콘텐츠를 정의합니다.
SpeechSynthesisResult	음성 합성의 결과를 정의합니다.
SpeechSynthesisVisemeEventArgs	음성 합성 viseme 이벤트의 콘텐츠를 정의합니다.
SpeechSynthesisWordBoundaryEventArgs	음성 합성 단어 경계 이벤트의 내용을 정의합니다.
SpeechSynthesizer	텍스트 음성 변환에 대한 SpeechSynthesizer 클래스를 정의합니다. 버전 1.16.0에서 업데이트됨
SpeechTranslationConfig	음성 번역 구성.
SynthesisResult	합성 결과에 대한 기본 클래스
SynthesisVoicesResult	음성 합성의 결과를 정의합니다.
Synthesizer
TranslationRecognitionCanceledEventArgs	음성 인식 취소된 결과 이벤트의 페이로드를 정의합니다.
TranslationRecognitionEventArgs	번역 텍스트 결과 이벤트 인수입니다.
TranslationRecognitionResult	번역 텍스트 결과입니다.
TranslationRecognizer	번역 인식기
TranslationSynthesisEventArgs	Translation Synthesis 이벤트 인수
TranslationSynthesisResult	번역 합성 결과, 즉 대상 언어로 번역된 텍스트의 음성 출력을 정의합니다.
Translations	매개 변수 및 해당 값의 컬렉션을 나타냅니다.
TurnStatusReceivedEventArgs	받은 메시지/이벤트의 콘텐츠를 정의합니다.
User
VoiceInfo	버전 1.20.0에 추가된 Speech Synthesis 음성에 대한 정보입니다.

인터페이스

CancellationEventArgs
ConversationInfo
IParticipant	대화의 참가자를 나타냅니다. 버전 1.4.0에 추가됨
IPlayer	일시 중지, 다시 시작 등과 같은 오디오 재생을 제어하는 오디오 플레이어 인터페이스를 나타냅니다.
IVoiceJson
MeetingInfo
VoiceSignature

열거형

AudioFormatTag
CancellationErrorCode	CancellationReason이 오류인 경우 오류 코드를 정의합니다. 버전 1.1.0에 추가되었습니다.
CancellationReason	인식 결과가 취소될 수 있는 가능한 이유를 정의합니다.
LanguageIdMode	언어 식별 모드
LogLevel
NoMatchReason	인식 결과가 인식되지 않을 수 있는 가능한 이유를 정의합니다.
OutputFormat	Speech Recognizer 출력 형식을 정의합니다.
ParticipantChangedReason
ProfanityOption	욕설 옵션입니다. 버전 1.7.0에 추가되었습니다.
PronunciationAssessmentGradingSystem	발음 점수 보정을 위한 점 시스템을 정의합니다. 기본값은 FivePoint입니다. 버전 1.15.0에 추가됨
PronunciationAssessmentGranularity	발음 평가 세분성을 정의합니다. 기본값은 Phoneme입니다. 버전 1.15.0에 추가됨
PropertyId	음성 속성 ID를 정의합니다.
ResultReason	인식 결과가 생성될 수 있는 이유를 정의합니다.
ServicePropertyChannel	속성 설정을 서비스에 전달하는 데 사용되는 채널을 정의합니다. 버전 1.7.0에 추가되었습니다.
SpeechSynthesisBoundaryType	음성 합성 경계 이벤트의 경계 유형을 정의합니다.
SpeechSynthesisOutputFormat	음성 합성 오디오 출력 형식을 정의합니다. SpeechSynthesisOutputFormat 버전 1.17.0에서 업데이트됨
SynthesisVoiceGender	합성 음성의 성별을 정의합니다. 버전 1.20.0에 추가되었습니다.
SynthesisVoiceType

다음을 통해 공유

microsoft-cognitiveservices-speech-sdk package

클래스

인터페이스

열거형