다음을 통해 공유


microsoft-cognitiveservices-speech-sdk package

클래스

ActivityReceivedEventArgs

받은 메시지/이벤트의 콘텐츠를 정의합니다.

AudioConfig

사용할 입력 유형(마이크, 파일, 스트림)을 지정하는 데 사용되는 오디오 입력 구성을 나타냅니다.

AudioInputStream

사용자 지정 오디오 입력 구성에 사용되는 오디오 입력 스트림을 나타냅니다.

AudioOutputStream

사용자 지정 오디오 출력 구성에 사용되는 오디오 출력 스트림을 나타냅니다.

AudioStreamFormat

사용자 지정 오디오 입력 구성에 사용되는 오디오 스트림 형식을 나타냅니다.

AutoDetectSourceLanguageConfig

언어 자동 검색 구성.

AutoDetectSourceLanguageResult

출력 형식

AvatarConfig

말하는 아바타 구성을 정의합니다.

AvatarEventArgs

아바타 이벤트를 말하기 위한 콘텐츠를 정의합니다.

AvatarSynthesizer

아바타 신시사이저를 정의합니다.

AvatarVideoFormat

아바타 출력 비디오 형식을 정의합니다.

AvatarWebRTCConnectionResult

아바타 WebRTC 연결 결과를 정의합니다.

BaseAudioPlayer

기본 오디오 플레이어 클래스 TODO: 지금은 PCM만 재생합니다.

BotFrameworkConfig

Bot Framework 백 엔드를 사용하기 위한 대화 서비스 커넥터 개체에 대한 구성을 정의하는 클래스입니다.

CancellationDetails

결과가 취소된 이유에 대한 자세한 정보를 포함합니다.

CancellationDetailsBase

결과가 취소된 이유에 대한 자세한 정보를 포함합니다.

Connection

Connection은 지정된 Recognizer의 음성 서비스에 대한 연결을 관리하기 위한 프록시 클래스입니다. 기본적으로 Recognizer는 필요할 때 서비스에 대한 연결을 자율적으로 관리합니다. Connection 클래스는 사용자가 명시적으로 연결을 열거나 닫고 연결 상태 변경 내용을 구독하는 추가 메서드를 제공합니다. 연결 사용은 선택 사항이며, 주로 연결 상태 따라 애플리케이션 동작을 미세 조정해야 하는 시나리오에 사용합니다. 사용자는 필요에 따라 Open()을 호출하여 이 연결과 연결된 인식기에서 인식을 시작하기 전에 사전에 연결을 수동으로 설정할 수 있습니다. Recognizer가 서비스에 연결하거나 연결을 끊어야 하는 경우 연결을 독립적으로 설정하거나 종료합니다. 이 경우 연결/연결 끊김 이벤트를 통해 연결 상태 변경하여 연결이 알림을 받습니다. 버전 1.2.1에 추가되었습니다.

ConnectionEventArgs

연결/연결 끊김과 같은 연결 이벤트에 대한 페이로드를 정의합니다. 버전 1.2.0에 추가됨

ConnectionMessage

ConnectionMessage는 음성 서비스에서 보내고 받은 특정 메시지 구현을 나타냅니다. 이러한 메시지는 디버깅을 위해 제공되며 Azure Cognitive Services Speech Service의 프로덕션 사용 사례에 사용하면 안 됩니다. Speech Service에서 보내고 받은 메시지는 예고 없이 변경될 수 있습니다. 여기에는 메시지 내용, 헤더, 페이로드, 주문 등이 포함됩니다. 버전 1.11.0에 추가되었습니다.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다.

ConversationParticipantsChangedEventArgs

SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다.

ConversationTranscriber

마이크, 파일 또는 기타 오디오 입력 스트림에서 스피커 분리를 사용하여 음성 인식을 수행하고 그 결과로 전사된 텍스트를 가져옵니다.

ConversationTranscriptionCanceledEventArgs

RecognitionErrorEvent의 콘텐츠를 정의합니다.

ConversationTranscriptionEventArgs

대화 전사/전사 이벤트의 콘텐츠를 정의합니다.

ConversationTranscriptionResult

대화 전사의 결과를 정의합니다.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Speech Start/End Detected와 같은 세션 이벤트에 대한 페이로드를 정의합니다.

ConversationTranslationResult

번역 텍스트 결과입니다.

ConversationTranslator

대화에 참가하거나, 나가거나, 대화에 연결합니다.

Coordinate

2D 공간에서 좌표를 정의합니다.

CustomCommandsConfig

CustomCommands 백 엔드를 사용하기 위한 대화 서비스 커넥터 개체에 대한 구성을 정의하는 클래스입니다.

Diagnostics

버전 1.21.0에 추가된 콘솔 출력을 관리하기 위한 진단 API를 정의합니다.

DialogServiceConfig

대화 서비스 커넥터에 대한 기본 구성을 정의하는 클래스

DialogServiceConnector

대화 상자 서비스 커넥터

IntentRecognitionCanceledEventArgs

의도 인식 취소된 결과 이벤트의 페이로드를 정의합니다.

IntentRecognitionEventArgs

의도 인식 결과 이벤트 인수입니다.

IntentRecognitionResult

의도 인식 결과입니다.

IntentRecognizer

의도 인식기.

KeywordRecognitionModel

사용자가 추가 음성 인식을 시작하는 키워드(keyword) 말하는 경우를 인식하기 위한 키워드(keyword) 인식 모델을 나타냅니다.

LanguageUnderstandingModel

언어 이해 모델

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

MeetingTranscriptionCanceledEvent의 콘텐츠를 정의합니다.

MeetingTranscriptionEventArgs

모임 전사/전사 이벤트의 콘텐츠를 정의합니다.

NoMatchDetails

NoMatch 인식 결과에 대한 자세한 정보를 포함합니다.

Participant

대화의 참가자를 나타냅니다. 버전 1.4.0에 추가됨

PhraseListGrammar

음성 인식을 개선하기 위해 새 구를 추가할 수 있습니다.

인식기에서 추가된 구는 다음 인식이 시작될 때 또는 다음에 SpeechSDK가 음성 서비스에 다시 연결해야 할 때 유효합니다.

PronunciationAssessmentConfig

발음 평가 구성.

PronunciationAssessmentResult

발음 평가 결과입니다.

PropertyCollection

속성 및 해당 값의 컬렉션을 나타냅니다.

PullAudioInputStream

사용자 지정 오디오 입력 구성에 사용되는 오디오 입력 스트림을 나타냅니다.

PullAudioInputStreamCallback

사용자 지정 오디오 입력 스트림에 대한 콜백 메서드(read() 및 close()))를 정의하는 추상 기본 클래스입니다.

PullAudioOutputStream

사용자 지정 오디오 출력 구성에 사용되는 메모리 백업 푸시 오디오 출력 스트림을 나타냅니다.

PushAudioInputStream

사용자 지정 오디오 입력 구성에 사용되는 메모리 백업 푸시 오디오 입력 스트림을 나타냅니다.

PushAudioOutputStream

사용자 지정 오디오 출력 구성에 사용되는 오디오 출력 스트림을 나타냅니다.

PushAudioOutputStreamCallback

사용자 지정 오디오 출력 스트림에 대한 콜백 메서드(write() 및 close()))를 정의하는 추상 기본 클래스입니다.

RecognitionEventArgs

Speech Start/End Detected와 같은 세션 이벤트에 대한 페이로드를 정의합니다.

RecognitionResult

음성 인식의 결과를 정의합니다.

Recognizer

주로 일반적인 이벤트 처리기를 포함하는 기본 클래스 Recognizer를 정의합니다.

ServiceEventArgs

버전 1.9.0에 추가된 모든 서비스 메시지 이벤트에 대한 페이로드를 정의합니다.

SessionEventArgs

SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다.

SourceLanguageConfig

원본 언어 구성.

SpeakerAudioDestination

브라우저에서만 작동하는 스피커 재생 오디오 대상을 나타냅니다. 참고: SDK는 미디어 소스 확장을 사용하여 오디오를 재생하려고 합니다. Mp3 형식은 Microsoft Edge, Chrome 및 Safari(데스크톱)에서 더 나은 지원을 제공합니다. 따라서 재생을 위해 mp3 형식을 지정하는 것이 좋습니다.

SpeakerIdentificationModel

Speaker Recognition Model에 대한 SpeakerIdentificationModel 클래스 정의 화자를 식별할 프로필 집합이 포함되어 있습니다.

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

출력 형식

SpeakerRecognizer

음성 프로필 작업(예: createProfile, deleteProfile)에 대한 사용자의 Speaker Recognition Handles 작업에 대한 SpeakerRecognizer 클래스를 정의합니다.

SpeakerVerificationModel

Speaker Recognition Model에 대한 SpeakerVerificationModel 클래스 정의 화자를 확인할 프로필이 포함되어 있습니다.

SpeechConfig

음성 구성.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

음성 인식/인식 이벤트의 콘텐츠를 정의합니다.

SpeechRecognitionResult

음성 인식의 결과를 정의합니다.

SpeechRecognizer

마이크, 파일 또는 기타 오디오 입력 스트림에서 음성 인식을 수행하고 그 결과로 전사된 텍스트를 가져옵니다.

SpeechSynthesisBookmarkEventArgs

음성 합성 책갈피 이벤트의 내용을 정의합니다.

SpeechSynthesisEventArgs

음성 합성 이벤트의 내용을 정의합니다.

SpeechSynthesisResult

음성 합성의 결과를 정의합니다.

SpeechSynthesisVisemeEventArgs

음성 합성 viseme 이벤트의 콘텐츠를 정의합니다.

SpeechSynthesisWordBoundaryEventArgs

음성 합성 단어 경계 이벤트의 내용을 정의합니다.

SpeechSynthesizer

텍스트 음성 변환에 대한 SpeechSynthesizer 클래스를 정의합니다. 버전 1.16.0에서 업데이트됨

SpeechTranslationConfig

음성 번역 구성.

SynthesisResult

합성 결과에 대한 기본 클래스

SynthesisVoicesResult

음성 합성의 결과를 정의합니다.

Synthesizer
TranslationRecognitionCanceledEventArgs

음성 인식 취소된 결과 이벤트의 페이로드를 정의합니다.

TranslationRecognitionEventArgs

번역 텍스트 결과 이벤트 인수입니다.

TranslationRecognitionResult

번역 텍스트 결과입니다.

TranslationRecognizer

번역 인식기

TranslationSynthesisEventArgs

Translation Synthesis 이벤트 인수

TranslationSynthesisResult

번역 합성 결과(예: 대상 언어로 번역된 텍스트의 음성 출력)를 정의합니다.

Translations

매개 변수 및 해당 값의 컬렉션을 나타냅니다.

TurnStatusReceivedEventArgs

받은 메시지/이벤트의 콘텐츠를 정의합니다.

User
VoiceInfo

버전 1.20.0에 추가된 음성 합성 음성에 대한 정보입니다.

VoiceProfile

Speaker Recognition에 대한 음성 프로필 클래스 정의

VoiceProfileCancellationDetails
VoiceProfileClient

음성 프로필 작업(예: createProfile, deleteProfile)에 대한 사용자의 Speaker Recognition Handles 작업에 대한 VoiceProfileClient 클래스를 정의합니다.

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

출력 형식

VoiceProfilePhraseResult

출력 형식

VoiceProfileResult

출력 형식

인터페이스

CancellationEventArgs
ConversationInfo
IParticipant

대화의 참가자를 나타냅니다. 버전 1.4.0에 추가됨

IPlayer

일시 중지, 다시 시작 등과 같은 오디오 재생을 제어하는 오디오 플레이어 인터페이스를 나타냅니다.

IVoiceJson
MeetingInfo
VoiceSignature

열거형

AudioFormatTag
CancellationErrorCode

CancellationReason이 Error인 경우 오류 코드를 정의합니다. 버전 1.1.0에 추가되었습니다.

CancellationReason

인식 결과가 취소될 수 있는 가능한 이유를 정의합니다.

LanguageIdMode

언어 식별 모드

LogLevel
NoMatchReason

인식 결과가 인식되지 않을 수 있는 가능한 이유를 정의합니다.

OutputFormat

Speech Recognizer 출력 형식을 정의합니다.

ParticipantChangedReason
ProfanityOption

욕설 옵션입니다. 버전 1.7.0에 추가되었습니다.

PronunciationAssessmentGradingSystem

발음 점수 보정을 위한 점 시스템을 정의합니다. 기본값은 FivePoint입니다. 버전 1.15.0에 추가됨

PronunciationAssessmentGranularity

발음 평가 세분성을 정의합니다. 기본값은 Phoneme입니다. 버전 1.15.0에 추가됨

PropertyId

음성 속성 ID를 정의합니다.

ResultReason

인식 결과가 생성될 수 있는 가능한 이유를 정의합니다.

ServicePropertyChannel

속성 설정을 서비스에 전달하는 데 사용되는 채널을 정의합니다. 버전 1.7.0에 추가되었습니다.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

음성 합성 경계 이벤트의 경계 유형을 정의합니다.

SpeechSynthesisOutputFormat

음성 합성 오디오 출력 형식을 정의합니다. SpeechSynthesisOutputFormat 버전 1.17.0에서 업데이트됨

VoiceProfileType

출력 형식