microsoft-cognitiveservices-speech-sdk package

‏‏المرجع

الفصول

ActivityReceivedEventArgs	يحدد محتويات الرسائل/الأحداث المستلمة.
AudioConfig	يمثل تكوين إدخال الصوت المستخدم لتحديد نوع الإدخال الذي يجب استخدامه (الميكروفون والملف والدفق).
AudioInputStream	يمثل دفق إدخال الصوت المستخدم لتكوينات إدخال الصوت المخصصة.
AudioOutputStream	يمثل دفق إخراج الصوت المستخدم لتكوينات إخراج الصوت المخصصة.
AudioStreamFormat	يمثل تنسيق دفق الصوت المستخدم لتكوينات إدخال الصوت المخصصة.
AutoDetectSourceLanguageConfig	تكوين الكشف التلقائي للغة.
AutoDetectSourceLanguageResult	نموذج الإخراج
AvatarConfig	يحدد تكوين الأفاتار الحديث.
AvatarEventArgs	يحدد المحتوى الخاص بأحداث الأفاتار الناطقة.
AvatarSynthesizer	يحدد تركيب الأفاتار.
AvatarVideoFormat	يحدد تنسيق فيديو إخراج الأفاتار.
AvatarWebRTCConnectionResult	يحدد نتيجة اتصال avatar WebRTC.
BaseAudioPlayer	فئة مشغل الصوت الأساسي TODO: يشغل PCM فقط في الوقت الحالي.
BotFrameworkConfig	الفئة التي تحدد تكوينات كائن موصل خدمة الحوار لاستخدام الواجهة الخلفية ل Bot Framework.
CancellationDetails	يحتوي على معلومات مفصلة حول سبب إلغاء النتيجة.
CancellationDetailsBase	يحتوي على معلومات مفصلة حول سبب إلغاء النتيجة.
Connection	الاتصال هو فئة وكيل لإدارة الاتصال بخدمة الكلام ل Recognizer المحدد. بشكل افتراضي، يدير Recognizer الاتصال بالخدمة بشكل مستقل عند الحاجة. توفر فئة الاتصال أساليب إضافية للمستخدمين لفتح اتصال أو إغلاقه بشكل صريح والاشتراك في تغييرات حالة الاتصال. استخدام الاتصال اختياري، وبشكل أساسي للسيناريوهات التي يلزم فيها ضبط سلوك التطبيق استنادا إلى حالة الاتصال. يمكن للمستخدمين اختياريا الاتصال ب Open() لإعداد اتصال يدويا مسبقا قبل بدء التعرف على Recognizer المقترن بهذا الاتصال. إذا كان أداة التعرف بحاجة إلى الاتصال بالخدمة أو قطع الاتصال بها، فسيتم إعداد الاتصال أو إيقاف تشغيله بشكل مستقل. في هذه الحالة سيتم إعلام الاتصال عن طريق تغيير حالة الاتصال عبر الأحداث المتصلة/غير المتصلة. تمت إضافته في الإصدار 1.2.1.
ConnectionEventArgs	يحدد البيانات الأساسية لأحداث الاتصال مثل متصل/غير متصل. تمت إضافته في الإصدار 1.2.0
ConnectionMessage	يمثل ConnectionMessage رسائل تنفيذ محددة يتم إرسالها إلى خدمة الكلام وتلقيها منها. يتم توفير هذه الرسائل لأغراض تصحيح الأخطاء ولا يجب استخدامها لحالات استخدام الإنتاج مع Azure Cognitive Services Speech Service. تخضع الرسائل المرسلة إلى خدمة الكلام والمستلمة منها للتغيير دون إشعار. يتضمن ذلك محتويات الرسائل والعناوين والحمولات وترتيبها وما إلى ذلك. تمت إضافته في الإصدار 1.11.0.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	يحدد المحتوى لأحداث جلسة العمل مثل SessionStarted/Stopped، SoundStarted/Stopped.
ConversationParticipantsChangedEventArgs	يحدد المحتوى لأحداث جلسة العمل مثل SessionStarted/Stopped، SoundStarted/Stopped.
ConversationTranscriber	يقوم بإجراء التعرف على الكلام مع فصل السماعة عن الميكروفون أو الملف أو تدفقات إدخال الصوت الأخرى، ويحصل على نص منسوخ نتيجة لذلك.
ConversationTranscriptionCanceledEventArgs	يحدد محتوى RecognitionErrorEvent.
ConversationTranscriptionEventArgs	يحدد محتويات الحدث المنسوخ/المنسوخ للمحادثة.
ConversationTranscriptionResult	يحدد نتيجة كتابة المحادثة.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	يحدد البيانات الأساسية لأحداث الجلسة مثل Speech Start/End Detected
ConversationTranslationResult	نتيجة نص الترجمة.
ConversationTranslator	الانضمام إلى محادثة أو تركها أو الاتصال بها.
Coordinate	يحدد إحداثيات في مساحة ثنائية الأبعاد.
CustomCommandsConfig	الفئة التي تحدد تكوينات كائن موصل خدمة الحوار لاستخدام خلفية CustomCommands.
Diagnostics	تعريف واجهة برمجة تطبيقات التشخيص لإدارة إخراج وحدة التحكم المضافة في الإصدار 1.21.0
DialogServiceConfig	الفئة التي تحدد التكوينات الأساسية لموصل خدمة الحوار
DialogServiceConnector	موصل خدمة مربع الحوار
IntentRecognitionCanceledEventArgs	تعريف حمولة أحداث النتائج الملغاة للتعرف على الهدف.
IntentRecognitionEventArgs	وسيطات حدث نتيجة التعرف على الهدف.
IntentRecognitionResult	نتيجة التعرف على الهدف.
IntentRecognizer	أداة التعرف على الهدف.
KeywordRecognitionModel	يمثل نموذج التعرف على الكلمات الأساسية للتعرف عندما يقول المستخدم كلمة أساسية لبدء مزيد من التعرف على الكلام.
LanguageUnderstandingModel	نموذج فهم اللغة
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	يحدد محتوى MeetingTranscriptionCanceledEvent.
MeetingTranscriptionEventArgs	يحدد محتويات حدث الاجتماع المنسوخ/الم transcribing.
NoMatchDetails	يحتوي على معلومات مفصلة لنتائج التعرف على NoMatch.
Participant	تمثيل مشارك في محادثة. تمت إضافته في الإصدار 1.4.0
PhraseListGrammar	يسمح بإضافات العبارات الجديدة لتحسين التعرف على الكلام. العبارات المضافة إلى أداة التعرف فعالة في بداية التعرف التالي، أو في المرة التالية التي يجب فيها إعادة اتصال SpeechSDK بخدمة الكلام.
PronunciationAssessmentConfig	تكوين تقييم النطق.
PronunciationAssessmentResult	نتائج تقييم النطق.
PropertyCollection	يمثل مجموعة من الخصائص وقيمها.
PullAudioInputStream	يمثل دفق إدخال الصوت المستخدم لتكوينات إدخال الصوت المخصصة.
PullAudioInputStreamCallback	فئة أساسية مجردة تحدد أساليب رد الاتصال (read() و close()) لتدفقات إدخال الصوت المخصصة).
PullAudioOutputStream	يمثل دفق إخراج صوت الدفع المدعوم بالذاكرة المستخدم لتكوينات إخراج الصوت المخصصة.
PushAudioInputStream	يمثل دفق إدخال صوت الدفع المدعوم بالذاكرة المستخدم لتكوينات إدخال الصوت المخصصة.
PushAudioOutputStream	يمثل دفق إخراج الصوت المستخدم لتكوينات إخراج الصوت المخصصة.
PushAudioOutputStreamCallback	فئة أساسية مجردة تحدد أساليب رد الاتصال (write() و close()) لتدفقات إخراج الصوت المخصصة).
RecognitionEventArgs	يحدد البيانات الأساسية لأحداث الجلسة مثل Speech Start/End Detected
RecognitionResult	يحدد نتيجة التعرف على الكلام.
Recognizer	يحدد أداة التعرف على الفئة الأساسية التي تحتوي بشكل أساسي على معالجات الأحداث الشائعة.
ServiceEventArgs	تعريف الحمولة لأي حدث رسالة خدمة تمت إضافته في الإصدار 1.9.0
SessionEventArgs	يحدد المحتوى لأحداث جلسة العمل مثل SessionStarted/Stopped، SoundStarted/Stopped.
SourceLanguageConfig	تكوين لغة المصدر.
SpeakerAudioDestination	يمثل وجهة صوت تشغيل السماعة، والتي تعمل فقط في المستعرض. ملاحظة: سيحاول SDK استخدام Media Source Extensions لتشغيل الصوت. يحتوي تنسيق Mp3 على دعم أفضل على Microsoft Edge وChrome وSafari (سطح المكتب)، لذلك، من الأفضل تحديد تنسيق mp3 للتشغيل.
SpeakerIdentificationModel	تعريف فئة SpeakerIdentificationModel لنموذج التعرف على المتحدث تحتوي على مجموعة من ملفات التعريف التي يمكن من خلالها تحديد المتحدث (المتحدثين)
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	نموذج الإخراج
SpeakerRecognizer	يحدد فئة SpeakerRecognizer للتعرف على المتحدث يعالج العمليات من المستخدم لعمليات ملف تعريف الصوت (على سبيل المثال createProfile، deleteProfile)
SpeakerVerificationModel	تعريف فئة SpeakerVerificationModel لنموذج التعرف على المتحدث يحتوي على ملف تعريف للتحقق من مكبر الصوت
SpeechConfig	تكوين الكلام.
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	يحدد محتويات حدث التعرف على الكلام/التعرف عليه.
SpeechRecognitionResult	يحدد نتيجة التعرف على الكلام.
SpeechRecognizer	يقوم بإجراء التعرف على الكلام من الميكروفون أو الملف أو تدفقات إدخال الصوت الأخرى، ويحصل على نص منسوخ نتيجة لذلك.
SpeechSynthesisBookmarkEventArgs	يحدد محتويات حدث إشارة مرجعية لتركيب الكلام.
SpeechSynthesisEventArgs	يحدد محتويات أحداث تركيب الكلام.
SpeechSynthesisResult	يحدد نتيجة تركيب الكلام.
SpeechSynthesisVisemeEventArgs	يحدد محتويات حدث viseme لتركيب الكلام.
SpeechSynthesisWordBoundaryEventArgs	يحدد محتويات حدث حد كلمة تركيب الكلام.
SpeechSynthesizer	تعريف الفئة SpeechSynthesizer للنص إلى كلام. تم التحديث في الإصدار 1.16.0
SpeechTranslationConfig	تكوين ترجمة الكلام.
SynthesisResult	الفئة الأساسية لنتائج التركيب
SynthesisVoicesResult	يحدد نتيجة تركيب الكلام.
Synthesizer
TranslationRecognitionCanceledEventArgs	تعريف البيانات الأساسية لأحداث النتائج الملغاة للتعرف على الكلام.
TranslationRecognitionEventArgs	وسيطات حدث نتيجة نص الترجمة.
TranslationRecognitionResult	نتيجة نص الترجمة.
TranslationRecognizer	أداة التعرف على الترجمة
TranslationSynthesisEventArgs	وسيطات حدث تجميع الترجمة
TranslationSynthesisResult	يحدد نتيجة تركيب الترجمة، أي الإخراج الصوتي للنص المترجم باللغة الهدف.
Translations	يمثل مجموعة من المعلمات وقيمها.
TurnStatusReceivedEventArgs	يحدد محتويات الرسائل/الأحداث المستلمة.
User
VoiceInfo	معلومات حول صوت تركيب الكلام المضاف في الإصدار 1.20.0.
VoiceProfile	تعريف فئة ملف التعريف الصوتي للتعرف على المتحدث
VoiceProfileCancellationDetails
VoiceProfileClient	تعريف فئة VoiceProfileClient للتعرف على المتحدث يعالج العمليات من المستخدم لعمليات ملف تعريف الصوت (على سبيل المثال createProfile، deleteProfile)
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	نموذج الإخراج
VoiceProfilePhraseResult	نموذج الإخراج
VoiceProfileResult	نموذج الإخراج

الواجهات

CancellationEventArgs
ConversationInfo
IParticipant	تمثيل مشارك في محادثة. تمت إضافته في الإصدار 1.4.0
IPlayer	يمثل واجهة مشغل الصوت للتحكم في تشغيل الصوت، مثل إيقاف مؤقت واستئناف وما إلى ذلك.
IVoiceJson
MeetingInfo
VoiceSignature

التعدادات

AudioFormatTag
CancellationErrorCode	يحدد رمز الخطأ في حالة أن CancellationReason هو Error. تمت إضافته في الإصدار 1.1.0.
CancellationReason	يحدد الأسباب المحتملة لإلغاء نتيجة التعرف.
LanguageIdMode	وضع تعريف اللغة
LogLevel
NoMatchReason	يحدد الأسباب المحتملة لعدم التعرف على نتيجة التعرف.
OutputFormat	تعريف تنسيقات إخراج Speech Recognizer.
ParticipantChangedReason
ProfanityOption	خيار الألفاظ النابية. تمت إضافته في الإصدار 1.7.0.
PronunciationAssessmentGradingSystem	يحدد نظام النقاط لمعايرة درجة النطق؛ القيمة الافتراضية هي FivePoint. تمت إضافته في الإصدار 1.15.0
PronunciationAssessmentGranularity	يحدد دقة تقييم النطق؛ القيمة الافتراضية هي Phoneme. تمت إضافته في الإصدار 1.15.0
PropertyId	يحدد معرفات خصائص الكلام.
ResultReason	يحدد الأسباب المحتملة لإنشاء نتيجة التعرف.
ServicePropertyChannel	يحدد القنوات المستخدمة لتمرير إعدادات الخاصية إلى الخدمة. تمت إضافته في الإصدار 1.7.0.
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	يحدد نوع حد حدث حد تركيب الكلام.
SpeechSynthesisOutputFormat	تعريف تنسيقات إخراج صوت تركيب الكلام. SpeechSynthesisOutputFormat محدث في الإصدار 1.17.0
VoiceProfileType	نموذج الإخراج

مشاركة عبر

microsoft-cognitiveservices-speech-sdk package

الفصول

الواجهات

التعدادات

الموارد الإضافية