مشاركة عبر


microsoft-cognitiveservices-speech-sdk package

الفصول

ActivityReceivedEventArgs

تعريف محتويات الرسائل/الأحداث المستلمة.

AudioConfig

يمثل تكوين إدخال الصوت المستخدم لتحديد نوع الإدخال الذي يجب استخدامه (الميكروفون والملف والدفق).

AudioInputStream

يمثل دفق إدخال الصوت المستخدم لتكوينات إدخال الصوت المخصصة.

AudioOutputStream

يمثل دفق إخراج الصوت المستخدم لتكوينات إخراج الصوت المخصصة.

AudioStreamFormat

يمثل تنسيق دفق الصوت المستخدم لتكوينات إدخال الصوت المخصصة.

AutoDetectSourceLanguageConfig

تكوين الكشف التلقائي للغة.

AutoDetectSourceLanguageResult

تنسيق الإخراج

AvatarConfig

تعريف تكوين الأفاتار الحديث.

AvatarEventArgs

تعريف المحتوى الخاص بالتحدث عن أحداث الأفاتار.

AvatarSceneConfig

يحدد تكوين مشهد الأفاتار للتحكم في تموضع واتجاه الأفاتار.

AvatarSynthesizer

تعريف تركيب الأفاتار.

AvatarVideoFormat

تعريف تنسيق فيديو إخراج الأفاتار.

AvatarWebRTCConnectionResult

تعريف نتيجة اتصال avatar WebRTC.

BaseAudioPlayer

فئة مشغل الصوت الأساسي TODO: يشغل PCM فقط في الوقت الحالي.

BotFrameworkConfig

الفئة التي تحدد تكوينات كائن موصل خدمة مربع الحوار لاستخدام الواجهة الخلفية ل Bot Framework.

CancellationDetails

يحتوي على معلومات مفصلة حول سبب إلغاء النتيجة.

CancellationDetailsBase

يحتوي على معلومات مفصلة حول سبب إلغاء النتيجة.

Connection

الاتصال هو فئة وكيل لإدارة الاتصال بخدمة الكلام ل Recognizer المحدد. بشكل افتراضي، يدير Recognizer الاتصال بالخدمة بشكل مستقل عند الحاجة. توفر فئة الاتصال أساليب إضافية للمستخدمين لفتح اتصال أو إغلاقه بشكل صريح والاشتراك في تغييرات حالة الاتصال. استخدام الاتصال اختياري، وبشكل أساسي للسيناريوهات التي يلزم فيها ضبط سلوك التطبيق استنادا إلى حالة الاتصال. يمكن للمستخدمين اختياريا استدعاء Open() لإعداد اتصال يدويا مسبقا قبل بدء التعرف على Recognizer المقترن بهذا الاتصال. إذا احتاج Recognizer إلى الاتصال بالخدمة أو قطع الاتصال بها، إعداد الاتصال أو إيقاف تشغيله بشكل مستقل. في هذه الحالة سيتم إعلام الاتصال عن طريق تغيير حالة الاتصال عبر الأحداث المتصلة/غير المتصلة. تمت الإضافة في الإصدار 1.2.1.

ConnectionEventArgs

تعريف الحمولة لأحداث الاتصال مثل متصل/غير متصل. تمت الإضافة في الإصدار 1.2.0

ConnectionMessage

يمثل ConnectionMessage رسائل تنفيذ محددة يتم إرسالها إلى خدمة الكلام وتلقيها منها. يتم توفير هذه الرسائل لأغراض تصحيح الأخطاء ولا يجب استخدامها لحالات استخدام الإنتاج مع Azure Cognitive Services Speech Service. تخضع الرسائل المرسلة إلى خدمة الكلام والمستلمة منها للتغيير دون إشعار. يتضمن ذلك محتويات الرسائل والرؤوس والحمولات وترتيبها وما إلى ذلك. تمت الإضافة في الإصدار 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

تعريف المحتوى لأحداث جلسة العمل مثل SessionStarted/Stopped، SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

تعريف المحتوى لأحداث جلسة العمل مثل SessionStarted/Stopped، SoundStarted/Stopped.

ConversationTranscriber

يقوم بإجراء التعرف على الكلام مع فصل السماعات عن الميكروفون أو الملف أو تدفقات إدخال الصوت الأخرى، ويحصل على نص منسوخ نتيجة لذلك.

ConversationTranscriptionCanceledEventArgs

تعريف محتوى RecognitionErrorEvent.

ConversationTranscriptionEventArgs

تعريف محتويات حدث نسخ/نسخ المحادثة.

ConversationTranscriptionResult

يحدد نتيجة كتابة المحادثة.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

تعريف الحمولة لأحداث جلسة العمل مثل Speech Start/End Detected

ConversationTranslationResult

نتيجة نص الترجمة.

ConversationTranslator

الانضمام إلى محادثة أو مغادرتها أو الاتصال بها.

Coordinate

تعريف إحداثيات في مساحة 2D.

CustomCommandsConfig

الفئة التي تحدد تكوينات كائن موصل خدمة مربع الحوار لاستخدام خلفية CustomCommands.

Diagnostics

تعريف واجهة برمجة تطبيقات التشخيص لإدارة إخراج وحدة التحكم المضافة في الإصدار 1.21.0

DialogServiceConfig

الفئة التي تحدد التكوينات الأساسية لموصل خدمة مربع الحوار

DialogServiceConnector

موصل خدمة مربع الحوار

KeywordRecognitionModel

يمثل نموذج التعرف على الكلمات الأساسية للتعرف على عندما يقول المستخدم كلمة أساسية لبدء مزيد من التعرف على الكلام.

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

تعريف محتوى MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

تعريف محتويات حدث الاجتماع المنسوخ/الم transcribing.

NoMatchDetails

يحتوي على معلومات مفصلة لنتائج التعرف على NoMatch.

Participant

تمثيل مشارك في محادثة. تمت الإضافة في الإصدار 1.4.0

PhraseListGrammar

يسمح بإضافات العبارات الجديدة لتحسين التعرف على الكلام.

تكون العبارات المضافة إلى أداة التعرف فعالة في بداية التعرف التالي، أو في المرة التالية التي يجب فيها على SpeechSDK إعادة الاتصال بخدمة الكلام.

PronunciationAssessmentConfig

تكوين تقييم النطق.

PronunciationAssessmentResult

نتائج تقييم النطق.

PropertyCollection

يمثل مجموعة من الخصائص وقيمها.

PullAudioInputStream

يمثل دفق إدخال الصوت المستخدم لتكوينات إدخال الصوت المخصصة.

PullAudioInputStreamCallback

فئة أساسية مجردة تحدد أساليب رد الاتصال (read() و close()) لتدفقات إدخال الصوت المخصصة).

PullAudioOutputStream

يمثل دفق إخراج صوت الدفع المدعوم بالذاكرة المستخدم لتكوينات إخراج الصوت المخصصة.

PushAudioInputStream

يمثل دفق إدخال صوت الدفع المدعوم بالذاكرة المستخدم لتكوينات إدخال الصوت المخصصة.

PushAudioOutputStream

يمثل دفق إخراج الصوت المستخدم لتكوينات إخراج الصوت المخصصة.

PushAudioOutputStreamCallback

فئة أساسية مجردة تحدد أساليب رد الاتصال (write() و close()) لتدفقات إخراج الصوت المخصصة).

RecognitionEventArgs

تعريف الحمولة لأحداث جلسة العمل مثل Speech Start/End Detected

RecognitionResult

يحدد نتيجة التعرف على الكلام.

Recognizer

تعريف أداة التعرف على الفئة الأساسية التي تحتوي بشكل أساسي على معالجات الأحداث الشائعة.

ServiceEventArgs

تعريف الحمولة لأي حدث رسالة خدمة تمت إضافته في الإصدار 1.9.0

SessionEventArgs

تعريف المحتوى لأحداث جلسة العمل مثل SessionStarted/Stopped، SoundStarted/Stopped.

SourceLanguageConfig

تكوين لغة المصدر.

SpeakerAudioDestination

يمثل وجهة صوت تشغيل السماعة، والتي تعمل فقط في المستعرض. ملاحظة: سيحاول SDK استخدام ملحقات مصدر الوسائط لتشغيل الصوت. يحتوي تنسيق Mp3 على دعم أفضل على Microsoft Edge وChrome وSafari (سطح المكتب)، لذلك، من الأفضل تحديد تنسيق mp3 للتشغيل.

SpeechConfig

تكوين الكلام.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

تعريف محتويات حدث التعرف على الكلام/التعرف عليه.

SpeechRecognitionResult

يحدد نتيجة التعرف على الكلام.

SpeechRecognizer

ينفذ التعرف على الكلام من الميكروفون أو الملف أو تدفقات إدخال الصوت الأخرى، ويحصل على نص منسوخ نتيجة لذلك.

SpeechSynthesisBookmarkEventArgs

تعريف محتويات حدث إشارة تحويل الكلام المرجعية.

SpeechSynthesisEventArgs

يحدد محتويات أحداث تركيب الكلام.

SpeechSynthesisResult

يحدد نتيجة تركيب الكلام.

SpeechSynthesisVisemeEventArgs

تعريف محتويات حدث viseme لتركيب الكلام.

SpeechSynthesisWordBoundaryEventArgs

تعريف محتويات حدث حد كلمة تجميع الكلام.

SpeechSynthesizer

تعريف فئة SpeechSynthesizer للنص إلى كلام. تم التحديث في الإصدار 1.16.0

SpeechTranslationConfig

تكوين ترجمة الكلام.

SynthesisResult

الفئة الأساسية لنتائج التركيب

SynthesisVoicesResult

يحدد نتيجة تركيب الكلام.

Synthesizer
TranslationRecognitionCanceledEventArgs

تعريف حمولة أحداث النتائج الملغاة للتعرف على الكلام.

TranslationRecognitionEventArgs

وسيطات حدث نتيجة نص الترجمة.

TranslationRecognitionResult

نتيجة نص الترجمة.

TranslationRecognizer

أداة التعرف على الترجمة

TranslationSynthesisEventArgs

وسيطات حدث تجميع الترجمة

TranslationSynthesisResult

يحدد نتيجة تجميع الترجمة، أي الإخراج الصوتي للنص المترجم باللغة الهدف.

Translations

يمثل مجموعة من المعلمات وقيمها.

TurnStatusReceivedEventArgs

تعريف محتويات الرسائل/الأحداث المستلمة.

User
VoiceInfo

معلومات حول صوت تجميع الكلام المضاف في الإصدار 1.20.0.

الواجهات

CancellationEventArgs
ConversationInfo
IParticipant

تمثيل مشارك في محادثة. تمت الإضافة في الإصدار 1.4.0

IPlayer

يمثل واجهة مشغل الصوت للتحكم في تشغيل الصوت، مثل إيقاف مؤقت واستئناف وما إلى ذلك.

IVoiceJson
MeetingInfo
VoiceSignature

التعدادات

AudioFormatTag
CancellationErrorCode

تعريف رمز الخطأ في حالة أن CancellationReason هو Error. تمت الإضافة في الإصدار 1.1.0.

CancellationReason

يحدد الأسباب المحتملة لإلغاء نتيجة التعرف.

LanguageIdMode

وضع تعريف اللغة

LogLevel
NoMatchReason

يحدد الأسباب المحتملة لعدم التعرف على نتيجة التعرف.

OutputFormat

تعريف تنسيقات إخراج Speech Recognizer.

ParticipantChangedReason
ProfanityOption

خيار الألفاظ النابية. تمت الإضافة في الإصدار 1.7.0.

PronunciationAssessmentGradingSystem

يحدد نظام النقاط لمعايرة درجة النطق؛ القيمة الافتراضية هي FivePoint. تمت الإضافة في الإصدار 1.15.0

PronunciationAssessmentGranularity

يحدد دقة تقييم النطق؛ القيمة الافتراضية هي Phoneme. تمت الإضافة في الإصدار 1.15.0

PropertyId

تعريف معرفات خصائص الكلام.

ResultReason

يحدد الأسباب المحتملة لإنشاء نتيجة التعرف.

ServicePropertyChannel

تعريف القنوات المستخدمة لتمرير إعدادات الخاصية إلى الخدمة. تمت الإضافة في الإصدار 1.7.0.

SpeechSynthesisBoundaryType

يحدد نوع الحد لحدث حد تركيب الكلام.

SpeechSynthesisOutputFormat

تعريف تنسيقات إخراج الصوت توليف الكلام. SpeechSynthesisOutputFormat محدث في الإصدار 1.17.0

SynthesisVoiceGender

يحدد جنس الأصوات التوليفية. تمت الإضافة في الإصدار 1.20.0.

SynthesisVoiceType