مشاركة عبر


Speech to text REST API

يتم استخدام Speech to text REST API للنسخ الدفعيوالكلام المخصص.

هام

إصدار 2024-11-15 واجهة برمجة تطبيقات REST لتحويل الكلام إلى نص هو أحدث إصدار متوفر بشكل عام.

  • سيتم إيقاف إصدار 2024-05-15-preview في تاريخ يتم الإعلان عنه.
  • سيتم إيقاف Speech to text REST API v3.0و v3.1v3.23.2-preview.13.2-preview.2 في 31 مارس 2026.

لمزيد من المعلومات حول الترقية، راجع إرشادات الترحيل Speech to text REST API v3.0 إلى v3.1وv3.1 إلى v3.2وv3.2 إلى 2024-11-15 .

استخدم Speech للنص REST API من أجل:

  • النسخ السريع: نسخ الملفات الصوتية مع إرجاع النتائج بشكل متزامن وأسرع بكثير من الصوت في الوقت الحقيقي. استخدم واجهة برمجة تطبيقات النسخ السريع (/speechtotext/transcriptions:transcribe) في السيناريوهات التي تحتاج فيها إلى نسخة تسجيل صوتي في أسرع وقت ممكن مع زمن انتقال يمكن التنبؤ به، مثل نسخ الصوت أو الفيديو السريع أو ترجمة الفيديو.
  • النسخ الدفعي: نسخ الملفات الصوتية كدفعة من عناوين URL متعددة أو حاوية Azure. استخدم واجهة برمجة تطبيقات النسخ الدفعي (/speechtotext/transcriptions:submit) في السيناريوهات التي تحتاج إلى نسخ كمية كبيرة من الصوت في التخزين، مثل عدد كبير من الملفات أو ملف صوتي طويل.
  • الكلام المخصص: قم بتحميل بياناتك الخاصة، واختبار نموذج مخصص وتدريبه، ومقارنة الدقة بين النماذج، ونشر نموذج إلى نقطة نهاية مخصصة. انسخ النماذج إلى اشتراكات أخرى إذا كنت تريد أن يكون للزملاء حق الوصول إلى نموذج قمت ببنائه، أو إذا كنت تريد نشر نموذج في أكثر من منطقة واحدة.

تتضمن واجهة برمجة تطبيقات REST لتحويل الكلام إلى نص ميزات مثل:

  • طلب سجلات لكل نقطة نهاية.
  • اطلب بيان النماذج التي تقوم بإنشائها، لإعداد حاويات محلية.
  • تحميل البيانات من حسابات تخزين Azure باستخدام عنوان URI لتوقيع الوصول المشترك (SAS).
  • أحضر سعة التخزين الخاصة بك. استخدم حسابات التخزين الخاصة بك للسجلات وملفات النسخ والبيانات الأخرى.
  • تدعم بعض العمليات إعلامات خطاف الويب. يمكنك تسجيل خطافات الويب الخاصة بك حيث يتم إرسال الإعلامات.

النسخ السريع

تنطبق مجموعات العمليات التالية على النسخ السريع.

مجموعة العمليات ‏‏الوصف
تدوين استخدام النسخ - نسخ لنسخ الملفات الصوتية.

عند استخدام النسخ السريع ، ترسل ملفا واحدا لكل طلب. راجع إنشاء نسخة للحصول على أمثلة حول كيفية إنشاء نسخة من ملف صوتي واحد.

النسخ الدفعي

تنطبق مجموعات العمليات التالية على النسخ الدفعي.

مجموعة العمليات ‏‏الوصف
نماذج استخدم النماذج الأساسية أو النماذج المخصصة لنسخ الملفات الصوتية.

يمكنك استخدام النماذج مع الكلام المخصصوالنسخ الدفعي. على سبيل المثال، يمكنك استخدام نموذج مدرب مع مجموعة بيانات معينة لنسخ الملفات الصوتية. راجع تدريب نموذجودورة حياة نموذج الكلام المخصص للحصول على أمثلة حول كيفية تدريب نماذج الكلام المخصصة وإدارتها.
تدوين استخدام النسخ - إرسال لنسخ كمية كبيرة من الصوت في التخزين.

عند استخدام النسخ الدفعي ، ترسل ملفات متعددة لكل طلب أو تشير إلى حاوية Azure Blob Storage مع الملفات الصوتية للنسخ. راجع إنشاء نسخة للحصول على أمثلة حول كيفية إنشاء نسخ من ملفات صوتية متعددة.
خطافات الويب استخدم خطافات الويب لتلقي إعلامات حول أحداث الإنشاء والمعالجة والإكمال والحذف.

يمكنك استخدام خطافات الويب مع الكلام المخصصوالنسخ الدفعي. تنطبق خطافات الويب على مجموعات البياناتونقاط النهايةوالتقييماتوالنماذجوالنسخ.

الكلام المخصص

تنطبق مجموعات العمليات التالية على الكلام المخصص.

مجموعة العمليات ‏‏الوصف
مجموعات البيانات استخدم مجموعات البيانات لتدريب نماذج الكلام المخصصة واختبارها.

على سبيل المثال، يمكنك مقارنة أداء الكلام المخصص المدرب مع مجموعة بيانات معينة بأداء نموذج أساسي أو نموذج كلام مخصص مدرب مع مجموعة بيانات مختلفة. راجع تحميل مجموعات بيانات التدريب والاختبار للحصول على أمثلة حول كيفية تحميل مجموعات البيانات.
النهايه توزيع نماذج الكلام المخصصة إلى نقاط النهاية.

يجب نشر نقطة نهاية مخصصة لاستخدام نموذج كلام مخصص . راجع نشر نموذج للحصول على أمثلة حول كيفية إدارة نقاط نهاية التوزيع.
التقييمات استخدم التقييمات لمقارنة أداء النماذج المختلفة.

على سبيل المثال، يمكنك مقارنة أداء نموذج كلام مخصص مدرب مع مجموعة بيانات معينة بأداء نموذج أساسي أو نموذج مخصص مدرب مع مجموعة بيانات مختلفة. راجع جودة التعرف على الاختبارودقة الاختبار للحصول على أمثلة حول كيفية اختبار نماذج الكلام المخصصة وتقييمها.
نماذج استخدم النماذج الأساسية أو النماذج المخصصة لنسخ الملفات الصوتية.

يمكنك استخدام النماذج مع الكلام المخصصوالنسخ الدفعي. على سبيل المثال، يمكنك استخدام نموذج مدرب مع مجموعة بيانات معينة لنسخ الملفات الصوتية. راجع تدريب نموذجودورة حياة نموذج الكلام المخصص للحصول على أمثلة حول كيفية تدريب نماذج الكلام المخصصة وإدارتها.
خطافات الويب استخدم خطافات الويب لتلقي إعلامات حول أحداث الإنشاء والمعالجة والإكمال والحذف.

يمكنك استخدام خطافات الويب مع الكلام المخصصوالنسخ الدفعي. تنطبق خطافات الويب على مجموعات البياناتونقاط النهايةوالتقييماتوالنماذجوالنسخ.