microsoft-cognitiveservices-speech-sdk package

Kelas

ActivityReceivedEventArgs

Menentukan konten pesan/peristiwa yang diterima.

AudioConfig

Mewakili konfigurasi input audio yang digunakan untuk menentukan jenis input apa yang akan digunakan (mikrofon, file, aliran).

AudioInputStream

Mewakili aliran input audio yang digunakan untuk konfigurasi input audio kustom.

AudioOutputStream

Mewakili aliran output audio yang digunakan untuk konfigurasi output audio kustom.

AudioStreamFormat

Mewakili format aliran audio yang digunakan untuk konfigurasi input audio kustom.

AutoDetectSourceLanguageConfig

Konfigurasi deteksi otomatis bahasa.

AutoDetectSourceLanguageResult

Format output

AvatarConfig

Mendefinisikan konfigurasi avatar yang berbicara.

AvatarEventArgs

Menentukan konten untuk berbicara peristiwa avatar.

AvatarSynthesizer

Mendefinisikan synthesizer avatar.

AvatarVideoFormat

Menentukan format video output avatar.

AvatarWebRTCConnectionResult

Menentukan hasil koneksi WebRTC avatar.

BaseAudioPlayer

Kelas pemutar audio dasar TODO: Hanya memutar PCM untuk saat ini.

BotFrameworkConfig

Kelas yang menentukan konfigurasi untuk objek konektor layanan dialog untuk menggunakan backend Bot Framework.

CancellationDetails

Berisi informasi terperinci tentang mengapa hasil dibatalkan.

CancellationDetailsBase

Berisi informasi terperinci tentang mengapa hasil dibatalkan.

Connection

Koneksi adalah kelas proksi untuk mengelola koneksi ke layanan ucapan dari Recognizer yang ditentukan. Secara default, Recognizer secara otonom mengelola koneksi ke layanan saat diperlukan. Kelas Koneksi menyediakan metode tambahan bagi pengguna untuk secara eksplisit membuka atau menutup koneksi dan berlangganan perubahan status koneksi. Penggunaan Koneksi bersifat opsional, dan terutama untuk skenario di mana penyempurnaan perilaku aplikasi berdasarkan status koneksi diperlukan. Pengguna dapat secara opsional memanggil Open() untuk menyiapkan koneksi secara manual terlebih dahulu sebelum memulai pengenalan pada Recognizer yang terkait dengan Koneksi ini. Jika Recognizer perlu menyambungkan atau memutuskan sambungan ke layanan, recognizer akan mengatur atau mematikan koneksi secara independen. Dalam hal ini Koneksi akan diberi tahu dengan perubahan status koneksi melalui peristiwa Tersambung/Terputus. Ditambahkan dalam versi 1.2.1.

ConnectionEventArgs

Menentukan payload untuk peristiwa koneksi seperti Tersambung/Terputus. Ditambahkan dalam versi 1.2.0

ConnectionMessage

ConnectionMessage mewakili implementasi pesan tertentu yang dikirim ke dan diterima dari layanan ucapan. Pesan ini disediakan untuk tujuan penelusuran kesalahan dan tidak boleh digunakan untuk kasus penggunaan produksi dengan Azure Cognitive Services Speech Service. Pesan yang dikirim ke dan diterima dari Layanan Ucapan dapat berubah tanpa pemberitahuan. Ini termasuk konten pesan, header, payload, pemesanan, dll. Ditambahkan dalam versi 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Menentukan konten untuk peristiwa sesi seperti SessionStarted/Stop, SoundStarted/Stop.

ConversationParticipantsChangedEventArgs

Menentukan konten untuk peristiwa sesi seperti SessionStarted/Stop, SoundStarted/Stop.

ConversationTranscriber

Melakukan pengenalan ucapan dengan pemisahan pembicara dari mikrofon, file, atau aliran input audio lainnya, dan mendapatkan teks yang ditranskripsikan sebagai hasilnya.

ConversationTranscriptionCanceledEventArgs

Menentukan konten RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Menentukan konten peristiwa yang ditranskripsikan/ditransskripsikan percakapan.

ConversationTranscriptionResult

Menentukan hasil transkripsi percakapan.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Menentukan payload untuk peristiwa sesi seperti Speech Start/End Detected

ConversationTranslationResult

Hasil teks terjemahan.

ConversationTranslator

Bergabung, meninggalkan, atau menyambungkan ke percakapan.

Coordinate

Menentukan koordinat dalam ruang 2D.

CustomCommandsConfig

Kelas yang menentukan konfigurasi untuk objek konektor layanan dialog untuk menggunakan backend CustomCommands.

Diagnostics

Menentukan API diagnostik untuk mengelola output konsol Ditambahkan dalam versi 1.21.0

DialogServiceConfig

Kelas yang menentukan konfigurasi dasar untuk konektor layanan dialog

DialogServiceConnector

Konektor Layanan Dialog

IntentRecognitionCanceledEventArgs

Tentukan payload peristiwa hasil yang dibatalkan pengenalan niat.

IntentRecognitionEventArgs

Argumen peristiwa hasil pengenalan niat.

IntentRecognitionResult

Hasil pengenalan niat.

IntentRecognizer

Pengenal niat.

KeywordRecognitionModel

Mewakili model pengenalan kata kunci untuk dikenali ketika pengguna mengatakan kata kunci untuk memulai pengenalan ucapan lebih lanjut.

LanguageUnderstandingModel

Model pemahaman bahasa

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Menentukan konten MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Menentukan konten acara yang ditranskripsikan/ditransskripsikan rapat.

NoMatchDetails

Berisi informasi terperinci untuk hasil pengenalan NoMatch.

Participant

Mewakili peserta dalam percakapan. Ditambahkan dalam versi 1.4.0

PhraseListGrammar

Memungkinkan penambahan frasa baru untuk meningkatkan pengenalan ucapan.

Frasa yang ditambahkan ke pengenal efektif pada awal pengenalan berikutnya, atau lain kali SpeechSDK harus terhubung kembali ke layanan ucapan.

PronunciationAssessmentConfig

Konfigurasi penilaian pengucapan.

PronunciationAssessmentResult

Hasil penilaian pengucapan.

PropertyCollection

Mewakili kumpulan properti dan nilainya.

PullAudioInputStream

Mewakili aliran input audio yang digunakan untuk konfigurasi input audio kustom.

PullAudioInputStreamCallback

Kelas dasar abstrak yang menentukan metode panggilan balik (read() dan close()) untuk aliran input audio kustom).

PullAudioOutputStream

Mewakili aliran output audio push yang didukung memori yang digunakan untuk konfigurasi output audio kustom.

PushAudioInputStream

Mewakili aliran input audio push yang didukung memori yang digunakan untuk konfigurasi input audio kustom.

PushAudioOutputStream

Mewakili aliran output audio yang digunakan untuk konfigurasi output audio kustom.

PushAudioOutputStreamCallback

Kelas dasar abstrak yang menentukan metode panggilan balik (write() dan close()) untuk aliran output audio kustom).

RecognitionEventArgs

Menentukan payload untuk peristiwa sesi seperti Speech Start/End Detected

RecognitionResult

Menentukan hasil pengenalan ucapan.

Recognizer

Mendefinisikan kelas dasar Recognizer yang terutama berisi penanganan aktivitas umum.

ServiceEventArgs

Menentukan payload untuk peristiwa pesan Layanan apa pun yang Ditambahkan di versi 1.9.0

SessionEventArgs

Menentukan konten untuk peristiwa sesi seperti SessionStarted/Stop, SoundStarted/Stop.

SourceLanguageConfig

Konfigurasi Bahasa Sumber.

SpeakerAudioDestination

Mewakili tujuan audio pemutaran speaker, yang hanya berfungsi di browser. Catatan: SDK akan mencoba menggunakan Ekstensi Sumber Media untuk memutar audio. Format Mp3 memiliki dukungan yang lebih baik di Microsoft Edge, Chrome, dan Safari (desktop), jadi, lebih baik menentukan format mp3 untuk pemutaran.

SpeakerIdentificationModel

Menentukan kelas SpeakerIdentificationModel untuk Model Pengenalan Pembicara berisi sekumpulan profil untuk mengidentifikasi pembicara

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Format output

SpeakerRecognizer

Menentukan kelas SpeakerRecognizer untuk Pengenalan Pembicara Menangani operasi dari pengguna untuk operasi Profil Suara (misalnya createProfile, deleteProfile)

SpeakerVerificationModel

Menentukan kelas SpeakerVerificationModel untuk Model Pengenalan Pembicara berisi profil untuk memverifikasi pembicara

SpeechConfig

Konfigurasi ucapan.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Menentukan konten peristiwa pengenalan/pengenalan ucapan.

SpeechRecognitionResult

Menentukan hasil pengenalan ucapan.

SpeechRecognizer

Melakukan pengenalan ucapan dari mikrofon, file, atau aliran input audio lainnya, dan mendapatkan teks yang ditranskripsikan sebagai hasilnya.

SpeechSynthesisBookmarkEventArgs

Menentukan konten peristiwa marka buku sintesis ucapan.

SpeechSynthesisEventArgs

Menentukan konten peristiwa sintesis ucapan.

SpeechSynthesisResult

Mendefinisikan hasil sintesis ucapan.

SpeechSynthesisVisemeEventArgs

Mendefinisikan konten peristiwa viseme sintesis ucapan.

SpeechSynthesisWordBoundaryEventArgs

Mendefinisikan konten peristiwa batas kata sintesis ucapan.

SpeechSynthesizer

Menentukan kelas SpeechSynthesizer untuk teks ke ucapan. Diperbarui dalam versi 1.16.0

SpeechTranslationConfig

Konfigurasi terjemahan ucapan.

SynthesisResult

Kelas dasar untuk hasil sintesis

SynthesisVoicesResult

Mendefinisikan hasil sintesis ucapan.

Synthesizer
TranslationRecognitionCanceledEventArgs

Tentukan payload peristiwa hasil yang dibatalkan pengenalan ucapan.

TranslationRecognitionEventArgs

Argumen peristiwa hasil teks terjemahan.

TranslationRecognitionResult

Hasil teks terjemahan.

TranslationRecognizer

Pengenal terjemahan

TranslationSynthesisEventArgs

Argumen peristiwa Sintesis Terjemahan

TranslationSynthesisResult

Menentukan hasil sintesis terjemahan, yaitu output suara dari teks yang diterjemahkan dalam bahasa target.

Translations

Mewakili kumpulan parameter dan nilainya.

TurnStatusReceivedEventArgs

Menentukan konten pesan/peristiwa yang diterima.

User
VoiceInfo

Informasi tentang suara Sintesis Ucapan Ditambahkan di versi 1.20.0.

VoiceProfile

Menentukan kelas Profil Suara untuk Pengenalan Pembicara

VoiceProfileCancellationDetails
VoiceProfileClient

Menentukan kelas VoiceProfileClient untuk operasi Pengenalan Pembicara Menangani dari pengguna untuk operasi Profil Suara (misalnya createProfile, deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Format output

VoiceProfilePhraseResult

Format output

VoiceProfileResult

Format output

Antarmuka

CancellationEventArgs
ConversationInfo
IParticipant

Mewakili peserta dalam percakapan. Ditambahkan dalam versi 1.4.0

IPlayer

Mewakili antarmuka pemutar audio untuk mengontrol pemutaran audio, seperti jeda, lanjutkan, dll.

MeetingInfo
VoiceSignature

Enum

AudioFormatTag
CancellationErrorCode

Menentukan kode kesalahan jika CancellationReason adalah Kesalahan. Ditambahkan dalam versi 1.1.0.

CancellationReason

Menentukan kemungkinan alasan hasil pengenalan mungkin dibatalkan.

LanguageIdMode

Mode Identifikasi Bahasa

LogLevel
NoMatchReason

Menentukan kemungkinan alasan hasil pengenalan mungkin tidak dikenali.

OutputFormat

Tentukan format output Speech Recognizer.

ParticipantChangedReason
ProfanityOption

Opsi kata-kata kok. Ditambahkan dalam versi 1.7.0.

PronunciationAssessmentGradingSystem

Menentukan sistem titik untuk kalibrasi skor pengucapan; nilai defaultnya adalah FivePoint. Ditambahkan dalam versi 1.15.0

PronunciationAssessmentGranularity

Mendefinisikan granularitas evaluasi pengucapan; nilai defaultnya adalah Phoneme. Ditambahkan dalam versi 1.15.0

PropertyId

Menentukan id properti ucapan.

ResultReason

Menentukan kemungkinan alasan hasil pengenalan mungkin dihasilkan.

ServicePropertyChannel

Menentukan saluran yang digunakan untuk meneruskan pengaturan properti ke layanan. Ditambahkan dalam versi 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Menentukan jenis batas peristiwa batas sintesis ucapan.

SpeechSynthesisOutputFormat

Tentukan format output audio sintesis ucapan. SpeechSynthesisOutputFormat Diperbarui di versi 1.17.0

VoiceProfileType

Format output