¿Qué es el SDK de Voz?

Article
24/09/2024

El SDK de Voz (kit de desarrollo de software) muestra muchas de las funciones del servicio de Voz, para desarrollar aplicaciones habilitadas para Voz. El SDK de Voz está disponible en muchos lenguajes de programación y en las plataformas. El SDK de Voz es idóneo para los escenarios que funcionan en tiempo real y los que no mediante el uso de dispositivos locales, archivos, Azure Blob Storage y flujos de entrada y de salida.

En algunos casos, no puede o no debe usar el SDK de Voz. En esos casos, puede usar las API REST para acceder al servicio de Voz. Por ejemplo, use la API REST de conversión de voz en texto para la administración de modelos de transcripciones por lotes y habla personalizada.

Idiomas compatibles

El SDK de Voz admite los siguientes lenguajes y plataformas:

Lenguaje de programación	Referencia	Compatibilidad con plataformas
C# ¹	.NET	Windows, Linux, macOS, Mono, Xamarin.iOS, Xamarin.Mac, Xamarin.Android, UWP, Unity
C++ ²	C++	Windows, Linux, macOS
Go	Go	Linux
Java	Java	Android, Windows, Linux, macOS
JavaScript	JavaScript	Browser, Node.js
Objective-C	Objective-C	iOS, macOS
Python	Python	Windows, Linux, macOS
Swift	Objective-C ³	iOS, macOS

^{1 Los ejemplos de código de C# están disponibles en la documentación. El SDK de Voz para C# se basa en .NET Standard 2.0, por lo que es compatible con muchas plataformas y lenguajes de programación. Para más información, consulte la documentación sobre la implementación de .NET.}
^{2 C no es un lenguaje de programación compatible con el SDK de Voz.}
^{3 El SDK de Voz para Swift comparte bibliotecas cliente y documentación de referencia con el SDK de Voz para Objective-C.}

Important

Al descargar cualquiera de los SDK de Azure AI Speech, usted acepta su licencia. Para más información, consulte:

Demo del SDK de voz

En el siguiente vídeo se muestra cómo instalar el SDK de Voz para C# y cómo escribir una aplicación de consola de .NET para conversión de voz en texto.

Ejemplos de código

Los ejemplos de código del SDK de Voz está disponible en la documentación y GitHub.

Ejemplos de documentación

En la parte superior de las páginas de documentación que contienen los ejemplos, las opciones para seleccionar incluyen C#, C++, Go, Java, JavaScript, Objective-C, Python o Swift.

Captura de pantalla que muestra cómo seleccionar un lenguaje de programación en la documentación.

Si un ejemplo no está disponible en el lenguaje de programación preferido, puede seleccionar otro lenguaje de programación para empezar a trabajar y obtener información sobre los conceptos, o bien consulte la referencia y los ejemplos vinculados desde el principio del artículo.

Ejemplos de GitHub

Los ejemplos detallados están disponibles en el repositorio Azure-Samples/cognitive-services-speech-sdk en GitHub. Hay ejemplos para C# (incluidos UWP, Unity y Xamarin), C++, Java, JavaScript (incluido Browser y Node.js), Objective-C, Python y Swift. Los ejemplos de código para Go están disponibles en el repositorio Microsoft/cognitive-services-speech-sdk-go en GitHub.

Opciones de ayuda

Los foros de Microsoft Q&A y Stack Overflow están disponibles para que la comunidad de desarrolladores haga preguntas sobre Azure Cognitive Speech y otros servicios y las responda. Microsoft supervisa los foros y responde a preguntas que la comunidad aún no ha respondido. Para asegurarse de que veamos su pregunta, etiquétela con "azure-speech".

Puede sugerir una idea o notificar un error mediante la creación de un problema en GitHub:

Consulte también el soporte técnico de servicios de Azure AI y las opciones de ayuda para obtener soporte técnico, mantenerse al día, enviar comentarios e informar de errores de servicios de Azure AI.

Comparteix a través de