Se requiere una versión de macOS 10.14 o posterior.
Instale el SDK de Voz para C#
El SDK de voz para C# está disponible como paquete NuGet e implementa el estándar 2.0 de .NET. Para más información, consulte Microsoft.CognitiveServices.Speech.
Creación de un proyecto de Visual Studio e instalación del SDK de Voz
El siguiente paso consiste en instalar el paquete NuGet del SDK de Voz para que pueda hacer referencia a él en el código. Para ello, primero puede ser necesario crear un proyecto helloworld. Si ya tiene un proyecto con la carga de trabajo de desarrollo de escritorio de .NET disponible, puede usar ese proyecto y pasar directamente a Uso del Administrador de paquetes NuGet para instalar el SDK de Voz.
Creación de un proyecto helloworld
Abierto Visual Studio.
En Comenzar, seleccione Crear un nuevo flujo.
En Crear un proyecto, elija Aplicación de consola (.NET Framework) y seleccione Siguiente.
En Configure su nuevo proyecto,para el nombre de proyecto escriba helloworld , elija o cree la ruta de acceso del directorio en Ubicación y seleccione Crear.
En la barra de menús de Visual Studio, seleccione Herramientas>Obtener herramientas y características. Este paso abre el Instalador de Visual Studio y muestra el cuadro de diálogo Modificando.
Compruebe si la carga de trabajo Desarrollo de escritorio de .NET está disponible. Si aún no está instalada la carga de trabajo, selecciónela y elija Modificar para iniciar la instalación. La descarga e instalación pueden tardar unos minutos.
Si la opción Desarrollo de escritorio de .NET ya está seleccionada, elija Cerrar para cerrar el cuadro de diálogo.
Cierre el Instalador de Visual Studio.
Uso del Administrador de paquetes Nuget para instalar el SDK de Voz
En el Explorador de soluciones, haga clic con el botón derecho en el proyecto helloworld y seleccione Administrar paquetes NuGet para mostrar el Administrador de paquetes NuGet.
En la esquina superior derecha, busque el cuadro desplegable Origen del paquete y asegúrese de que nuget.org está seleccionado.
En la esquina superior izquierda, seleccione Examinar.
En el cuadro de búsqueda, escriba Microsoft.CognitiveServices.Speech y seleccione Entrar.
En los resultados de la búsqueda, seleccione el paquete Microsoft.CognitiveServices.Speech y, después, seleccione Instalar para instalar la versión estable más reciente.
Acepte todos los contratos y licencias para iniciar la instalación.
Después de instalar el paquete aparecerá una confirmación en la ventana Consola del administrador de paquetes.
Elección de la arquitectura de destino
Para compilar y ejecutar la aplicación de consola, cree una configuración de plataforma que coincida con la arquitectura del equipo.
En el menú, seleccione Compilar>Administrador de configuración. Aparecerá el cuadro de diálogo Administrador de configuración.
En el cuadro desplegable Plataforma de soluciones activas, seleccione Nuevo. Aparecerá el cuadro de diálogo Nueva plataforma de solución.
En el cuadro desplegable Escriba o seleccione la nueva plataforma:
Si está ejecutando Windows de 64 bits, seleccione x64.
Si está ejecutando Windows de 32 bits, seleccione x86.
Seleccione Aceptar y, después, Cerrar.
Esta guía muestra cómo instalar el SDK de voz para una aplicación de consola .NET Core. .NET Core es una plataforma de .NET multiplataforma de código abierto que implementa la especificación .NET Standard.
Creación de un proyecto de Visual Studio e instalación del SDK de Voz
Inicie Visual Studio 2017.
Asegúrese de que la carga de trabajo Desarrollo multiplataforma de .NET Core esté disponible. Seleccione Herramientas>Obtener herramientas y características en la barra de menús de Visual Studio para abrir el Instalador de Visual Studio. Si esta carga de trabajo ya está habilitada, cierre el cuadro de diálogo.
De lo contrario, seleccione Desarrollo multiplataforma de .NET Core y elija Modificar. La instalación de la nueva característica tardará un momento.
Cree una nueva aplicación de consola de .NET Core de Visual C# en el cuadro de diálogo Nuevo proyecto. En el panel izquierdo, expanda Instalados>Visual C#>.NET Core. Luego, seleccione Aplicación de consola (.NET Framework) . Para el nombre del proyecto, escriba helloworld.
Instale y haga referencia al paquete NuGet del SDK de Voz. En el Explorador de soluciones, haga clic con el botón derecho en la solución y seleccione Manage NuGet Packages for Solution (Administrar paquetes de NuGet para la solución).
Seleccione Examinar y, a continuación, en la esquina superior derecha, para Origen del paquete, seleccione nuget.org.
Busque el paquete Microsoft.CognitiveServices.Speech e instálelo en el proyecto helloworld.
Acepte la licencia que aparece para comenzar la instalación del paquete de NuGet.
Después de instalar el paquete, aparece una confirmación en la consola del Administrador de paquetes.
En esta guía se muestra cómo instalar el SDK de Voz para Unity.
Para el desarrollo de Unity, el SDK de voz es compatible con Windows Desktop (x86 y x64) o con la Plataforma universal de Windows (x86, x64, ARM/ARM64), Android (x86, ARM32/64), iOS (simulador x64 y ARM64) y Mac (x64).
En Android, un dispositivo Android basado en ARM (API 23: Android 6.0 Marshmallow o posterior) habilitado para el desarrollo con un micrófono que funcione.
En iOS, un dispositivo iOS (ARM64) habilitado para el desarrollo con un micrófono que funcione.
En macOS, un dispositivo Mac (x64) y la versión LTS más reciente de Unity 2019 (o posterior) para la compatibilidad integrada con acceso al micrófono en la configuración del reproductor de Unity.
Instale el SDK de Voz para Unity
Para instalar Speech SDK para Unity, siga estos pasos:
Descargue y abra el SDK de Voz para Unity. El SDK se empaqueta como un paquete de recursos de Unity (.unitypackage) y ya debe estar asociado a Unity. Cuando se abra el paquete de recursos, aparecerá el cuadro de diálogo Import Unity Package (Importar paquete de Unity). Es posible que tenga que crear y abrir un proyecto vacío para que funcione este paso.
Asegúrese de que se seleccionan todos los archivos y seleccione Import (Importar). Transcurridos unos instantes, el paquete de recursos de Unity se importa en el proyecto.
Para más información sobre la importación de paquetes de recursos en Unity, consulte la documentación de Unity.
Esta guía muestra cómo crear un proyecto de la Plataforma universal de Windows (UWP) e instalar el SDK de voz para C#. La Plataforma universal de Windows permite desarrollar aplicaciones que se ejecutan en cualquier dispositivo que admite Windows 10, incluidos PC, Xbox, Surface Hub y otros dispositivos.
Creación de un proyecto de Visual Studio e instalación del SDK de Voz
Para crear un proyecto de Visual Studio para el desarrollo de UWP, es necesario:
Configurar las opciones de desarrollo de Visual Studio.
Crear el proyecto y seleccionar la arquitectura de destino.
Configurar la captura de audio.
Instalar el SDK de Voz.
Configuración de las opciones de desarrollo de Visual Studio
Asegúrese de que Visual Studio está configurado correctamente para el desarrollo para UWP:
Abra Visual Studio para mostrar la ventana de inicio.
Seleccione Continuar sin código para ir al IDE de Visual Studio.
En la barra de menús de Visual Studio, seleccione Herramientas>Get Tools and Features (Obtener herramientas y características) para abrir el Instalador de Visual Studio y ver el cuadro de diálogo Modificar.
En la pestaña Cargas de trabajo, busque la carga de trabajo Desarrollo de la Plataforma universal de Windows. Si esa carga de trabajo ya está seleccionada, cierre el cuadro de diálogo Modificando y cierre el Instalador de Visual Studio. Omita el resto del procedimiento.
Seleccione Desarrollo de la Plataforma universal de Windows y elija Modificar.
En el cuadro de diálogo Antes de comenzar, seleccione Continuar para instalar la carga de trabajo de desarrollo para UWP. La instalación de la nueva característica puede tardar un rato.
Cierre el Instalador de Visual Studio.
Creación del proyecto
A continuación, cree el proyecto y seleccione la arquitectura de destino:
En la barra de menús de Visual Studio, seleccione Archivo>Nuevo>Proyecto para mostrar la ventana Crear un nuevo proyecto.
Busque y seleccione Aplicación vacía (Windows universal) . Asegúrese de seleccionar la versión de C# de este tipo de proyecto, en lugar de Visual Basic.
Seleccione Siguiente.
En el cuadro de diálogo Configurar el nuevo proyecto, en Nombre del proyecto, escriba helloworld.
En Ubicación, vaya a la carpeta en la que desea guardar el proyecto y selecciónela o créela.
Seleccione Crear.
En la ventana Nuevo proyecto de la Plataforma universal de Windows, en Versión mínima (segundo cuadro desplegable), seleccione Windows 10 Fall Creators Update (10.0; compilación 16299). Este es el requisito mínimo para el SDK de Voz.
En Versión de destino (primer cuadro desplegable), elija un valor idéntico o posterior al valor de Versión mínima.
Seleccione Aceptar. Vuelve al IDE de Visual Studio, con el nuevo proyecto creado y visible en el panel Explorador de soluciones.
Seleccione la arquitectura de la plataforma de destino. En la barra de herramientas de Visual Studio, busque el cuadro desplegable Plataformas de solución. Si no lo ve, seleccione Ver>Barra de herramientas>Estándar para mostrar la barra de herramientas que contiene Plataformas de solución.
Si está ejecutando Windows de 64 bits, seleccione x64 en el cuadro desplegable. Windows de 64 bits puede ejecutar también aplicaciones de 32 bits, por lo que puede elegir x86, si lo prefiere.
Nota
El SDK de Voz es compatible con todos los procesadores compatibles con Intel, pero solo con las versiones x64 de los procesadores ARM.
Configuración de la captura de audio
Deje que el proyecto capture la entrada de audio:
En el Explorador de soluciones, seleccione Package.appxmanifest para abrir el manifiesto de aplicación del paquete.
Seleccione la pestaña Funcionalidades y, a continuación, seleccione la funcionalidad Micrófono.
En la barra de menús, seleccione Archivo>Guardar Package.appxmanifest para guardar los cambios.
En el Explorador de soluciones, haga clic con el botón derecho en la solución y seleccione Manage NuGet Packages for Solution para ir a la ventana NuGet: solución.
Haga clic en Examinar. En Origen del paquete, seleccione nuget.org.
En el cuadro de búsqueda, escriba Microsoft.CognitiveServices.Speech. Seleccione ese paquete después de que aparezca en los resultados de la búsqueda.
En el panel de estado del paquete situado junto a los resultados de la búsqueda, seleccione el proyecto HelloWorld.
Seleccione Instalar.
En el cuadro de diálogo Vista previa de los cambios, seleccione Aplicar.
En el cuadro de diálogo Aceptación de licencia, vea la licencia y, a continuación, seleccione Acepto. Comenzará la instalación del paquete.
Una vez completada la instalación, el panel Salida muestra un mensaje similar al texto siguiente: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
En esta guía se muestra cómo crear un proyecto de formularios de Xamarin e instalar el SDK de voz. Xamarin es una plataforma de código abierto para compilar aplicaciones modernas y de alto rendimiento para iOS, Android y Windows mediante .NET.
Para el desarrollo para Xamarin, el SDK de voz admite:
Escritorio de Windows x86 y x64
Plataforma universal de Windows x86, x64, ARM/ARM64
Creación de un proyecto de Visual Studio e instalación del SDK de Voz
Para crear un proyecto de Visual Studio para el desarrollo de aplicaciones móviles multiplataforma con .NET y Xamarin, debe:
Configurar las opciones de desarrollo de Visual Studio.
Crear el proyecto y seleccionar la arquitectura de destino.
Instalar el SDK de Voz.
Configuración de las opciones de desarrollo de Visual Studio
Asegúrese de que Visual Studio está configurado correctamente para el desarrollo para dispositivos móviles multiplataforma con .NET:
Abra Visual Studio 2019. A continuación, seleccione Continuar sin código.
En la barra de menús de Visual Studio, seleccione Herramientas>Obtener herramientas y características para abrir el Instalador de Visual Studio y ver el cuadro de diálogo Modificando.
En la pestaña Cargas de trabajo, busque la carga de trabajo Desarrollo para dispositivos móviles con .NET. Si esa carga de trabajo ya está seleccionada, cierre el cuadro de diálogo Modificando y cierre el Instalador de Visual Studio. Omita el resto del procedimiento.
Seleccione Desarrollo para dispositivos móviles con .NET y elija Modificar.
En el cuadro de diálogo Antes de comenzar, seleccione Continuar para instalar la carga de trabajo de desarrollo para dispositivos móviles con .NET. La instalación de la nueva característica puede tardar un rato.
Cierre el Instalador de Visual Studio.
Creación del proyecto
A continuación, cree el proyecto y seleccione la arquitectura de destino:
En la barra de menús de Visual Studio, seleccione Archivo>Nuevo>Proyecto para mostrar la ventana Crear un nuevo proyecto.
Busque y seleccione Aplicación móvil (Xamarin.Forms) .
Seleccione Next (Siguiente).
En el cuadro de diálogo Configurar el nuevo proyecto, en Nombre del proyecto, escriba helloworld.
En Ubicación, vaya a la carpeta en la que desea guardar el proyecto y selecciónela o créela.
Seleccione Crear.
En la ventana New Cross Platform App (Nueva aplicación multiplataforma), seleccione la plantilla en blanco y, a continuación, seleccione Android, iOS, y Windows (UWP). Seleccione Crear.
Seleccione Aceptar. Vuelve al IDE de Visual Studio, con el nuevo proyecto creado y visible en el panel Explorador de soluciones.
Seleccione la arquitectura de la plataforma de destino y el proyecto de inicio. En la barra de herramientas de Visual Studio, busque el cuadro desplegable Plataformas de solución. Si no lo ve, seleccione Ver>Barra de herramientas>Estándar para mostrar la barra de herramientas que contiene Plataformas de solución.
Si está ejecutando Windows de 64 bits, seleccione x64 en el cuadro desplegable. Puede seleccionar x86 si lo desea porque Windows de 64 bits también puede ejecutar aplicaciones de 32 bits.
En el cuadro desplegable Proyectos de inicio, seleccione helloworld.UWP (Windows universal).
En el Explorador de soluciones, haga clic con el botón derecho en la solución. Seleccione Administrar paquetes NuGet para la solución para ir a la ventana NuGet - Solución.
Haga clic en Examinar.
En Origen del paquete, seleccione nuget.org.
En el cuadro de búsqueda, escriba Microsoft.CognitiveServices.Speech. A continuación, seleccione ese paquete después de que aparezca en los resultados de la búsqueda.
Nota
La biblioteca de iOS dentro del paquete NuGet Microsoft.CognitiveServices.Speech no tiene bitcode habilitado. Si necesita la biblioteca de bitcode en la aplicación, use el paquete NuGet Microsoft.CognitiveServices.Speech.Xamarin.iOS específicamente para el proyecto de iOS.
En el panel de estado del paquete situado junto a los resultados de la búsqueda, seleccione todos los proyectos.
Seleccione Instalar.
En el cuadro de diálogo Vista previa de los cambios, seleccione Aceptar.
En el cuadro de diálogo Aceptación de licencia, vea la licencia y, a continuación, seleccione Acepto. Instale la referencia de paquete del SDK de Voz en todos los proyectos.
Una vez completada correctamente la instalación, es posible que vea la siguiente advertencia para helloworld.iOS. Esta advertencia es un problema conocido y no debe afectar a la funcionalidad de la aplicación.
Could not resolve reference "C:\Users\Default\.nuget\packages\microsoft.cognitiveservices.speech\1.7.0\build\Xamarin.iOS\libMicrosoft.CognitiveServices.Speech.core.a". If this reference is required by your code, you may get compilation errors.
El SDK de Voz ya está instalado. Ahora puede eliminar o volver a usar el proyecto helloworld que creó en los pasos anteriores.
Elija un directorio para los archivos del SDK de Voz. Establezca la variable de entorno SPEECHSDK_ROOT para que apunte a ese directorio. Esta variable facilita la referencia al directorio en futuros comandos.
Para usar el directorio speechsdk en el directorio principal, ejecute el siguiente comando:
export SPEECHSDK_ROOT="$HOME/speechsdk"
Si no existe el directorio, créelo:
mkdir -p "$SPEECHSDK_ROOT"
Descargue y extraiga el archivo .tar.gz que contiene los archivos binarios del SDK de voz:
Valide el contenido del directorio de nivel superior del paquete extraído:
ls -l "$SPEECHSDK_ROOT"
La lista de directorios debe contener los archivos de licencia y aviso del asociado. La lista debe contener también un directorio include que contenga archivos de encabezado (.h) y un directorio lib que contenga bibliotecas para arm32, arm64, x64 y x86.
Ruta de acceso
Descripción
license.md
Licencia
ThirdPartyNotices.md
Avisos de asociados
REDIST.txt
Aviso de redistribución
include
Archivos de encabezado necesarios para C++
lib/arm32
Biblioteca nativa para ARM32 necesaria para vincular la aplicación
lib/arm64
Biblioteca nativa para ARM64 necesaria para vincular la aplicación
lib/x64
Biblioteca nativa para x64 necesaria para vincular la aplicación
lib/x86
Biblioteca nativa para x86 necesaria para vincular la aplicación
Elija un directorio para los archivos del SDK de Voz. Establezca la variable de entorno SPEECHSDK_ROOT para que apunte a ese directorio. Esta variable facilita la referencia al directorio en futuros comandos.
Para usar el directorio speechsdk en el directorio principal, ejecute el siguiente comando:
export SPEECHSDK_ROOT="$HOME/speechsdk"
Si no existe el directorio, créelo:
mkdir -p "$SPEECHSDK_ROOT"
Descargue y extraiga el archivo .zip que contiene el paquete XCFramework del SDK de voz:
Creación de un proyecto en Visual Studio e instalación del SDK de voz
Para crear un proyecto de Visual Studio para el desarrollo de escritorio de C++, es necesario:
Configurar las opciones de desarrollo de Visual Studio.
Crear el proyecto.
Seleccionar la arquitectura de destino.
Instalar el SDK de Voz.
Configuración de las opciones de desarrollo de Visual Studio
Para empezar, asegúrese de que Visual Studio está configurado correctamente para el desarrollo de escritorio de C++:
Abra Visual Studio 2019 para mostrar la ventana de inicio.
Seleccione Continuar sin código para ir al IDE de Visual Studio.
En la barra de menús de Visual Studio, seleccione Herramientas>Get Tools and Features (Obtener herramientas y características) para abrir el Instalador de Visual Studio y ver el cuadro de diálogo Modificar.
En la pestaña Cargas de trabajo, en Windows, busque la carga de trabajo Desarrollo para el escritorio con C++. Si no está seleccionada esa carga de trabajo, selecciónela.
En la pestaña Componentes individuales, busque Administrador de paquetes NuGet. Si no está ya seleccionado, selecciónelo.
Seleccione Cerrar o Modificar. El nombre del botón varía en función de si seleccionó alguna característica para la instalación.
Si selecciona Modificar, comenzará la instalación. Este proceso puede tardar unos minutos.
Cierre el Instalador de Visual Studio.
Creación del proyecto
A continuación, cree el proyecto y seleccione la arquitectura de destino:
En la barra de menús de Visual Studio, seleccione Archivo>Nuevo>Proyecto para mostrar la ventana Crear un nuevo proyecto.
Busque y seleccione Aplicación de consola. Asegúrese de seleccionar la versión de C++ de este tipo de proyecto, en lugar de C# o de Visual Basic.
Seleccione Next (Siguiente).
En el cuadro de diálogo Configurar el nuevo proyecto, en Nombre del proyecto, escriba helloworld.
En Ubicación, seleccione o cree la carpeta en la que desea guardar el proyecto y elija Crear.
Seleccione la arquitectura de la plataforma de destino. En la barra de herramientas de Visual Studio, busque el cuadro desplegable Plataformas de solución. Si no lo ve, seleccione Ver>Barra de herramientas>Estándar para mostrar la barra de herramientas que contiene Plataformas de solución.
Si está ejecutando Windows de 64 bits, seleccione x64 en el cuadro desplegable. Windows de 64 bits puede ejecutar también aplicaciones de 32 bits, por lo que puede elegir x86, si lo prefiere.
En el Explorador de soluciones, haga clic con el botón derecho en la solución y seleccione Manage NuGet Packages for Solution (Administrar paquetes NuGet para la solución) para ir a la ventana NuGet - Solución.
Haga clic en Examinar.
En Origen del paquete, seleccione nuget.org.
En el cuadro de búsqueda, escriba Microsoft.CognitiveServices.Speech. Seleccione ese paquete después de que aparezca en los resultados de la búsqueda.
En el panel de estado del paquete situado junto a los resultados de la búsqueda, seleccione el proyecto HelloWorld.
Seleccione Instalar.
En el cuadro de diálogo Vista previa de los cambios, seleccione Aceptar.
En el cuadro de diálogo Aceptación de licencia, vea la licencia y, a continuación, seleccione Acepto. Comenzará la instalación del paquete. Una vez completada la instalación, el panel Salida muestra un mensaje similar al texto siguiente: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
Elija un directorio para los archivos del SDK de Voz. Establezca la variable de entorno SPEECHSDK_ROOT para que apunte a ese directorio. Esta variable facilita la referencia al directorio en futuros comandos.
Para usar el directorio speechsdk en el directorio principal, ejecute el siguiente comando:
export SPEECHSDK_ROOT="$HOME/speechsdk"
Si no existe el directorio, créelo:
mkdir -p "$SPEECHSDK_ROOT"
Descargue y extraiga el archivo .tar.gz que contiene los archivos binarios del SDK de voz:
Valide el contenido del directorio de nivel superior del paquete extraído:
ls -l "$SPEECHSDK_ROOT"
La lista de directorios debe contener los archivos de licencia y aviso del asociado. La lista debe contener también un directorio include que contenga archivos de encabezado (.h) y un directorio lib que contenga bibliotecas para arm32, arm64, x64 y x86.
Ruta de acceso
Descripción
license.md
Licencia
ThirdPartyNotices.md
Avisos de asociados
REDIST.txt
Aviso de redistribución
include
Archivos de encabezado necesarios para C++
lib/arm32
Biblioteca nativa para ARM32 necesaria para vincular la aplicación
lib/arm64
Biblioteca nativa para ARM64 necesaria para vincular la aplicación
lib/x64
Biblioteca nativa para x64 necesaria para vincular la aplicación
lib/x86
Biblioteca nativa para x86 necesaria para vincular la aplicación
Configuración del entorno de Go
Los pasos siguientes permiten configurar el entorno de Go para buscar el SDK de Voz.
Dado que los enlaces se basan en cgo, es necesario que establezca las variables de entorno para que Go pueda encontrar el SDK.
Algunas de las instrucciones usan una versión específica del SDK, como 1.24.2. Para comprobar la versión más reciente, busque nuestro repositorio de GitHub.
En el selector de Eclipse, en el cuadro Área de trabajo, escriba el nombre de un nuevo directorio de área de trabajo. Luego, seleccione Launch (Iniciar).
Al cabo de unos segundos, aparece la ventana principal del IDE de Eclipse. Cierre la pantalla de bienvenida si hay alguna.
En el menú de Eclipse, seleccione Archivo>Nuevo> Proyecto.
Aparecerá el cuadro de diálogo Nuevo proyecto. Seleccione Proyecto de Java y, a continuación, seleccione Siguiente.
Se inicia el asistente para nuevo proyecto de Java. En el campo Nombre del proyecto, escriba quickstart. Elija JavaSE-1.8 como entorno de ejecución. Seleccione Finalizar.
Si aparece una ventana titulada Open Associated Perspective? (¿Abrir perspectiva asociada?), seleccione Open Perspective (Abrir perspectiva).
En el Explorador de paquetes, haga clic en el proyecto quickstart. Seleccione Configurar>Conversión a proyecto Maven en el menú contextual.
Aparece la ventana Create new POM (Crear nuevo POM). En el campo Identificador de grupo, escriba com.microsoft.cognitiveservices.speech.samples. En el campo Identificador de artefacto, escriba quickstart. Después, seleccione Finalizar.
Abra el archivo pom.xml y edítelo:
Agregue un dependencies elemento al final del archivo, antes de la etiqueta de cierre </project>, con el SDK de Voz como una dependencia:
En esta guía se muestra cómo instalar el SDK de Voz para Java en Android.
El SDK de Voz para Android está empaquetado como un archivo Android Archive (AAR), que incluye las bibliotecas necesarias, así como los permisos necesarios de Android.
Instalación del SDK de Voz mediante Android Studio
Cree un proyecto en Android Studio y agregue el SDK de Voz para Java como dependencia de biblioteca. La configuración se basa en el paquete de Maven de SDK de voz y Android Studio Chipmunk 2021.2.1.
Creación de un proyecto vacío
Abra Android Studio y seleccione Proyecto nuevo.
En la ventana Nuevo proyecto que aparece, seleccione Teléfono y tablet>Actividad vacía y, a continuación, seleccione Siguiente.
Escriba SpeechQuickstart en el cuadro de texto Nombre.
En el cuadro de texto de Nombre del paquete, escriba samples.speech.cognitiveservices.microsoft.com.
Seleccione un directorio de proyecto en el cuadro de selección Guardar ubicación.
Seleccione Java en el cuadro de selección Lenguaje.
Seleccione API 23: Android 6.0 (Marshmallow) en el cuadro de selección Nivel mínimo de API.
Seleccione Finalizar.
Android Studio tarda algún tiempo en preparar su nuevo proyecto. La primera vez que utilice Android Studio, puede que le lleve unos minutos establecer las preferencias, aceptar las licencias y completar el asistente.
Instale el SDK de Voz para Java en Android
Agregue el SDK de voz como una dependencia en el proyecto.
Select Archivo>Estructura del proyecto>Dependencias>aplicación.
Seleccione el símbolo más (+) para agregar una dependencia en Dependencias declaradas. A continuación, seleccione Dependencia de la biblioteca en el menú desplegable.
En la ventana Agregar dependencia de biblioteca que aparece, escriba el nombre y la versión del SDK de Voz para Java: com.microsoft.cognitiveservices.speech:client-sdk:1.40.0. Luego, seleccione Buscar.
Asegúrese de que el identificador de grupo seleccionado es com.microsoft.cognitiveservices.speech y, a continuación, seleccione Aceptar.
Seleccione OK (Aceptar) para cerrar la ventana de la estructura del proyecto y aplicar los cambios al proyecto.
Comprenda las implicaciones arquitectónicas entre Node.js y los exploradores web cliente. Por ejemplo, Document Object Model (DOM) no está disponible para aplicaciones del lado servidor. El sistema de archivos de Node.js no está disponible para las aplicaciones del lado cliente.
Instale el SDK de Voz para JavaScript
En función del entorno de destino, use una de las siguientes guías:
En esta guía se muestra cómo instalar el SDK de Voz para JavaScript para su uso con una página web.
Desempaquetar en una carpeta
Cree una nueva carpeta vacía. Si desea hospedar el ejemplo en un servidor web, asegúrese de que este puede acceder a la carpeta.
Descargue el SDK de Voz en forma de paquete .zip y desempaquételo en la carpeta recién creada. Estos archivos se descomprimen:
microsoft.cognitiveservices.speech.sdk.bundle.js: una versión legible del SDK de Voz.
microsoft.cognitiveservices.speech.sdk.bundle.js.map: un archivo de asignación que se usa para depurar el código del SDK.
microsoft.cognitiveservices.speech.sdk.bundle.d.ts: definiciones de objeto para su uso con TypeScript.
microsoft.cognitiveservices.speech.sdk.bundle-min.js: una versión reducida del SDK de Voz.
speech-processor.js: código para mejorar el rendimiento en algunos exploradores.
Cree un nuevo archivo en la carpeta llamado index.html y ábralo con un editor de texto.
Etiqueta de script HTML
Descargue y extraiga el archivo microsoft.cognitiveservices.speech.sdk.bundle.js del SDK de voz para JavaScript. Colóquelo en una carpeta a la que pueda acceder el archivo HTML.
Si el destino es un explorador web y se usa la etiqueta <script>, el prefijo sdk no es necesario. El prefijo sdk es un alias que se usa para asignar un nombre al módulo require.
Como alternativa, puede incluir directamente una etiqueta <script> en el elemento HTML <head>, basándose en la JSDelivr.
El SDK de voz para Objective-C está disponible de forma nativa como paquete CocoaPod para Mac x64 y sistemas basados en ARM.
Requisitos del sistema para Mac:
macOS 10.14, o cualquier versión posterior
El paquete CocoaPod de macOS está disponible para descargarlo y usarlo con el entorno de desarrollo integrado (IDE) Xcode 9.4.1 o posterior.
Vaya al directorio Xcode donde se encuentra el archivo del proyecto .xcodeproj.
Ejecute pod init para crear un archivo de pod denominado Podfile.
Reemplace el contenido de Podfile por el siguiente contenido. Actualice el nombre target de AppName al nombre de la aplicación. Actualice la versión de la plataforma o del pod según sea necesario.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
end
Ejecute pod install para instalar el SDK de voz.
Como alternativa, descargue el CocoaPod binario y extraiga su contenido. En el proyecto de Xcode, agregue una referencia a la carpeta extraída MicrosoftCognitiveServicesSpeech.xcframework y su contenido.
Nota:
Los desarrolladores de .NET pueden compilar aplicaciones nativas de macOS mediante el marco de trabajo de la aplicación de Xamarin.Mac. Para más información, consulte Xamarin.Mac.
El SDK de voz para Objective-C está disponible de forma nativa como paquete CocoaPod.
Requisitos del sistema para iOS:
macOS 10.14, o cualquier versión posterior
iOS de destino 9.3 o posterior
El paquete CocoaPod de macOS está disponible para descargarlo y usarlo con el entorno de desarrollo integrado (IDE) Xcode 9.4.1 o posterior.
Vaya al directorio Xcode donde se encuentra el archivo del proyecto .xcodeproj.
Ejecute pod init para crear un archivo de pod denominado Podfile.
Reemplace el contenido de Podfile por el siguiente contenido. Actualice el nombre target de AppName al nombre de la aplicación. Actualice la versión de la plataforma o del pod según sea necesario.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.40.0'
end
Ejecute pod install para instalar el SDK de voz.
Como alternativa, descargue el CocoaPod binario y extraiga su contenido. En el proyecto de Xcode, agregue una referencia a la carpeta extraída MicrosoftCognitiveServicesSpeech.xcframework y su contenido.
Nota:
Los desarrolladores de .NET pueden compilar aplicaciones nativas de iOS mediante el marco de trabajo de la aplicación de Xamarin.iOS. Para obtener más información, consulte Xamarin.iOS.
El SDK de voz para Swift está disponible de forma nativa como paquete CocoaPod para sistemas Mac basados en x64 y ARM.
Requisitos del sistema para Mac:
macOS 10.14, o cualquier versión posterior
El paquete CocoaPod de macOS está disponible para descargarlo y usarlo con el entorno de desarrollo integrado (IDE) Xcode 9.4.1 o posterior.
Vaya al directorio Xcode donde se encuentra el archivo del proyecto .xcodeproj.
Ejecute pod init para crear un archivo de pod denominado Podfile.
Reemplace el contenido de Podfile por el siguiente contenido. Actualice el nombre target de AppName al nombre de la aplicación. Actualice la versión de la plataforma o del pod según sea necesario.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
end
Ejecute pod install para instalar el SDK de voz.
Como alternativa, descargue el CocoaPod binario y extraiga su contenido. En el proyecto de Xcode, agregue una referencia a la carpeta extraída MicrosoftCognitiveServicesSpeech.xcframework y su contenido.
Nota:
Los desarrolladores de .NET pueden compilar aplicaciones nativas de macOS mediante el marco de trabajo de la aplicación de Xamarin.Mac. Para más información, consulte Xamarin.Mac.
El SDK de voz para Swift está disponible de forma nativa como paquete CocoaPod.
Requisitos del sistema para iOS:
macOS 10.14, o cualquier versión posterior
iOS de destino 9.3 o posterior
El paquete CocoaPod de macOS está disponible para descargarlo y usarlo con el entorno de desarrollo integrado (IDE) Xcode 9.4.1 o posterior.
Vaya al directorio Xcode donde se encuentra el archivo del proyecto .xcodeproj.
Ejecute pod init para crear un archivo de pod denominado Podfile.
Reemplace el contenido de Podfile por lo siguiente. Actualice el nombre target de AppName al nombre de la aplicación. Actualice la versión de la plataforma o del pod según sea necesario.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.40.0'
end
Ejecute pod install para instalar el SDK de voz.
Como alternativa, descargue el CocoaPod binario y extraiga su contenido. En el proyecto de Xcode, agregue una referencia a la carpeta extraída MicrosoftCognitiveServicesSpeech.xcframework y su contenido.
Nota:
Los desarrolladores de .NET pueden compilar aplicaciones nativas de iOS mediante el marco de trabajo de la aplicación de Xamarin.iOS. Para obtener más información, consulte Xamarin.iOS.
Asegúrese de que están instalados los paquetes de la misma arquitectura de destino. Por ejemplo, si instala el paquete redistribuible x64, instale el paquete de Python x64.
El SDK de voz para Python es compatible con las siguientes distribuciones en las arquitecturas x64 y ARM64:
Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0
Importante
Use la versión LtS más reciente de la distribución de Linux. Por ejemplo, si usa Ubuntu 20.04 LTS, use la versión más reciente de Ubuntu 20.04.X.
El SDK de Voz depende de las siguientes bibliotecas del sistema Linux:
Las bibliotecas compartidas de la biblioteca GNU C, incluida la biblioteca de programación de hilos POSIX, libpthreads.
La biblioteca OpenSSL, versión 1.x (libssl1) o 3.x (libssl3), y certificados (ca-certificates).
La biblioteca compartida para aplicaciones ALSA (libasound2).
Para comprobar la instalación, abra un terminal y ejecute el comando python --version. Si Python se instala correctamente, obtiene una respuesta como Python 3.8.10.
Si usa macOS o Linux, es posible que tenga que ejecutar el comando python3 --version en su lugar.
Para habilitar el uso de python, en lugar de python3, ejecute alias python='python3' para configurar un alias. Los ejemplos de inicio rápido del SDK de Voz especifican el uso de python.
Puede comprobar qué versión del SDK de voz para Python está instalada actualmente mediante la inspección de la variable azure.cognitiveservices.speech.__version__. Por ejemplo, ejecute este comando en una ventana de consola:
pip list
Instalación del SDK de Voz mediante Visual Studio Code