Le SDK Speech pour C# prend en charge seulement Ubuntu 18.04/20.04/22.04, Debian 10/11, Red Hat Enterprise Linux (RHEL) 7/8 et CentOS 7/8 sur les architectures suivantes lorsqu’elles sont utilisées avec Linux : x64, ARM32 (Debian/Ubuntu) et ARM64 (Debian/Ubuntu)
Important
Utilisez la version LTS la plus récente de la distribution Linux. Par exemple, si vous utilisez Ubuntu 20.04 LTS, utilisez la dernière version d’Ubuntu 20.04.X.
Le SDK Speech dépend des bibliothèques système Linux suivantes :
Les bibliothèques partagées de la bibliothèque C de GNU, notamment la bibliothèque de programmation POSIX Threads, libpthreads
La bibliothèque OpenSSL (libssl) version 1.x et les certificats (ca-certificates)
La bibliothèque partagée pour les applications ALSA (libasound)
Vous devez également installer ca-certificates pour établir un websocket sécurisé et éviter l’erreur WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED.
Important
Le Kit de développement logiciel (SDK) Speech ne prend pas en charge OpenSSL 3.0, service par défaut dans Ubuntu 22.04 et Debian 12.
Pour installer OpenSSL 1.x à partir de sources sur des systèmes Debian/Ubuntu qui ne l’ont pas, procédez comme suit :
wget -O - https://www.openssl.org/source/openssl-1.1.1u.tar.gz | tar zxf -
cd openssl-1.1.1u
./config --prefix=/usr/local
make -j $(nproc)
sudo make install_sw install_ssldirs
sudo ldconfig -v
export SSL_CERT_DIR=/etc/ssl/certs
Le paramètre de SSL_CERT_DIR doit être en vigueur à l’échelle du système ou au moins dans la console à partir de laquelle les applications qui utilisent le SDK Speech sont lancées. Sinon, OpenSSL 1.x installé dans /usr/local risque de ne pas trouver de certificats.
Assurez-vous que la sortie de la console de ldconfig -v inclut /usr/local/lib, comme il se doit par défaut sur les systèmes modernes. Si ce n’est pas le cas, définissez LD_LIBRARY_PATH (avec la même étendue que SSL_CERT_DIR) pour ajouter /usr/local/lib au chemin de bibliothèque :
Pour utiliser le Kit de développement logiciel (SDK) Speech dans Alpine Linux, créez un environnement chroot Debian comme décrit dans le wiki Alpine Linux sur l’exécution de programmes glibc. Suivez ensuite les instructions relatives à Debian fournies ici.
Le kit de développement logiciel (SDK) Speech pour C# est disponible en tant que package NuGet et implémente .NET Standard 2.0. Pour plus d’informations, consultez Microsoft.CognitiveServices.Speech.
Dans la fenêtre Démarrer, sélectionnez Créer un projet.
Dans la fenêtre Créer un projet, choisissez Application console (.NET Framework), puis cliquez sur Suivant.
Dans la fenêtre Configurer votre nouveau projet, entrez helloworld dans Nom du projet, choisissez ou créez le chemin du répertoire dans Emplacement, puis sélectionnez Créer.
Dans la barre de menus de Visual Studio, sélectionnez Outils>Obtenir les outils et fonctionnalités. Cette étape ouvre Visual Studio Installer et fait apparaître la boîte de dialogue Modification.
Vérifiez si la charge de travail Développement .NET Desktop est disponible. Si cette charge de travail n’a pas été installée, cochez la case en regard de celle-ci, puis sélectionnez Modifier pour démarrer l’installation. Le téléchargement et l’installation peuvent prendre quelques minutes.
Si la case en regard de Développement .NET Desktop est déjà cochée, sélectionnez Fermer pour fermer la boîte de dialogue.
Fermez Visual Studio Installer.
Utiliser le gestionnaire de package NuGet pour installer le Kit de développement logiciel (SDK) Speech
Dans l’Explorateur de solutions, cliquez avec le bouton droit sur le projet helloworld, puis sélectionnez Gérer les packages NuGet pour afficher le gestionnaire de package NuGet.
Dans l’angle supérieur droit, recherchez la zone de liste déroulante Source du package et vérifiez que nuget.org est sélectionné.
Dans l’angle supérieur gauche, sélectionnez Parcourir.
Dans la zone de recherche, tapez Microsoft.CognitiveServices.Speech et appuyez sur la touche Entrée.
Dans les résultats de la recherche, sélectionnez le package Microsoft.CognitiveServices.Speech, puis sélectionnez Installer pour installer la dernière version stable.
Acceptez tous les contrats et licences pour démarrer l’installation.
Une fois le package installé, un message de confirmation s’affiche dans la fenêtre Console du Gestionnaire de package.
Choisir l’architecture cible
Pour générer et exécuter l’application console, créez une configuration de plateforme correspondant à l’architecture de votre ordinateur.
Dans la barre de menus, sélectionnez Générer>Gestionnaire de configurations. La boîte de dialogue Gestionnaire de configurations s’affiche.
Dans la zone de liste déroulante Plateforme de la solution active, sélectionnez Nouveau. La boîte de dialogue Nouvelle plateforme de solution s’affiche.
Dans la zone de liste déroulante Tapez ou sélectionnez la nouvelle plateforme :
Si vous exécutez Windows 64 bits, sélectionnez x64.
Si vous exécutez Windows 32 bits, sélectionnez x86.
Sélectionnez OK, puis Fermer.
Ce guide explique comment installer le Kit de développement logiciel (SDK) Speech pour une application console .NET Core. .NET Core est une plateforme .NET à vocation multiplateforme, open source, qui implémente la spécification .NET Standard.
Créer un projet Visual Studio et installer le Kit de développement logiciel (SDK) Speech
Démarrez Visual Studio 2019.
Assurez-vous que la charge de travail Développement multiplateforme .NET Core est disponible. Sélectionnez Outils>Obtenir les outils et fonctionnalités dans la barre de menus de Visual Studio pour ouvrir le programme d’installation de Visual Studio. Si cette charge de travail est déjà activée, fermez la boîte de dialogue.
Sinon, cochez la case en regard de Développement multiplateforme .NET Core et sélectionnez Modifier dans l’angle inférieur droit la boîte de dialogue. L’installation de la nouvelle fonctionnalité prend quelques instants.
Créez une application console .NET Core Visual C#. Dans le volet gauche de la boîte de dialogue Nouveau projet, développez Installés>Visual C#>.NET Core. Ensuite, sélectionnez Application console (.NET Core) . Pour le nom du projet, entrez helloworld.
En haut à droite, dans le champ Source du package, sélectionnez nuget.org. Recherchez le package Microsoft.CognitiveServices.Speech et installez-le dans le projet helloworld.
Acceptez la licence affichée pour commencer l’installation du package NuGet.
Une fois le package installé, un message de confirmation s’affiche dans la console du Gestionnaire de package.
Pour le développement d’Unity, le SDK Speech prend en charge Windows Desktop (x86 et x64) ou la plateforme Windows universelle (x86, x64, ARM/ARM64), Android (x86, ARM32/64), iOS (simulateur x64 et ARM64) et Mac (x64).
Sur Android, activez un appareil Android ARM (API 23 : Android 6.0 Marshmallow ou version ultérieure) pour le développement avec un microphone opérationnel.
Sur iOS, activez un appareil iOS (ARM64) pour le développement avec un microphone opérationnel.
Sur macOS, vous avez besoin d’un appareil Mac (x64) et de la dernière version LTS de Unity 2019 (ou version ultérieure) pour la prise en charge intégrée de l’accès au microphone dans les paramètres du lecteur Unity.
Installer le Kit SDK Speech pour Unity
Pour installer le SDK Speech pour Unity, procédez comme suit :
Téléchargez et ouvrez le Kit de développement logiciel (SDK) Speech pour Unity. Il est empaqueté sous forme de package de ressources Unity (.unitypackage) et doit déjà être associé à Unity. Une fois le package de ressources ouvert, la boîte de dialogue Import Unity Package s’affiche. Pour que cette étape fonctionne, il devrez peut-être créer et ouvrir un projet vide.
Vérifiez que tous les fichiers sont sélectionnés, puis sélectionnez Import. Après quelques instants, le package de ressources Unity est importé dans votre projet.
Pour plus d’informations sur l’importation de packages de ressources dans Unity, consultez la documentation Unity.
Ce guide explique comment créer un projet Plateforme Windows universelle (UWP) et installer le SDK Speech pour C#. La plateforme Windows universelle vous permet de développer des applications qui s’exécutent sur n’importe quel appareil prenant en charge Windows 10, notamment des PC, Xbox, Surface Hub et d’autres appareils.
Créer un projet Visual Studio et installer le Kit de développement logiciel (SDK) Speech
Pour créer un projet Visual Studio pour le développement UWP, vous devez :
Configurer les options de développement de Visual Studio.
Créer le projet et sélectionner l’architecture cible.
Configurer la capture audio.
Installer le kit SDK Speech.
Configurer les options de développement de Visual Studio
Pour commencer, vérifiez que Visual Studio est configuré correctement pour le développement UWP :
Ouvrez Visual Studio 2019 pour afficher la fenêtre de démarrage.
Sélectionnez Continuer sans code pour accéder à l’IDE Visual Studio.
Dans la barre de menus de Visual Studio, sélectionnez Outils>Obtenir les outils et fonctionnalités pour ouvrir Visual Studio Installer et afficher la boîte de dialogue Modification.
Sous l’onglet Charges de travail, sous Windows, recherchez la charge de travail Développement pour la plateforme Windows universelle. Si la case en regard de cette charge de travail est déjà cochée, fermez la boîte de dialogue Modification et passez à l’étape 7.
Cochez la case Développement pour la plateforme Windows universelle, puis sélectionnez Modifier.
Dans la boîte de dialogue Avant de démarrer, sélectionnez Continuer pour installer la charge de travail Développement UWP. L’installation de la nouvelle fonctionnalité peut prendre quelques instants.
Fermez Visual Studio Installer.
Créer le projet
Ensuite, créez votre projet et sélectionnez l’architecture cible :
Dans la barre de menus Visual Studio, sélectionnez Fichier>Nouveau>Projet pour afficher la fenêtre Créer un projet.
Recherchez et sélectionnez Application vide (Windows universelle) . Veillez à sélectionner la version C# de ce type de projet (et non pas la version Visual Basic).
Sélectionnez Suivant.
Dans la boîte de dialogue Configurer votre nouveau projet, dans Nom du projet, entrez helloworld.
Dans Emplacement, accédez au dossier où vous voulez enregistrer votre projet et sélectionnez-le (ou créez ce dossier).
Sélectionnez Create (Créer).
Dans la fenêtre Nouveau projet de plateforme Windows universelle, dans Version minimale (deuxième zone de liste déroulante), sélectionnez Windows 10 Fall Creators Update (10.0, Build 16299). Il s’agit de l’exigence minimale pour le Kit de développement logiciel (SDK) Speech.
DansVersion cible (la première zone de liste déroulante), choisissez une valeur identique ou ultérieure à la valeur figurant dans Version minimale.
Sélectionnez OK. Vous êtes redirigé vers l’IDE Visual Studio, avec le nouveau projet créé et visible dans le volet Explorateur de solutions.
Sélectionnez l’architecture de votre plateforme cible. Dans la barre d’outils Visual Studio, recherchez la zone de liste déroulante Plateformes Solution. Si vous ne la voyez pas, sélectionnezAfficher>Barres d’outils>Standard pour afficher la barre d’outils qui contient Plateformes Solution.
Si vous exécutez Windows 64 bits, sélectionnez x64 dans la zone de liste déroulante. Windows 64 bits peut aussi exécuter les applications 32 bits : vous pouvez donc choisir x86 si vous préférez.
Notes
Le SDK Speech prend en charge tous les processeurs compatibles Intel, mais uniquement les versions x64 des processeurs ARM.
Configurer la capture audio
Autorisez le projet à capturer l’entrée audio :
Dans l’Explorateur de solutions, double-cliquez sur Package.appxmanifest pour ouvrir le manifeste de l’application du package.
Sélectionnez l’onglet Fonctionnalités.
Cochez la case pour la fonctionnalité Microphone.
Dans la barre de menus, sélectionnez Fichier>Enregistrer Package.appxmanifest pour enregistrer vos modifications.
Dans l’Explorateur de solutions, cliquez avec le bouton droit sur la solution, puis sélectionnez Gérer les packages NuGet pour la solution pour accéder à la fenêtre NuGet – Solution.
Sélectionnez Parcourir.
Dans Source du package, sélectionnez nuget.org.
Dans la zone de recherche, entrez Microsoft.CognitiveServices.Speech. Choisissez ensuite ce package une fois qu’il apparaît dans les résultats de la recherche.
Dans le volet d’état du package en regard des résultats de la recherche, sélectionnez votre projet helloworld.
Sélectionnez Installer.
Dans la boîte de dialogue Aperçu des modifications, sélectionnez OK.
Dans la boîte de dialogue Acceptation de la licence, affichez la licence, puis sélectionnez J’accepte. L’installation du package commence. Une fois l’installation terminée, le volet Sortie affiche un message similaire au texte suivant : Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
Ce guide explique comment créer un projet de formulaires Xamarin et installer le SDK Speech. Xamarin est une plateforme open source permettant de générer des applications modernes et performantes pour iOS, Android et Windows à l’aide de .NET.
Pour le développement de Xamarin, le SDK Speech prend en charge Windows Desktop (x86 et x64), ou la plateforme Windows universelle (x86, x64, ARM/ARM64), Android (x86, ARM32/64) et iOS (simulateur x64 et ARM64).
Créer un projet Visual Studio et installer le Kit de développement logiciel (SDK) Speech
Pour créer un projet Visual Studio pour le développement d’applications mobiles multiplateformes avec .NET et Xamarin, vous devez :
Configurer les options de développement de Visual Studio.
Créer le projet et sélectionner l’architecture cible.
Installer le kit SDK Speech.
Configurer les options de développement de Visual Studio
Pour commencer, vérifiez que la configuration de Visual Studio est correcte pour le développement mobile multiplateforme avec .NET :
Ouvrez Visual Studio 2019.
Dans la barre de menus de Visual Studio, sélectionnez Outils>Obtenir les outils et fonctionnalités pour ouvrir Visual Studio Installer et afficher la boîte de dialogue Modification.
Sous l’onglet Charges de travail, sous Windows, recherchez la charge de travail Développement mobile en .NET. Si la case en regard de cette charge de travail est déjà cochée, fermez la boîte de dialogue Modification et passez à l’étape 6.
Cochez la case Développement mobile en .NET, puis sélectionnez Modifier.
Dans la boîte de dialogue Avant de démarrer, sélectionnez Continuer pour installer la charge de travail Développement mobile en .NET. L’installation de la nouvelle fonctionnalité peut prendre quelques instants.
Fermez Visual Studio Installer.
Créer le projet
Ensuite, créez votre projet et sélectionnez l’architecture cible :
Dans la barre de menus Visual Studio, sélectionnez Fichier>Nouveau>Projet pour afficher la fenêtre Créer un projet.
Recherchez et sélectionnez Application mobile (Xamarin.Forms) .
Sélectionnez Suivant.
Dans la boîte de dialogue Configurer votre nouveau projet, dans Nom du projet, entrez helloworld.
Dans Emplacement, accédez au dossier où vous voulez enregistrer votre projet et sélectionnez-le ou créez ce dossier.
Sélectionnez Create (Créer).
Dans la fenêtre Nouvelle application multiplateforme, sélectionnez le modèle Vide, puis sélectionnez OK.
Dans Plateforme, cochez les cases Android, iOS et Windows (UWP) .
Sélectionnez OK. Vous êtes redirigé vers l’IDE Visual Studio, avec le nouveau projet créé et visible dans le volet Explorateur de solutions.
Sélectionnez l’architecture de votre plateforme cible et votre projet de démarrage. Dans la barre d’outils Visual Studio, recherchez la zone de liste déroulante Plateformes Solution. Si vous ne la voyez pas, sélectionnezAfficher>Barres d’outils>Standard pour afficher la barre d’outils qui contient Plateformes Solution.
Si vous exécutez Windows 64 bits, sélectionnez x64 dans la zone de liste déroulante. Vous pouvez sélectionner x86 si vous le souhaitez, car Windows 64 bits peut également exécuter des applications 32 bits.
Dans la zone de liste déroulante Projets de démarrage, sélectionnez helloworld.UWP (Windows universel).
Dans l’Explorateur de solutions, cliquez avec le bouton droit sur votre solution. Sélectionnez Gérer les packages NuGet pour la solution pour accéder à la fenêtre NuGet - Solution.
Sélectionnez Parcourir.
Dans Source du package, sélectionnez nuget.org.
Dans la zone de recherche, entrez Microsoft.CognitiveServices.Speech. Sélectionnez ensuite ce package une fois qu’il apparaît dans les résultats de la recherche.
Notes
Bitcode n’est pas activé pour la bibliothèque iOS à l’intérieur du package NuGet Microsoft.CognitiveServices.Speech. Si vous avez besoin d’une bibliothèque avec Bitcode activée pour votre application, utilisez le package NuGet Microsoft.CognitiveServices.Speech.Xamarin.iOS spécifiquement pour le projet iOS.
Dans le volet d’état du package en regard des résultats de la recherche, sélectionnez tous les projets : helloworld, helloworld.Android, helloworld.iOS et helloworld.UWP.
Sélectionnez Installer.
Dans la boîte de dialogue Aperçu des modifications, sélectionnez OK.
Dans la boîte de dialogue Acceptation de la licence, affichez la licence, puis sélectionnez J’accepte. Installez la référence du package du SDK Speech à tous les projets.
Une fois l’installation terminée, l’avertissement suivant peut s’afficher pour helloworld.iOS. Il s’agit d’un problème connu qui ne doit normalement pas avoir d’impact sur les fonctionnalités de votre application.
Could not resolve reference "C:\Users\Default\.nuget\packages\microsoft.cognitiveservices.speech\1.7.0\build\Xamarin.iOS\libMicrosoft.CognitiveServices.Speech.core.a". If this reference is required by your code, you may get compilation errors.
Le kit de développement logiciel (SDK) Speech est maintenant installé. Vous pouvez maintenant supprimer ou réutiliser le projet HelloWorld que vous avez créé au cours des étapes précédentes.
Le SDK Speech pour C++ prend en charge seulement Ubuntu 18.04/20.04/22.04, Debian 10/11, Red Hat Enterprise Linux (RHEL) 7/8 et CentOS 7/8 sur les architectures suivantes lorsqu’elles sont utilisées avec Linux : x86 (Debian/Ubuntu), x64, ARM32 (Debian/Ubuntu) et ARM64 (Debian/Ubuntu)
Important
Utilisez la version LTS la plus récente de la distribution Linux. Par exemple, si vous utilisez Ubuntu 20.04 LTS, utilisez la dernière version d’Ubuntu 20.04.X.
Le SDK Speech dépend des bibliothèques système Linux suivantes :
Les bibliothèques partagées de la bibliothèque C de GNU, notamment la bibliothèque de programmation POSIX Threads, libpthreads
La bibliothèque OpenSSL (libssl) version 1.x et les certificats (ca-certificates)
La bibliothèque partagée pour les applications ALSA (libasound)
Vous devez également installer ca-certificates pour établir un websocket sécurisé et éviter l’erreur WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED.
Important
Le Kit de développement logiciel (SDK) Speech ne prend pas en charge OpenSSL 3.0, service par défaut dans Ubuntu 22.04 et Debian 12.
Pour installer OpenSSL 1.x à partir de sources sur des systèmes Debian/Ubuntu qui ne l’ont pas, procédez comme suit :
wget -O - https://www.openssl.org/source/openssl-1.1.1u.tar.gz | tar zxf -
cd openssl-1.1.1u
./config --prefix=/usr/local
make -j $(nproc)
sudo make install_sw install_ssldirs
sudo ldconfig -v
export SSL_CERT_DIR=/etc/ssl/certs
Le paramètre de SSL_CERT_DIR doit être en vigueur à l’échelle du système ou au moins dans la console à partir de laquelle les applications qui utilisent le SDK Speech sont lancées. Sinon, OpenSSL 1.x installé dans /usr/local risque de ne pas trouver de certificats.
Assurez-vous que la sortie de la console de ldconfig -v inclut /usr/local/lib, comme il se doit par défaut sur les systèmes modernes. Si ce n’est pas le cas, définissez LD_LIBRARY_PATH (avec la même étendue que SSL_CERT_DIR) pour ajouter /usr/local/lib au chemin de bibliothèque :
Pour utiliser le Kit de développement logiciel (SDK) Speech dans Alpine Linux, créez un environnement chroot Debian comme décrit dans le wiki Alpine Linux sur l’exécution de programmes glibc. Suivez ensuite les instructions relatives à Debian fournies ici.
Le kit de développement logiciel (SDK) Speech pour C++ est disponible en tant que package NuGet. Pour plus d’informations, consultez Microsoft.CognitiveServices.Speech.
Utilisez la procédure suivante pour télécharger et installer le SDK. Les étapes incluent le téléchargement des bibliothèques et fichiers d’en-tête nécessaires sous la forme d’un fichier .tar à partir de https://aka.ms/csspeech/linuxbinary.
Choisissez un répertoire dans lequel extraire les fichiers du kit SDK Speech, et définissez la variable d’environnement SPEECHSDK_ROOT pour qu’elle pointe vers ce répertoire. Cette variable facilite ensuite la référence au répertoire dans les futures commandes.
Par exemple, si vous souhaitez utiliser le répertoire speechsdk dans votre répertoire de base, utilisez une commande semblable à la suivante :
export SPEECHSDK_ROOT="$HOME/speechsdk"
S’il n’existe pas encore, créez le répertoire :
mkdir -p "$SPEECHSDK_ROOT"
Téléchargez et extrayez l’archive .tar.gz contenant les fichiers binaires du SDK Speech :
Validez le contenu du répertoire de niveau supérieur du package extrait :
ls -l "$SPEECHSDK_ROOT"
La liste des répertoires doit comprendre les fichiers d’avis et de licence des tiers. La liste doit également contenir un répertoire include qui contient les fichiers d’en-tête (.h) et un répertoire lib qui contient les bibliothèques pour arm32, arm64, x64 et x86.
Path
Description
license.md
Licence
ThirdPartyNotices.md
Mentions tierces
REDIST.txt
Avis de redistribution
include
Fichiers d’en-tête nécessaires pour C++
lib/arm32
Bibliothèque native ARM32 nécessaire pour lier votre application
lib/arm64
Bibliothèque native ARM64 nécessaire pour lier votre application
lib/x64
Bibliothèque native pour x64 requise pour lier votre application
lib/x86
Bibliothèque native pour x86 requise pour lier votre application
Choisissez un répertoire dans lequel extraire les fichiers du kit SDK Speech, et définissez la variable d’environnement SPEECHSDK_ROOT pour qu’elle pointe vers ce répertoire. Cette variable facilite ensuite la référence au répertoire dans les futures commandes.
Par exemple, si vous souhaitez utiliser le répertoire speechsdk dans votre répertoire de base, utilisez une commande semblable à la suivante :
export SPEECHSDK_ROOT="$HOME/speechsdk"
S’il n’existe pas encore, créez le répertoire :
mkdir -p "$SPEECHSDK_ROOT"
Téléchargez et extrayez l’archive .zip contenant le XCFramework du SDK Speech :
Validez le contenu du répertoire de niveau supérieur du package extrait :
ls -l "$SPEECHSDK_ROOT"
La liste des répertoires doit contenir les avis de tiers, les fichiers de licence, ainsi qu’un répertoire MicrosoftCognitiveServicesSpeech.xcframework.
Créer un projet dans Visual Studio et installer le Kit de développement logiciel (SDK) Speech
Pour créer un projet Visual Studio pour le développement Desktop en C++, vous devez :
Configurer les options de développement de Visual Studio.
Créez le projet.
Sélectionner l’architecture cible.
Installer le kit SDK Speech.
Configurer les options de développement de Visual Studio
Pour commencer, vérifiez que Visual Studio est configuré correctement pour le développement Desktop en C++ :
Ouvrez Visual Studio 2019 pour afficher la fenêtre de démarrage.
Sélectionnez Continuer sans code pour accéder à l’IDE Visual Studio.
Dans la barre de menus de Visual Studio, sélectionnez Outils>Obtenir les outils et fonctionnalités pour ouvrir Visual Studio Installer et afficher la boîte de dialogue Modification.
Sous l’onglet Charges de travail, sous Windows, recherchez la charge de travail Développement Desktop avec C++. Si la case située en regard de cette charge de travail n’est pas déjà cochée, cochez-la.
Sous l’onglet Composants individuels, recherchez la case à cocher Gestionnaire de package NuGet. Si la case n’est pas déjà cochée, cochez-la.
Sélectionnez le bouton dans le coin avec le libellé Fermer ou Modifier. Le nom du bouton varie selon que vous avez sélectionné ou non des fonctionnalités pour l’installation.
Si vous sélectionnez Modifier, l’installation commence. Le processus peut prendre un certain temps.
Fermez Visual Studio Installer.
Créer le projet
Ensuite, créez votre projet et sélectionnez l’architecture cible :
Dans la barre de menus Visual Studio, sélectionnez Fichier>Nouveau>Projet pour afficher la fenêtre Créer un projet.
Recherchez et sélectionnez Application console. Veillez à sélectionner la version C++ de ce type de projet, et non pas la version C# ou Visual Basic.
Sélectionnez Suivant.
Dans la boîte de dialogue Configurer votre nouveau projet, dans Nom du projet, entrez helloworld.
Dans Emplacement, accédez au dossier où vous voulez enregistrer votre projet et sélectionnez-le (ou bien créez un dossier), puis sélectionnez Créer.
Sélectionnez l’architecture de votre plateforme cible. Dans la barre d’outils Visual Studio, recherchez la zone de liste déroulante Plateformes Solution. Si vous ne la voyez pas, sélectionnezAfficher>Barres d’outils>Standard pour afficher la barre d’outils qui contient Plateformes Solution.
Si vous exécutez Windows 64 bits, sélectionnez x64 dans la zone de liste déroulante. Windows 64 bits peut aussi exécuter les applications 32 bits : vous pouvez donc choisir x86 si vous préférez.
Installer le Kit de développement logiciel (SDK) Speech avec Visual Studio
Dans l’Explorateur de solutions, cliquez avec le bouton droit sur la solution, puis sélectionnez Gérer les packages NuGet pour la solution pour accéder à la fenêtre NuGet – Solution.
Sélectionnez Parcourir.
Dans Source du package, sélectionnez nuget.org.
Dans la zone de recherche, entrez Microsoft.CognitiveServices.Speech. Choisissez ensuite ce package une fois qu’il apparaît dans les résultats de la recherche.
Dans le volet d’état du package en regard des résultats de la recherche, sélectionnez votre projet helloworld.
Sélectionnez Installer.
Dans la boîte de dialogue Aperçu des modifications, sélectionnez OK.
Dans la boîte de dialogue Acceptation de la licence, affichez la licence, puis sélectionnez J’accepte. L’installation du package commence. Une fois l’installation terminée, le volet Sortie affiche un message similaire au texte suivant : Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
Le SDK Speech pour Go prend en charge Ubuntu 18.04/20.04/22.04, Debian 9/10/11, Red Hat Enterprise Linux (RHEL) 8 et CentOS 8 sur les architectures x64 en cas d’utilisation avec Linux.
Important
Utilisez la version LTS la plus récente de la distribution Linux. Par exemple, si vous utilisez Ubuntu 20.04 LTS, utilisez la dernière version d’Ubuntu 20.04.X.
Le SDK Speech dépend des bibliothèques système Linux suivantes :
Les bibliothèques partagées de la bibliothèque C de GNU, notamment la bibliothèque de programmation POSIX Threads, libpthreads
La bibliothèque OpenSSL (libssl) version 1.x et les certificats (ca-certificates)
La bibliothèque partagée pour les applications ALSA (libasound)
Vous devez également installer ca-certificates pour établir un websocket sécurisé et éviter l’erreur WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED.
Important
Le Kit de développement logiciel (SDK) Speech ne prend pas en charge OpenSSL 3.0, service par défaut dans Ubuntu 22.04 et Debian 12.
Pour installer OpenSSL 1.x à partir de sources sur des systèmes Debian/Ubuntu qui ne l’ont pas, procédez comme suit :
wget -O - https://www.openssl.org/source/openssl-1.1.1u.tar.gz | tar zxf -
cd openssl-1.1.1u
./config --prefix=/usr/local
make -j $(nproc)
sudo make install_sw install_ssldirs
sudo ldconfig -v
export SSL_CERT_DIR=/etc/ssl/certs
Le paramètre de SSL_CERT_DIR doit être en vigueur à l’échelle du système ou au moins dans la console à partir de laquelle les applications qui utilisent le SDK Speech sont lancées. Sinon, OpenSSL 1.x installé dans /usr/local risque de ne pas trouver de certificats.
Assurez-vous que la sortie de la console de ldconfig -v inclut /usr/local/lib, comme il se doit par défaut sur les systèmes modernes. Si ce n’est pas le cas, définissez LD_LIBRARY_PATH (avec la même étendue que SSL_CERT_DIR) pour ajouter /usr/local/lib au chemin de bibliothèque :
Pour utiliser le Kit de développement logiciel (SDK) Speech dans Alpine Linux, créez un environnement chroot Debian comme décrit dans le wiki Alpine Linux sur l’exécution de programmes glibc. Suivez ensuite les instructions relatives à Debian fournies ici.
Utilisez la procédure suivante pour télécharger et installer le SDK. Les étapes incluent le téléchargement des bibliothèques et fichiers d’en-tête nécessaires sous la forme d’un fichier .tar à partir de https://aka.ms/csspeech/linuxbinary.
Choisissez un répertoire dans lequel extraire les fichiers du kit SDK Speech, et définissez la variable d’environnement SPEECHSDK_ROOT pour qu’elle pointe vers ce répertoire. Cette variable facilite ensuite la référence au répertoire dans les futures commandes.
Par exemple, si vous souhaitez utiliser le répertoire speechsdk dans votre répertoire de base, utilisez une commande semblable à la suivante :
export SPEECHSDK_ROOT="$HOME/speechsdk"
S’il n’existe pas encore, créez le répertoire :
mkdir -p "$SPEECHSDK_ROOT"
Téléchargez et extrayez l’archive .tar.gz contenant les fichiers binaires du SDK Speech :
Validez le contenu du répertoire de niveau supérieur du package extrait :
ls -l "$SPEECHSDK_ROOT"
La liste des répertoires doit comprendre les fichiers d’avis et de licence des tiers. La liste doit également contenir un répertoire include qui contient les fichiers d’en-tête (.h) et un répertoire lib qui contient les bibliothèques pour arm32, arm64, x64 et x86.
Path
Description
license.md
Licence
ThirdPartyNotices.md
Mentions tierces
REDIST.txt
Avis de redistribution
include
Fichiers d’en-tête nécessaires pour C++
lib/arm32
Bibliothèque native ARM32 nécessaire pour lier votre application
lib/arm64
Bibliothèque native ARM64 nécessaire pour lier votre application
lib/x64
Bibliothèque native pour x64 requise pour lier votre application
lib/x86
Bibliothèque native pour x86 requise pour lier votre application
Configurer l’environnement Go
Les étapes suivantes permettent à votre environnement Go de trouver le SDK Speech. Dans ces deux étapes, remplacez <architecture> par l’architecture de votre processeur. L’architecture sera x86, x64, arm32 ou arm64.
Étant donné que les liaisons s’appuient sur cgo, vous devez définir les variables d’environnement pour que Go puisse trouver le SDK.
Important
Remplacez <architecture> dans l’extrait de code ci-dessous par ce qui correspond à votre configuration, soit « x86 », « x64 », « arm32 » ou « arm64 »
Le SDK Speech pour Java ne prend pas en charge Windows sur ARM64.
Le SDK Speech pour Java prend en charge seulement Ubuntu 18.04/20.04/22.04, Debian 10/11, Red Hat Enterprise Linux (RHEL) 7/8 et CentOS 7/8 sur les architectures suivantes lorsqu’elles sont utilisées avec Linux : x64, ARM32 (Debian/Ubuntu) et ARM64 (Debian/Ubuntu)
Important
Utilisez la version LTS la plus récente de la distribution Linux. Par exemple, si vous utilisez Ubuntu 20.04 LTS, utilisez la dernière version d’Ubuntu 20.04.X.
Le SDK Speech dépend des bibliothèques système Linux suivantes :
Les bibliothèques partagées de la bibliothèque C de GNU, notamment la bibliothèque de programmation POSIX Threads, libpthreads
La bibliothèque OpenSSL (libssl) version 1.x et les certificats (ca-certificates)
La bibliothèque partagée pour les applications ALSA (libasound)
Vous devez également installer ca-certificates pour établir un websocket sécurisé et éviter l’erreur WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED.
Important
Le Kit de développement logiciel (SDK) Speech ne prend pas en charge OpenSSL 3.0, service par défaut dans Ubuntu 22.04 et Debian 12.
Pour installer OpenSSL 1.x à partir de sources sur des systèmes Debian/Ubuntu qui ne l’ont pas, procédez comme suit :
wget -O - https://www.openssl.org/source/openssl-1.1.1u.tar.gz | tar zxf -
cd openssl-1.1.1u
./config --prefix=/usr/local
make -j $(nproc)
sudo make install_sw install_ssldirs
sudo ldconfig -v
export SSL_CERT_DIR=/etc/ssl/certs
Le paramètre de SSL_CERT_DIR doit être en vigueur à l’échelle du système ou au moins dans la console à partir de laquelle les applications qui utilisent le SDK Speech sont lancées. Sinon, OpenSSL 1.x installé dans /usr/local risque de ne pas trouver de certificats.
Assurez-vous que la sortie de la console de ldconfig -v inclut /usr/local/lib, comme il se doit par défaut sur les systèmes modernes. Si ce n’est pas le cas, définissez LD_LIBRARY_PATH (avec la même étendue que SSL_CERT_DIR) pour ajouter /usr/local/lib au chemin de bibliothèque :
Pour utiliser le Kit de développement logiciel (SDK) Speech dans Alpine Linux, créez un environnement chroot Debian comme décrit dans le wiki Alpine Linux sur l’exécution de programmes glibc. Suivez ensuite les instructions relatives à Debian fournies ici.
Le Kit de développement logiciel (SDK) Speech est compatible avec les appareils Android équipés de processeurs ARM 32/64 bits et Intel x86/x64 compatibles.
Installer le Kit de développement logiciel (SDK) Speech pour Java
Certaines instructions utilisent une version spécifique du Kit de développement logiciel (SDK) comme 1.24.2. Vous pouvez vérifier la dernière version en cherchant notre référentiel GitHub.
Exécutez la commande Maven suivante pour installer le kit de développement logiciel (SDK) Speech et les dépendances.
mvn clean dependency:copy-dependencies
Créer un projet Eclipse et installer le Kit de développement logiciel (SDK) Speech
Installez l’IDE Java Eclipse. Cet IDE nécessite que Java soit déjà installé.
Démarrez Eclipse.
Dans la zone Espace de travail de l’utilitaire Eclipse Launcher, entrez le nom d’un nouveau répertoire d’espace de travail. Sélectionnez ensuite Launch (Lancer).
La fenêtre principale de l’IDE Eclipse apparaît au bout d’un instant. Fermez l’écran d’accueil s’il en existe un.
Dans la barre de menus Eclipse, créez un projet en sélectionnant Fichier>Nouveau>Projet.
La boîte de dialogue Nouveau projet s’affiche. Sélectionnez Projet Java, puis Suivant.
L’Assistant New Java Project (Nouveau projet Java) démarre. Dans le champ Nom du projet, entrez Démarrage rapide. Choisissez JavaSE-1.8 comme environnement d’exécution. Sélectionnez Terminer.
Si une fenêtre Open Associated Perspective? (Ouvrir la perspective associée ?) s’affiche, sélectionnez Open Perspective (Ouvrir la perspective).
Dans Package explorer, cliquez avec le bouton droit sur le projet Démarrage rapide. Sélectionnez Configurer>Convertir en projet Maven dans le menu contextuel.
La fenêtre Create new POM (Créer un POM) s’affiche. Dans le champ ID de groupe, entrez com.microsoft.cognitiveservices.speech.samples. Dans le champ ID d’artefact, entrez Démarrage rapide. Sélectionnez Terminer.
Ouvrez le fichier pom.xml et modifiez-le :
Ajoutez un élément dependencies à la fin du fichier, avant la balise </project> fermante, avec le SDK Speech comme dépendance :
Le kit SDK Speech pour Android est empaqueté sous forme de fichier d’archive Android (AAR) qui inclut les bibliothèques et autorisations Android nécessaires.
Installer le Kit de développement logiciel (SDK) Speech avec Android Studio
Créez un projet dans Android Studio et ajoutez le Kit de développement logiciel (SDK) Speech pour Java en tant que dépendance de bibliothèque. La configuration se base sur le package Maven du SDK Speech et sur Android Studio Chipmunk 2021.2.1.
Créer un projet vide
Ouvrez Android Studio et sélectionnez Nouveau projet.
Dans la fenêtre Nouveau projet qui s’affiche, sélectionnez Téléphone et tablette>Activité vide, puis cliquez sur Suivant.
Entrez SpeechQuickstart dans la zone de texte Nom.
Saisissez samples.speech.cognitiveservices.microsoft.com dans la zone de texte Nom du package.
Sélectionnez un répertoire de projet dans la zone de sélection Enregistrer l’emplacement.
Sélectionnez Java dans la zone de sélection du Langage.
Sélectionnez l’API 23 : Android 6.0 (Marshmallow) dans la zone de sélection Niveau d’API minimale.
Sélectionnez Terminer.
Quelques minutes sont nécessaires à Android Studio pour préparer votre nouveau projet. S’il s’agit de votre première utilisation d’Android Studio, la définition des préférences, l’acceptation des licences et l’assistant peuvent prendre quelques minutes.
Installer le Kit de développement logiciel (SDK) Speech pour Java sur Android
Ajoutez le Kit de développement logiciel (SDK) Speech en tant que dépendance dans votre projet.
Cliquez sur Fichier>Structure du projet>Dépendances>app.
Sélectionnez le symbole plus (+) pour ajouter une dépendance sous Dépendances déclarées. Sélectionnez ensuite Dépendance de la bibliothèque dans le menu déroulant.
Dans la fenêtre Ajouter une dépendance de bibliothèque, entrez le nom et la version du SDK Speech pour Java : com.microsoft.cognitiveservices.speech:client-sdk:1.32.1. Ensuite, sélectionner Rechercher.
Vérifiez que l’ID de groupe sélectionné est com.microsoft.cognitiveservices.speech, puis sélectionnez OK.
Sélectionnez OK pour fermer la fenêtre Structure du projet et appliquer vos modifications au projet.
Prenez en compte les différentes implications architecturales entre Node.js et les navigateurs web clients. Par exemple, le DOM (Document Object Model) n’est pas disponible pour les applications côté serveur, tout comme le système de fichiers Node.js ne l’est pas pour les applications côté client.
Installer le SDK Speech pour JavaScript
Selon l’environnement cible, utilisez l’un des guides suivants :
Ce guide explique comment installer le Kit de développement logiciel (SDK) Speech pour JavaScript pour une utilisation avec Node.js. Si vous voulez simplement le nom du package pour commencer seul, exécutez npm install microsoft-cognitiveservices-speech-sdk depuis votre projet existant.
Si vous ciblez un navigateur web et que vous utilisez l’étiquette <script>, le préfixe sdk n’est pas nécessaire. Le préfixe sdk est un alias utilisé pour nommer le module require.
Vous pouvez également inclure directement une balise <script> dans l’élément HTMLs <head>, en vous basant sur le syndicat NPM JSDelivr.
Accédez au répertoire Xcode où se trouve votre fichier projet .xcodeproj.
Exécutez pod init pour créer un fichier pod nommé Podfile.
Remplacez le contenu de Podfile par ce qui suit. Mettez à jour le nom de target de « AppName » avec le nom de votre application. Mettez à jour la version de la plateforme ou du pod en fonction des besoins.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.32.1'
end
Exécutez pod install pour installer le SDK Speech.
Vous pouvez également télécharger le CocoaPod binaire et le décompresser pour extraire son contenu. Dans votre projet Xcode, ajoutez une référence au dossier « MicrosoftCognitiveServicesSpeech.xcframework » extrait et son contenu.
Notes
Les développeurs .NET peuvent créer des applications macOS natives à l’aide de l’infrastructure d’application Xamarin.Mac. Pour plus d’informations, consultez Xamarin.Mac.
Le SDK Speech pour Objective-C est disponible en natif sous forme de package CocoaPod.
Accédez au répertoire Xcode où se trouve votre fichier projet .xcodeproj.
Exécutez pod init pour créer un fichier pod nommé Podfile.
Remplacez le contenu de Podfile par ce qui suit. Mettez à jour le nom de target de « AppName » avec le nom de votre application. Mettez à jour la version de la plateforme ou du pod en fonction des besoins.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.32.1'
end
Exécutez pod install pour installer le SDK Speech.
Vous pouvez également télécharger le CocoaPod binaire et le décompresser pour extraire son contenu. Dans votre projet Xcode, ajoutez une référence au dossier « MicrosoftCognitiveServicesSpeech.xcframework » extrait et son contenu.
Notes
Les développeurs .NET peuvent créer des applications iOS natives à l’aide de l’infrastructure d’application Xamarin.iOS. Pour plus d’informations, consultez Xamarin.iOS.
Accédez au répertoire Xcode où se trouve votre fichier projet .xcodeproj.
Exécutez pod init pour créer un fichier pod nommé Podfile.
Remplacez le contenu de Podfile par ce qui suit. Mettez à jour le nom de target de « AppName » avec le nom de votre application. Mettez à jour la version de la plateforme ou du pod en fonction des besoins.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.32.1'
end
Exécutez pod install pour installer le SDK Speech.
Vous pouvez également télécharger le CocoaPod binaire et le décompresser pour extraire son contenu. Dans votre projet Xcode, ajoutez une référence au dossier « MicrosoftCognitiveServicesSpeech.xcframework » extrait et son contenu.
Notes
Les développeurs .NET peuvent créer des applications macOS natives à l’aide de l’infrastructure d’application Xamarin.Mac. Pour plus d’informations, consultez Xamarin.Mac.
Le SDK Speech pour Swift est disponible en natif sous forme de package CocoaPod.
Accédez au répertoire Xcode où se trouve votre fichier projet .xcodeproj.
Exécutez pod init pour créer un fichier pod nommé Podfile.
Remplacez le contenu de Podfile par ce qui suit. Mettez à jour le nom de target de « AppName » avec le nom de votre application. Mettez à jour la version de la plateforme ou du pod en fonction des besoins.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.32.1'
end
Exécutez pod install pour installer le SDK Speech.
Vous pouvez également télécharger le CocoaPod binaire et le décompresser pour extraire son contenu. Dans votre projet Xcode, ajoutez une référence au dossier « MicrosoftCognitiveServicesSpeech.xcframework » extrait et son contenu.
Notes
Les développeurs .NET peuvent créer des applications iOS natives à l’aide de l’infrastructure d’application Xamarin.iOS. Pour plus d’informations, consultez Xamarin.iOS.
Assurez-vous que les packages de la même architecture cible sont installés. Par exemple, si vous installez le package redistribuable x64, vous devez installer le package x64 Python.
Le SDK Speech pour Python prend en charge seulement Ubuntu 18.04/20.04/22.04, Debian 10/11, Red Hat Enterprise Linux (RHEL) 8 et CentOS 8 sur les architectures x64 et ARM64 en cas d’utilisation avec Linux.
Important
Utilisez la version LTS la plus récente de la distribution Linux. Par exemple, si vous utilisez Ubuntu 20.04 LTS, utilisez la dernière version d’Ubuntu 20.04.X.
Le SDK Speech dépend des bibliothèques système Linux suivantes :
Les bibliothèques partagées de la bibliothèque C de GNU, notamment la bibliothèque de programmation POSIX Threads, libpthreads
La bibliothèque OpenSSL (libssl) version 1.x et les certificats (ca-certificates)
La bibliothèque partagée pour les applications ALSA (libasound)
Vous devez également installer ca-certificates pour établir un websocket sécurisé et éviter l’erreur WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED.
Important
Le Kit de développement logiciel (SDK) Speech ne prend pas en charge OpenSSL 3.0, service par défaut dans Ubuntu 22.04 et Debian 12.
Pour installer OpenSSL 1.x à partir de sources sur des systèmes Debian/Ubuntu qui ne l’ont pas, procédez comme suit :
wget -O - https://www.openssl.org/source/openssl-1.1.1u.tar.gz | tar zxf -
cd openssl-1.1.1u
./config --prefix=/usr/local
make -j $(nproc)
sudo make install_sw install_ssldirs
sudo ldconfig -v
export SSL_CERT_DIR=/etc/ssl/certs
Le paramètre de SSL_CERT_DIR doit être en vigueur à l’échelle du système ou au moins dans la console à partir de laquelle les applications qui utilisent le SDK Speech sont lancées. Sinon, OpenSSL 1.x installé dans /usr/local risque de ne pas trouver de certificats.
Assurez-vous que la sortie de la console de ldconfig -v inclut /usr/local/lib, comme il se doit par défaut sur les systèmes modernes. Si ce n’est pas le cas, définissez LD_LIBRARY_PATH (avec la même étendue que SSL_CERT_DIR) pour ajouter /usr/local/lib au chemin de bibliothèque :
Pour utiliser le Kit de développement logiciel (SDK) Speech dans Alpine Linux, créez un environnement chroot Debian comme décrit dans le wiki Alpine Linux sur l’exécution de programmes glibc. Suivez ensuite les instructions relatives à Debian fournies ici.
Pour vérifier votre installation, ouvrez un terminal et exécutez la commande python --version. Si elle est correctement installée, vous obtenez une réponse comme « Python 3.8.10 ». Si vous utilisez macOS ou Linux, vous devrez peut-être exécuter la commande python3 --version à la place. Pour activer l’utilisation de python au lieu de python3, exécutez alias python='python3' pour configurer un alias. Les exemples de démarrage rapide du SDK Speech spécifient l’utilisation de python.
Vous pouvez vérifier la version du SDK Speech pour Python actuellement installée en inspectant la variable azure.cognitiveservices.speech.__version__. Par exemple, exécutez cette commande dans un terminal :
pip list
Installer le Kit de développement logiciel (SDK) Speech avec Visual Studio Code