Démarrage rapide : Installer le SDK Speech

Documentation de référence | Package (NuGet) | Exemples supplémentaires sur GitHub

Dans ce guide de démarrage rapide, vous installerez le SDK Speech pour C#.

Les exemples de code de la documentation sont écrits en C# 8 et s’exécutent sur .NET Standard 2.0.

Plateforme requise

Le Kit de développement logiciel (SDK) Speech pour C# est compatible avec Windows, Linux et macOS.

Attention

Cet article fait référence à CentOS, une distribution Linux proche de l’état EOL (End Of Life). Faites le point sur votre utilisation afin de vous organiser en conséquence. Pour obtenir plus d’informations, consultez les Conseils sur la fin de vie de CentOS.

Sur Windows, vous devez utiliser l’architecture cible 64 bits. Vous avez besoin de Windows 10 ou une version ultérieure.

Installez le Redistribuable Microsoft Visual C++ pour Visual Studio 2015, 2017, 2019 et 2022 pour votre plateforme. La toute première installation de ce package peut nécessiter un redémarrage.

Installer le Kit SDK Speech pour C#

Le kit de développement logiciel (SDK) Speech pour C# est disponible en tant que package NuGet et implémente .NET Standard 2.0. Pour plus d’informations, consultez Microsoft.CognitiveServices.Speech.

Le kit de développement logiciel (SDK) Speech pour C# peut être installé à partir de l’interface CLI .NET avec la commande dotnet add suivante :

dotnet add package Microsoft.CognitiveServices.Speech

Vous pouvez suivre ces guides pour plus d’options.

Ce guide explique comment installer le Kit de développement logiciel (SDK) Speech pour l’application console .NET Framework (Windows).

Ce guide nécessite les éléments suivants :

Créer un projet Visual Studio et installer le Kit de développement logiciel (SDK) Speech

Vous avez besoin d’installer le package NuGet du SDK Speech afin de pouvoir le référencer dans votre code. Pour cela, vous devrez peut-être d’abord créer un projet helloworld. Si vous disposez déjà d’un projet avec la charge de travail Développement .NET Desktop, vous pouvez utiliser ce projet et passer à Utiliser le gestionnaire de package NuGet pour installer le Kit de développement logiciel (SDK) Speech.

Créer un projet helloworld

  1. Ouvrez Visual Studio.

  2. Dans Démarrage, sélectionnez Créer un nouveau projet.

  3. Sous Créer un projet, choisissez Application console (.NET Framework) , puis cliquez sur Suivant.

  4. Dans Configurer votre nouveau projet, en guise de Nom du projet, entrez helloworld, choisissez ou créez le chemin du répertoire dans Emplacement, puis sélectionnez Créer.

  5. Dans la barre de menus de Visual Studio, sélectionnez Outils>Obtenir les outils et fonctionnalités. Cette étape ouvre Visual Studio Installer et affiche la boîte de dialogue Modification.

  6. Vérifiez si la charge de travail Développement .NET Desktop est disponible. Si cette charge de travail n’est pas installée, cochez la case, puis sélectionnez Modifier pour démarrer l’installation. Le téléchargement et l’installation peuvent prendre quelques minutes.

    Si la case Développement de bureau .NET est déjà cochée, sélectionnez Fermer pour fermer la boîte de dialogue.

    Capture d’écran illustrant l’activation de la charge de travail Développement .NET Desktop.

  7. Fermez Visual Studio Installer.

Utiliser le gestionnaire de package NuGet pour installer le Kit de développement logiciel (SDK) Speech

  1. Dans l’Explorateur de solutions, cliquez avec le bouton droit sur le projet helloworld, puis sélectionnez Gérer les packages NuGet pour afficher le gestionnaire de package NuGet.

  2. Dans l’angle supérieur droit, recherchez la zone de liste déroulante Source du package et vérifiez que nuget.org est sélectionné.

    Capture d’écran montrant le gestionnaire de package NuGet.

  3. Dans l’angle supérieur gauche, sélectionnez Parcourir.

  4. Dans la zone de recherche, tapez Microsoft.CognitiveServices.Speech et appuyez sur la touche Entrée.

  5. Dans les résultats de la recherche, sélectionnez le package Microsoft.CognitiveServices.Speech, puis sélectionnez Installer pour installer la dernière version stable.

    Capture d’écran illustrant l’installation du package NuGet Microsoft.CognitiveServices.Speech.

  6. Acceptez tous les contrats et licences pour démarrer l’installation.

    Une fois le package installé, un message de confirmation s’affiche dans la fenêtre Console du Gestionnaire de package.

Choisir l’architecture cible

Pour générer et exécuter l’application console, créez une configuration de plateforme correspondant à l’architecture de votre ordinateur.

  1. Dans le menu, sélectionnez Générer>Configuration Manager. La boîte de dialogue Gestionnaire de configurations s’affiche.

  2. Dans la zone de liste déroulante Plateforme de la solution active, sélectionnez Nouveau. La boîte de dialogue Nouvelle plateforme de solution s’affiche.

    Capture d’écran montrant la boîte de dialogue Configuration Manager.

  3. Dans la zone de liste déroulante Tapez ou sélectionnez la nouvelle plateforme :

    • Si vous exécutez Windows 64 bits, sélectionnez x64.
    • Si vous exécutez Windows 32 bits, sélectionnez x86.
  4. Sélectionnez OK, puis Fermer.

Documentation de référence | Package (NuGet) | Exemples supplémentaires sur GitHub

Dans ce guide de démarrage rapide, vous installerez le SDK Speech pour C++.

Plateforme requise

Le Kit de développement logiciel (SDK) Speech pour C++ est compatible avec Windows, Linux et macOS.

Sur Windows, vous devez utiliser l’architecture cible 64 bits. Vous avez besoin de Windows 10 ou une version ultérieure.

Installez le Redistribuable Microsoft Visual C++ pour Visual Studio 2015, 2017, 2019 et 2022 pour votre plateforme. La toute première installation de ce package peut nécessiter un redémarrage.

Installer le Kit SDK Speech pour C++

Le kit de développement logiciel (SDK) Speech pour C++ est disponible en tant que package NuGet. Pour plus d’informations, consultez Microsoft.CognitiveServices.Speech.

Le SDK Speech pour C++ peut être installé à partir de l’interface CLI .NET avec la commande dotnet add suivante :

dotnet add package Microsoft.CognitiveServices.Speech

Vous pouvez suivre ces guides pour plus d’options.

Ce guide explique comment installer le Kit de développement logiciel (SDK) Speech pour Linux.

Utilisez la procédure suivante pour télécharger et installer le SDK. Les étapes incluent le téléchargement des bibliothèques et fichiers d’en-tête requis sous la forme d’un fichier .tar.

  1. Choisissez un répertoire pour les fichiers du SDK Speech. Définissez la variable d’environnement SPEECHSDK_ROOT afin quelle pointe vers ce répertoire. Cette variable facilite ensuite la référence au répertoire dans les futures commandes.

    Pour utiliser le répertoire speechsdk dans votre répertoire de base, utilisez la commande suivante :

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Créez le répertoire s’il n’existe pas.

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Téléchargez et extrayez l’archive tar.gz contenant les fichiers binaires du kit SDK Speech :

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Validez le contenu du répertoire de niveau supérieur du package extrait :

    ls -l "$SPEECHSDK_ROOT"
    

    La liste des répertoires doit comprendre les avis de partenaires et les fichiers de licences. La liste doit également comprendre un répertoire inclure qui contient les fichiers (.h) d’en-tête et un répertoire lib qui comporte les bibliothèques pour arm32, arm64, x64 et x86.

    Path Description
    license.md Licence
    ThirdPartyNotices.md Avis de partenaire
    REDIST.txt Avis de redistribution
    inclure Fichiers d’en-tête nécessaires pour C++
    lib/arm32 Bibliothèque native ARM32 nécessaire pour lier votre application
    lib/arm64 Bibliothèque native ARM64 nécessaire pour lier votre application
    \lib\x64 Bibliothèque native pour x64 requise pour lier votre application
    lib/x86 Bibliothèque native pour x86 requise pour lier votre application

Documentation de référence | Package (Go) | Exemples supplémentaires sur GitHub

Dans ce guide de démarrage rapide, vous installerez le SDK Speech pour Go.

Plateforme requise

Attention

Cet article fait référence à CentOS, une distribution Linux proche de l’état EOL (End Of Life). Faites le point sur votre utilisation afin de vous organiser en conséquence. Pour obtenir plus d’informations, consultez les Conseils sur la fin de vie de CentOS.

Le SDK Speech pour Go ne prend en charge que les distributions suivantes sur l’architecture x64 :

  • Ubuntu 18.04/20.04
  • Debian 9/10/11
  • Red Hat Enterprise Linux (RHEL) 8
  • CentOS 7

Important

Utilisez la version LTS la plus récente de la distribution Linux. Par exemple, si vous utilisez Ubuntu 20.04 LTS, utilisez la dernière version d’Ubuntu 20.04.X.

Le SDK Speech dépend des bibliothèques système Linux suivantes :

  • Les bibliothèques partagées de la bibliothèque C de GNU (notamment la bibliothèque de programmation POSIX Threads, libpthreads)
  • La bibliothèque OpenSSL (libssl) version 1.x et les certificats (ca-certificates)
  • La bibliothèque partagée pour les applications ALSA (libasound)

Vous devez également installer ca-certificates pour établir un websocket sécurisé et éviter l’erreur WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED.

Important

Le Kit de développement logiciel (SDK) Speech ne prend pas en charge OpenSSL 3.0, service par défaut dans Ubuntu 22.04 et Debian 12.

Exécutez ces commandes  :

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Installez la version binaire Go 1.13 ou ultérieure.

Installer le Kit SDK Speech pour Go

Utilisez la procédure suivante pour télécharger et installer le SDK. Les étapes incluent le téléchargement des bibliothèques et fichiers d’en-tête requis sous la forme d’un fichier .tar.

  1. Choisissez un répertoire pour les fichiers du SDK Speech. Définissez la variable d’environnement SPEECHSDK_ROOT afin quelle pointe vers ce répertoire. Cette variable facilite ensuite la référence au répertoire dans les futures commandes.

    Pour utiliser le répertoire speechsdk dans votre répertoire de base, utilisez la commande suivante :

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Créez le répertoire s’il n’existe pas.

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Téléchargez et extrayez l’archive tar.gz contenant les fichiers binaires du kit SDK Speech :

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Validez le contenu du répertoire de niveau supérieur du package extrait :

    ls -l "$SPEECHSDK_ROOT"
    

    La liste des répertoires doit comprendre les avis de partenaires et les fichiers de licences. La liste doit également comprendre un répertoire inclure qui contient les fichiers (.h) d’en-tête et un répertoire lib qui comporte les bibliothèques pour arm32, arm64, x64 et x86.

    Path Description
    license.md Licence
    ThirdPartyNotices.md Avis de partenaire
    REDIST.txt Avis de redistribution
    inclure Fichiers d’en-tête nécessaires pour C++
    lib/arm32 Bibliothèque native ARM32 nécessaire pour lier votre application
    lib/arm64 Bibliothèque native ARM64 nécessaire pour lier votre application
    \lib\x64 Bibliothèque native pour x64 requise pour lier votre application
    lib/x86 Bibliothèque native pour x86 requise pour lier votre application

Configurer l’environnement Go

Les étapes suivantes permettent à votre environnement Go de trouver le SDK Speech.

  1. Étant donné que les liaisons s’appuient sur cgo, vous devez définir les variables d’environnement pour que Go puisse trouver le SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Important

    Remplacez <architecture> par l’architecture de votre processeur : x86, x64, arm32 ou arm64.

  2. Pour exécuter des applications et le SDK, vous devez indiquer au système d’exploitation où trouver les bibliothèques.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Important

    Remplacez <architecture> par l’architecture de votre processeur : x86, x64, arm32 ou arm64.

Documentation de référence | Exemples supplémentaires sur GitHub

Dans ce guide de démarrage rapide, vous installez le SDK Speech pour Java.

Plateforme requise

Choisissez votre environnement cible :

Le Kit de développement logiciel (SDK) Speech pour Java est compatible avec Windows, Linux et macOS.

Sur Windows, vous devez utiliser l’architecture cible 64 bits. Vous avez besoin de Windows 10 ou une version ultérieure.

Installez le Redistribuable Microsoft Visual C++ pour Visual Studio 2015, 2017, 2019 et 2022 pour votre plateforme. La toute première installation de ce package peut nécessiter un redémarrage.

Le SDK Speech pour Java ne prend pas en charge Windows sur ARM64.

Installez un kit de développement Java tel que Azul Zulu OpenJDK. La build Microsoft d’OpenJDK ou le JDK de votre choix doivent également fonctionner.

Installer le Kit de développement logiciel (SDK) Speech pour Java

Certaines instructions utilisent une version spécifique du Kit de développement logiciel (SDK) comme 1.24.2. Pour vérifier la dernière version, recherchez dans notre dépôt GitHub.

Choisissez votre environnement cible :

Ce guide explique comment installer le Kit de développement logiciel (SDK) Speech pour Java sur le runtime Java.

Systèmes d’exploitation pris en charge

Le Kit de développement logiciel (SDK) Speech pour le package Java est disponible pour les systèmes d’exploitation suivants :

Procédez comme suit pour installer le Kit de développement logiciel (SDK) Speech pour Java à l’aide d’Apache Maven :

  1. Installez Apache Maven.

  2. Ouvrez une invite de commandes à l’emplacement où vous souhaitez placer le nouveau projet, puis créez un fichier pom.xml.

  3. Copiez le contenu XML suivant dans pom.xml :

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.37.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Exécutez la commande Maven suivante pour installer le kit de développement logiciel (SDK) Speech et les dépendances.

    mvn clean dependency:copy-dependencies
    

Documentation de référence | Package (npm) | Exemples supplémentaires sur GitHub | Code source de la bibliothèque

Dans ce démarrage rapide, vous installerez le SDK Speech pour JavaScript.

Le kit de développement logiciel (SDK) Speech pour JavaScript est disponible en tant que package npm. Consultez microsoft-cognitiveservices-speech-sdk et le référentiel GitHub associé cognitive-services-speech-sdk-js.

Plateforme requise

Prenez soin de comprendre les implications architecturales entre Node.js et les navigateurs web clients. Par exemple, Document Object Model (DOM) n’est pas disponible pour les applications côté serveur. Le système de fichiers Node.js n’est pas disponible pour les applications côté client.

Installer le SDK Speech pour JavaScript

Selon l’environnement cible, utilisez l’un des guides suivants :

Ce guide explique comment installer le Kit de développement logiciel (SDK) Speech pour JavaScript pour une utilisation avec Node.js.

  1. Installez Node.js.

  2. Créez un répertoire, exécutez npm init et parcourez les invites.

  3. Pour installer le kit SDK Speech pour JavaScript, exécutez la commande npm install suivante :

    npm install microsoft-cognitiveservices-speech-sdk
    

Pour plus d’informations, consultez Exemples Node.js.

Utiliser le SDK Speech

  • Ajoutez l’instruction d’importation suivante pour utiliser le Kit de développement logiciel (SDK) Speech dans votre projet JavaScript :

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Pour plus d’informations sur import, consultez Exporter et importer sur le site web JavaScript.

Vous pouvez également utiliser une instruction require :

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Documentation de référence | Package (Télécharger) | Exemples supplémentaires sur GitHub

Dans ce démarrage rapide, vous installerez le SDK Speech pour Objective-C.

Conseil

Pour plus d’informations sur l’utilisation du kit de développement logiciel (SDK) Speech pour Swift, consultez Importation d’Objective-C dans Swift.

Installer le Kit SDK Speech pour Objective-C

Le SDK Speech pour Objective-C est disponible en mode natif en tant que package CocoaPod pour les systèmes Mac x64 et ARM.

Configuration requise pour Mac :

  • macOS version 10.14 ou ultérieure

Le package CocoaPod macOS est disponible pour téléchargement et peut être utilisé avec l’environnement de développement intégré (IDE) Xcode 9.4.1 (ou une version ultérieure).

  1. Accédez au répertoire Xcode où se trouve votre fichier projet .xcodeproj.

  2. Exécutez pod init pour créer un fichier pod nommé Podfile.

  3. Remplacez le contenu de votre fichier Podfile par le contenu ci-dessous. Mettez à jour le nom target de AppName avec le nom de votre application. Mettez à jour la version de la plateforme ou du pod en fonction des besoins.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. Exécutez pod install pour installer le SDK Speech.

Alternativement, vous pouvez télécharger le CocoaPod binaire et en extraire le contenu. Dans votre projet Xcode, ajoutez une référence au dossier MicrosoftCognitiveServicesSpeech.xcframework extrait et à son contenu.

Remarque

Les développeurs .NET peuvent créer des applications macOS natives à l’aide de l’infrastructure d’application Xamarin.Mac. Pour plus d’informations, consultez Xamarin.Mac.

Documentation de référence | Package (Télécharger) | Exemples supplémentaires sur GitHub

Dans ce démarrage rapide, vous installerez le SDK Speech pour Swift.

Conseil

Pour plus d’informations sur l’utilisation du kit de développement logiciel (SDK) Speech pour Swift, consultez Importation d’Objective-C dans Swift.

Installer le Kit SDK Speech pour Swift

Le kit de développement logiciel (SDK) pour Swift est disponible en mode natif en tant que package CocoaPod pour les systèmes Mac x64 et ARM.

Configuration requise pour Mac :

  • macOS version 10.14 ou ultérieure

Le package CocoaPod macOS est disponible pour téléchargement et peut être utilisé avec l’environnement de développement intégré (IDE) Xcode 9.4.1 (ou une version ultérieure).

  1. Accédez au répertoire Xcode où se trouve votre fichier projet .xcodeproj.

  2. Exécutez pod init pour créer un fichier pod nommé Podfile.

  3. Remplacez le contenu de votre fichier Podfile par le contenu ci-dessous. Mettez à jour le nom target de AppName avec le nom de votre application. Mettez à jour la version de la plateforme ou du pod en fonction des besoins.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. Exécutez pod install pour installer le SDK Speech.

Alternativement, vous pouvez télécharger le CocoaPod binaire et en extraire le contenu. Dans votre projet Xcode, ajoutez une référence au dossier MicrosoftCognitiveServicesSpeech.xcframework extrait et à son contenu.

Remarque

Les développeurs .NET peuvent créer des applications macOS natives à l’aide de l’infrastructure d’application Xamarin.Mac. Pour plus d’informations, consultez Xamarin.Mac.

Documentation de référence | Package (PyPi) | Exemples supplémentaires sur GitHub

Dans ce démarrage rapide, vous installerez le SDK Speech pour Python.

Plateforme requise

Le Kit de développement logiciel (SDK) Speech pour Python est compatible avec Windows, Linux et macOS.

Sur Windows, vous devez utiliser l’architecture cible 64 bits. Vous avez besoin de Windows 10 ou une version ultérieure.

Installez le Redistribuable Microsoft Visual C++ pour Visual Studio 2015, 2017, 2019 et 2022 pour votre plateforme. La toute première installation de ce package peut nécessiter un redémarrage.

Important

Assurez-vous que les packages de la même architecture cible sont installés. Par exemple, si vous installez le package redistribuable x64, installez le package x64 Python.

Installez Python 3.7 ou une version ultérieure.

  • Pour vérifier votre installation, ouvrez un terminal et exécutez la commande python --version. Si Python est installé correctement, vous obtenez une réponse similaire à Python 3.8.10.

  • Si vous utilisez macOS ou Linux, vous devrez peut-être exécuter la commande python3 --version à la place.

    Pour activer l’utilisation de python au lieu de python3, exécutez alias python='python3' pour configurer un alias. Les exemples de démarrage rapide du SDK Speech spécifient l’utilisation de python.

Installer le Kit SDK Speech pour Python

Avant d’installer le kit SDK Speech pour, assurez-vous de respecter les exigences de plateforme.

Installer à partir de PyPI

Pour installer le kit SDK Speech pour Python, exécutez cette commande dans une fenêtre de la console.

pip install azure-cognitiveservices-speech

Passez à la dernière version du Kit de développement logiciel (SDK)

Pour effectuer une mise à niveau vers le kit SDK Speech le plus récent, exécutez cette commande dans une fenêtre de la console :

pip install --upgrade azure-cognitiveservices-speech

Vous pouvez vérifier la version du SDK Speech pour Python actuellement installée en inspectant la variable azure.cognitiveservices.speech.__version__. Par exemple, exécutez cette commande dans une fenêtre de la console :

pip list

Utiliser le SDK Speech

Ajoutez l’instruction d’importation suivante pour utiliser le Kit de développement logiciel (SDK) Speech dans votre projet Python :

import azure.cognitiveservices.speech as speechsdk