Číst v angličtině

Sdílet prostřednictvím


Rychlý start: Instalace sady Speech SDK

Referenční dokumentace | Package (NuGet) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro jazyk C#.

Požadavky platformy

Sada Speech SDK pro C# je kompatibilní s Windows, Linuxem a macOS.

Sada Speech SDK pro C# podporuje pouze následující distribuce v architekturách x64, ARM32 a ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Důležité

Použijte nejnovější verzi LTS distribuce Linuxu. Pokud například používáte Ubuntu 20.04 LTS, použijte nejnovější verzi Ubuntu 20.04.X.

Sada Speech SDK závisí na následujících systémových knihovnách Linuxu:

  • Sdílené knihovny GNU C, včetně knihovny pro programování POSIX Threads, libpthreads.
  • Knihovna OpenSSL verze 1.x (libssl1) nebo 3.x (libssl3) a certifikáty (ca-certificates).
  • Sdílená knihovna pro aplikace ALSA (libasound2).

Spusťte tyto příkazy:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instalace sady Speech SDK pro jazyk C#

Sada Speech SDK pro jazyk C# je k dispozici jako balíček NuGet a implementuje .NET Standard 2.0. Další informace naleznete v tématu Microsoft.CognitiveServices.Speech.

Sadu Speech SDK pro C# je možné nainstalovat z rozhraní příkazového řádku .NET POMOCÍ následujícího dotnet add příkazu:

dotnet add package Microsoft.CognitiveServices.Speech

Referenční dokumentace | Package (NuGet) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro C++.

Požadavky platformy

Sada Speech SDK pro C++ je kompatibilní s Windows, Linuxem a macOS.

Sada Speech SDK pro C++ podporuje pouze následující distribuce v architekturách x64, ARM32 a ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Důležité

Použijte nejnovější verzi LTS distribuce Linuxu. Pokud například používáte Ubuntu 20.04 LTS, použijte nejnovější verzi Ubuntu 20.04.X.

Sada Speech SDK závisí na následujících systémových knihovnách Linuxu:

  • Sdílené knihovny GNU C, včetně knihovny pro programování vláken POSIX, libpthreads.
  • Knihovna OpenSSL verze 1.x (libssl1) nebo 3.x (libssl3) a certifikáty (ca-certificates).
  • Sdílená knihovna pro aplikace ALSA (libasound2).

Spusťte tyto příkazy:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instalace sady Speech SDK pro C++

Sada Speech SDK pro jazyk C++ je k dispozici jako balíček NuGet. Další informace naleznete v tématu Microsoft.CognitiveServices.Speech.

Sadu Speech SDK pro C++ je možné nainstalovat z rozhraní příkazového řádku .NET POMOCÍ následujícího dotnet add příkazu:

dotnet add package Microsoft.CognitiveServices.Speech

Další možnosti najdete v těchto průvodcích.

Tato příručka ukazuje, jak nainstalovat sadu Speech SDK pro Linux.

Pomocí následujícího postupu stáhněte a nainstalujte sadu SDK. Tento postup zahrnuje stažení požadovaných knihoven a hlavičkových souborů jako .tar souboru.

  1. Zvolte adresář pro soubory sady Speech SDK. Nastavte proměnnou SPEECHSDK_ROOT prostředí tak, aby odkazovala na daný adresář. Tato proměnná umožňuje snadno odkazovat na adresář v budoucích příkazech.

    Chcete-li použít adresář speechsdk ve vašem domovském adresáři, spusťte následující příkaz:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Pokud adresář neexistuje, vytvořte ho:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Stáhněte a extrahujte archiv .tar.gz , který obsahuje binární soubory sady Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Ověřte obsah adresáře nejvyšší úrovně extrahovaného balíčku:

    ls -l "$SPEECHSDK_ROOT"
    

    Seznam adresářů by měl obsahovat oznámení o partnerovi a soubory licencí. Výpis by měl obsahovat adresář include, který drží soubory hlaviček (.h), a adresář lib, který obsahuje knihovny pro arm32, arm64, x64 a x86.

    Cesta Popis
    license.md Licence
    ThirdPartyNotices.md Oznámení o partnerech
    REDIST.txt Oznámení o redistribuci
    include Požadované soubory hlaviček pro C++
    lib/arm32 Nativní knihovna pro ARM32 potřebná k propojení aplikace
    lib/arm64 Nativní knihovna pro ARM64 požadovaná k propojení aplikace
    lib/x64 Nativní knihovna pro x64 požadovaná pro propojení vaší aplikace
    lib/x86 Nativní knihovna pro x86 požadovaná pro propojení vaší aplikace

Referenční dokumentace | Package (Go) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Go.

Požadavky platformy

Sada Speech SDK pro Go podporuje následující distribuce v architektuře x64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Důležité

Použijte nejnovější verzi LTS distribuce Linuxu. Pokud například používáte Ubuntu 20.04 LTS, použijte nejnovější verzi Ubuntu 20.04.X.

Sada Speech SDK závisí na následujících systémových knihovnách Linuxu:

  • Sdílené knihovny GNU C, včetně POSIX Threads Programming library, libpthreads.
  • Knihovna OpenSSL verze 1.x (libssl1) nebo 3.x (libssl3) a certifikáty (ca-certificates).
  • Sdílená knihovna pro aplikace ALSA (libasound2).

Spusťte tyto příkazy:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Nainstalujte binární verzi Go 1.13 nebo novější.

Instalace sady Speech SDK pro Go

Pomocí následujícího postupu stáhněte a nainstalujte sadu SDK. Tento postup zahrnuje stažení požadovaných knihoven a hlavičkových souborů jako .tar soubor.

  1. Zvolte adresář pro soubory sady Speech SDK. Nastavte proměnnou SPEECHSDK_ROOT prostředí, aby odkazovala na tento adresář. Tato proměnná umožňuje snadno odkazovat na adresář v budoucích příkazech.

    Pokud chcete použít adresář speechsdk ve vašem domovském adresáři, spusťte následující příkaz:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Pokud adresář neexistuje, vytvořte ho:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Stáhněte a extrahujte archiv .tar.gz , který obsahuje binární soubory sady Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Ověřte obsah adresáře nejvyšší úrovně extrahovaného balíčku:

    ls -l "$SPEECHSDK_ROOT"
    

    Seznam adresářů by měl obsahovat oznámení o partnerovi a soubory licencí. Výpis by měl obsahovat adresář include, který obsahuje soubory hlaviček (.h), a adresář lib, který obsahuje knihovny pro arm32, arm64, x64 a x86.

    Cesta Popis
    license.md Licence
    ThirdPartyNotices.md Oznámení o partnerech
    REDIST.txt Oznámení o redistribuci
    include Požadované soubory hlaviček pro C++
    lib/arm32 Nativní knihovna pro ARM32 potřebná k propojení aplikace
    lib/arm64 Nativní knihovna pro ARM64 požadovaná k propojení aplikace
    lib/x64 Nativní knihovna pro x64 požadovaná pro propojení vaší aplikace
    lib/x86 Nativní knihovna pro x86 požadovaná pro propojení vaší aplikace

Konfigurace prostředí Go

Následující kroky umožňují vašemu prostředí jazyka Go najít Speech SDK.

  1. Vzhledem k tomu, že vazby závisejí na cgo, musíte nastavit proměnné prostředí, aby Go mohl najít sadu SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Důležité

    Nahraďte <architecture> architekturou procesoru procesoru: x64, arm32nebo arm64.

  2. Pokud chcete spouštět aplikace a sadu SDK, musíte operačnímu systému sdělit, kde knihovny najít.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Důležité

    Nahraďte <architecture> architekturou procesoru procesoru: x64, arm32nebo arm64.

Referenční dokumentace | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Javu.

Požadavky platformy

Zvolte cílové prostředí:

Sada Speech SDK pro Javu je kompatibilní s Windows, Linuxem a macOS.

Sada Speech SDK pro Javu podporuje následující distribuce v architekturách x64, ARM32 a ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Důležité

Použijte nejnovější verzi LTS distribuce Linuxu. Pokud například používáte Ubuntu 20.04 LTS, použijte nejnovější verzi Ubuntu 20.04.X.

Sada Speech SDK závisí na následujících systémových knihovnách Linuxu:

  • Sdílené knihovny GNU C, včetně knihovny pro programování s vlákny POSIX, libpthreads.
  • Knihovna OpenSSL verze 1.x (libssl1) nebo 3.x (libssl3) a certifikáty (ca-certificates).
  • Sdílená knihovna pro aplikace ALSA (libasound2).

Spusťte tyto příkazy:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Nainstalujte sadu pro vývoj v Javě, například Azul Zulu OpenJDK. Měla by fungovat také Microsoft Build OpenJDK nebo upřednostňovaná verze JDK.

Instalace sady Speech SDK pro Javu

Některé pokyny používají konkrétní verzi sady SDK, například 1.43.0. Pokud chcete zkontrolovat nejnovější verzi, vyhledejte úložiště GitHub.

Zvolte cílové prostředí:

Tento průvodce ukazuje, jak nainstalovat sadu Speech SDK pro Javu v prostředí Java Runtime.

Podporované operační systémy

Balíček Speech SDK pro Javu je k dispozici pro tyto operační systémy:

Pokud chcete nainstalovat sadu Speech SDK pro Javu pomocí Apache Mavenu, postupujte takto:

  1. Nainstalujte Apache Maven.

  2. Otevřete příkazový řádek, na kterém chcete nový projekt, a vytvořte nový soubor pom.xml .

  3. Zkopírujte následující obsah XML do pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.43.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Spusťte následující příkaz Maven pro instalaci sady Speech SDK a jejích závislostí.

    mvn clean dependency:copy-dependencies
    

Referenční dokumentace | Balíček (npm) | Další ukázky ve zdrojovém kódu knihovny GitHub |

V tomto rychlém startu nainstalujete sadu Speech SDK pro JavaScript.

Sada Speech SDK pro JavaScript je k dispozici jako balíček npm. Viz microsoft-cognitiveservices-speech-sdk a jeho doprovodné úložiště GitHub cognitive-services-speech-sdk-js.

Požadavky platformy

Seznamte se s důsledky architektury mezi Node.js a klientskými webovými prohlížeči. Například objektový model dokumentu (DOM) není k dispozici pro aplikace na straně serveru. Systém souborů Node.js není k dispozici pro aplikace na straně klienta.

Instalace sady Speech SDK pro JavaScript

V závislosti na cílovém prostředí použijte jednu z následujících příruček:

Tato příručka ukazuje, jak nainstalovat sadu Speech SDK pro JavaScript pro použití s Node.js.

  1. Nainstalujte Node.js.

  2. Vytvořte nový adresář, spusťte npm init, a projděte si instrukce.

  3. Pokud chcete nainstalovat sadu Speech SDK pro JavaScript, spusťte následující npm install příkaz:

    npm install microsoft-cognitiveservices-speech-sdk
    

Další informace najdete v ukázkách Node.js.

Použití sady Speech SDK

  • Přidejte následující příkaz importu pro použití sady Speech SDK v projektu JavaScriptu:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Další informace o importexportu a importu na webu JavaScript.

Alternativně můžete použít příkaz require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Objective-C.

Tip

Další informace o používání sady Speech SDK pro Swift najdete v tématu Importu Objective-C do Swiftu.

Instalace sady Speech SDK pro Objective-C

Sada Speech SDK pro Objective-C je nativně dostupná jako balíček CocoaPod pro systémy Mac x64 a ARM.

Požadavky na systém pro Mac:

  • MacOS verze 10.14 nebo novější

Balíček macOS CocoaPod je k dispozici ke stažení a použití s integrovaným vývojovým prostředím (IDE) Xcode 9.4.1 nebo novějším.

  1. Přejděte do adresáře Xcode, kde se nachází váš soubor projektu .xcodeproj .

  2. Spuštěním příkazu pod init vytvořte soubor podu s názvem Podfile.

  3. Obsah souboru Podfile nahraďte následujícím obsahem. Aktualizujte název target na název vaší aplikace místo AppName. Podle potřeby aktualizujte verzi platformy nebo podu.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Spusťte pod install k instalaci sady Speech SDK.

Případně si stáhněte binární CocoaPod a extrahujte jeho obsah. V projektu Xcode přidejte odkaz na extrahovaný soubor MicrosoftCognitiveServicesSpeech.xcframework a jeho obsah.

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Swift.

Tip

Další informace o používání sady Speech SDK pro Swift najdete v tématu Importu Objective-C do Swiftu.

Instalace sady Speech SDK pro Swift

Sada Speech SDK pro Swift je nativně dostupná jako balíček CocoaPod pro systémy Mac x64 a ARM.

Požadavky na systém pro Mac:

  • MacOS verze 10.14 nebo novější

Balíček macOS CocoaPod je k dispozici ke stažení a použití s integrovaným vývojovým prostředím (IDE) Xcode 9.4.1 nebo novějším.

  1. Přejděte do adresáře Xcode, kde se nachází váš soubor projektu .xcodeproj .

  2. Spuštěním příkazu pod init vytvořte soubor podu s názvem Podfile.

  3. Obsah souboru Podfile nahraďte následujícím obsahem. Aktualizujte target z názvu AppName na název vaší aplikace. Podle potřeby aktualizujte verzi platformy nebo podu.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Spusťte pod install ke spuštění instalace sady Speech SDK.

Případně si stáhněte binární CocoaPod a extrahujte jeho obsah. V projektu Xcode přidejte odkaz na extrahovaný soubor MicrosoftCognitiveServicesSpeech.xcframework a jeho obsah.

Referenční dokumentace | Package (PyPi) | Další ukázky na GitHubu

V tomto rychlém startu nainstalujete sadu Speech SDK pro Python.

Požadavky platformy

Sada Speech SDK pro Python je kompatibilní s Windows, Linuxem a macOS.

Sada Speech SDK pro Python podporuje následující distribuce v architekturách x64 a ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Důležité

Použijte nejnovější verzi LTS distribuce Linuxu. Pokud například používáte Ubuntu 20.04 LTS, použijte nejnovější verzi Ubuntu 20.04.X.

Sada Speech SDK závisí na následujících systémových knihovnách Linuxu:

  • Sdílené knihovny GNU C, včetně knihovny pro programování vláken POSIX, libpthreads.
  • Knihovna OpenSSL verze 1.x (libssl1) nebo 3.x (libssl3) a certifikáty (ca-certificates).
  • Sdílená knihovna pro aplikace ALSA (libasound2).

Spusťte tyto příkazy:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Nainstalujte verzi Pythonu z verze 3.8 nebo novější.

  • Pokud chcete zkontrolovat instalaci, otevřete terminál a spusťte příkaz python --version. Pokud je Python správně nainstalovaný, získáte odpověď, například Python 3.8.10.

  • Pokud používáte macOS nebo Linux, možná budete muset příkaz python3 --version spustit.

    Pokud chcete povolit použití python místo python3, spusťte alias python='python3' pro nastavení aliasu. Ukázky rychlého startu sady Speech SDK určují python využití.

Instalace sady Speech SDK pro Python

Před instalací sady Speech SDK pro Python se ujistěte, že splňuje požadavky na platformu.

Instalace z PyPI

Pokud chcete nainstalovat sadu Speech SDK pro Python, spusťte tento příkaz v okně konzoly:

pip install azure-cognitiveservices-speech

Upgradovat na nejnovější sadu Speech SDK

Pokud chcete upgradovat na nejnovější sadu Speech SDK, spusťte tento příkaz v okně konzoly:

pip install --upgrade azure-cognitiveservices-speech

Kontrolu toho, která verze sady Speech SDK pro Python je aktuálně nainstalovaná, můžete zkontrolovat kontrolou azure.cognitiveservices.speech.__version__ proměnné. Spusťte například tento příkaz v okně konzoly:

pip list

Použití sady Speech SDK

Přidejte následující příkaz importu pro použití sady Speech SDK v projektu Pythonu:

import azure.cognitiveservices.speech as speechsdk

Ukázky kódu

Podrobné ukázky jsou k dispozici v úložišti Azure-Samples/cognitive-services-speech-sdk na GitHubu. Existují ukázky pro C# (včetně UPW a Unity), C++, Java, JavaScriptu (včetně prohlížeče a Node.js), Objective-C, Pythonu a Swiftu. Ukázky kódu pro Go jsou k dispozici v úložišti Microsoft/cognitive-services-speech-sdk-go na GitHubu.