Freigeben über


Schnellstart: Installieren des Speech SDK

Referenzdokumentation | Paket (NuGet) | Zusätzliche Beispiele auf GitHub

In diesem Schnellstart installieren Sie das Speech SDK für C#.

Plattformanforderungen

Das Speech SDK für C# ist mit Windows, Linux und macOS kompatibel.

Unter Windows müssen Sie die 64-Bit-Zielarchitektur verwenden. Windows 11 oder höher ist erforderlich.

Installieren Sie Microsoft Visual C++ Redistributable für Visual Studio 2015, 2017, 2019 und 2022 für Ihre Plattform. Bei der Erstinstallation dieses Pakets ist möglicherweise ein Neustart erforderlich.

Installieren des Speech SDK für C#

Das Speech SDK für C# ist als NuGet-Paket verfügbar und implementiert .NET Standard 2.0. Weitere Informationen finden Sie unter Microsoft.CognitiveServices.Speech.

Das Speech SDK für C# kann über die .NET Core-CLI mit dem folgenden dotnet add-Befehl installiert werden:

dotnet add package Microsoft.CognitiveServices.Speech

Referenzdokumentation | Paket (NuGet) | Zusätzliche Beispiele auf GitHub

In diesem Schnellstart installieren Sie das Speech SDK für C++.

Plattformanforderungen

Das Speech SDK für C++ ist mit Windows, Linux und macOS kompatibel.

Unter Windows müssen Sie die 64-Bit-Zielarchitektur verwenden. Windows 11 oder höher ist erforderlich.

Installieren Sie Microsoft Visual C++ Redistributable für Visual Studio 2015, 2017, 2019 und 2022 für Ihre Plattform. Bei der Erstinstallation dieses Pakets ist möglicherweise ein Neustart erforderlich.

Installieren des Speech SDK für C++

Das Speech SDK für C++ ist als NuGet-Paket verfügbar. Weitere Informationen finden Sie unter Microsoft.CognitiveServices.Speech.

Das Speech SDK für C++ kann über die .NET Core-CLI mit dem folgenden dotnet add-Befehl installiert werden:

dotnet add package Microsoft.CognitiveServices.Speech

Sie können diesen Leitfäden für weitere Optionen folgen.

In diesem Leitfaden erfahren Sie, wie Sie das Speech SDK für Linux installieren.

Gehen Sie wie nachfolgend beschrieben vor, um das SDK herunterzuladen und zu installieren. Die Schritte umfassen das Herunterladen der erforderlichen Bibliotheken und Headerdateien als .tar-Datei.

  1. Wählen Sie ein Verzeichnis für die Dateien des Speech SDK aus. Legen Sie die Umgebungsvariable SPEECHSDK_ROOT so fest, dass sie auf dieses Verzeichnis verweist. Diese Variable erleichtert es, in zukünftigen Befehlen auf das Verzeichnis zu verweisen.

    Um das Verzeichnis speechsdk in Ihrem Basisverzeichnis zu verwenden, führen Sie den folgenden Befehl aus:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Erstellen Sie das Verzeichnis, sofern es noch nicht vorhanden ist:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Laden Sie das .tar.gz-Archiv herunter, das die Speech SDK-Binärdateien enthält, und extrahieren Sie diese Dateien:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Überprüfen Sie den Inhalt des Verzeichnisses auf oberster Ebene des extrahierten Pakets:

    ls -l "$SPEECHSDK_ROOT"
    

    Die Verzeichnisauflistung sollte die Partnerhinweise und Lizenzdateien enthalten. Die Auflistung sollte auch ein include Verzeichnis enthalten, das Headerdateien (.h) enthält, und ein lib Verzeichnis, das Bibliotheken für arm32, arm64 und x64 bereitstellt.

    Path Description
    license.md License
    ThirdPartyNotices.md Partnerhinweise
    REDIST.txt Umverteilungshinweis
    include Erforderliche Headerdateien für C++
    lib/arm32 Zum Linken Ihrer Anwendung ist die native Bibliothek für ARM32 erforderlich.
    lib/arm64 Zum Linken Ihrer Anwendung ist die native Bibliothek für ARM64 erforderlich.
    lib/x64 Zum Linken Ihrer Anwendung ist die native Bibliothek für x64 erforderlich.

Referenzdokumentation | Paket (Go) | Zusätzliche Beispiele auf GitHub

In diesem Schnellstart installieren Sie das Speech SDK für Go.

Plattformanforderungen

Das Speech SDK für Go unterstützt die folgenden Distributionen für die x64-Architektur:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Important

Verwenden Sie das neueste LTS-Release der Linux-Distribution. Wenn Sie beispielsweise Ubuntu 20.04 LTS verwenden, verwenden Sie das neueste Release von Ubuntu 20.04.X.

Das Speech SDK hängt von den folgenden Linux-Systembibliotheken ab:

  • Freigegebene Bibliotheken der GNU C-Bibliothek, einschließlich der POSIX Threads Programming-Bibliothek libpthreads.
  • Die OpenSSL-Bibliothek, Version 1.x (libssl1) oder 3.x (libssl3), und Zertifikate (ca-certificates).
  • Die freigegebene Bibliothek für ALSA-Anwendungen (libasound2)

Führen Sie diese Befehle aus.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Installieren Sie die Go-Binärversion 1.13 oder höher.

Installieren des Speech SDK für Go

Gehen Sie wie nachfolgend beschrieben vor, um das SDK herunterzuladen und zu installieren. Die Schritte umfassen das Herunterladen der erforderlichen Bibliotheken und Headerdateien als .tar-Datei.

  1. Wählen Sie ein Verzeichnis für die Dateien des Speech SDK aus. Legen Sie die Umgebungsvariable SPEECHSDK_ROOT so fest, dass sie auf dieses Verzeichnis verweist. Diese Variable erleichtert es, in zukünftigen Befehlen auf das Verzeichnis zu verweisen.

    Um das Verzeichnis speechsdk in Ihrem Basisverzeichnis zu verwenden, führen Sie den folgenden Befehl aus:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Erstellen Sie das Verzeichnis, sofern es noch nicht vorhanden ist:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Laden Sie das .tar.gz-Archiv herunter, das die Speech SDK-Binärdateien enthält, und extrahieren Sie diese Dateien:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Überprüfen Sie den Inhalt des Verzeichnisses auf oberster Ebene des extrahierten Pakets:

    ls -l "$SPEECHSDK_ROOT"
    

    Die Verzeichnisauflistung sollte die Partnerhinweise und Lizenzdateien enthalten. Die Auflistung sollte auch ein include Verzeichnis enthalten, das Headerdateien (.h) enthält, und ein lib Verzeichnis, das Bibliotheken für arm32, arm64 und x64 bereitstellt.

    Path Description
    license.md License
    ThirdPartyNotices.md Partnerhinweise
    REDIST.txt Umverteilungshinweis
    include Erforderliche Headerdateien für C++
    lib/arm32 Zum Linken Ihrer Anwendung ist die native Bibliothek für ARM32 erforderlich.
    lib/arm64 Zum Linken Ihrer Anwendung ist die native Bibliothek für ARM64 erforderlich.
    lib/x64 Zum Linken Ihrer Anwendung ist die native Bibliothek für x64 erforderlich.

Konfigurieren der Go-Umgebung

Mithilfe der folgenden Schritte können Sie Ihre Go-Umgebung für die Suche nach dem Speech SDK einrichten.

  1. Da für die Bindungen cgo verwendet wird, müssen Sie die Umgebungsvariablen festlegen, damit das SDK von Go gefunden werden kann.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Important

    Ersetzen Sie <architecture> durch die Prozessorarchitektur Ihrer CPU: x64, arm32 oder arm64.

  2. Zum Ausführen von Anwendungen und dem SDK müssen Sie dem Betriebssystem mitteilen, wo die Bibliotheken zu finden sind.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Important

    Ersetzen Sie <architecture> durch die Prozessorarchitektur Ihrer CPU: x64, arm32 oder arm64.

Referenzdokumentation | Zusätzliche Beispiele auf GitHub

In diesem Schnellstart installieren Sie das Speech SDK für Java.

Plattformanforderungen

Wählen Sie Ihre Zielumgebung aus:

Das Speech SDK für Java ist mit Windows, Linux und macOS kompatibel.

Unter Windows müssen Sie die 64-Bit-Zielarchitektur verwenden. Windows 11 oder höher ist erforderlich.

Installieren Sie Microsoft Visual C++ Redistributable für Visual Studio 2015, 2017, 2019 und 2022 für Ihre Plattform. Bei der Erstinstallation dieses Pakets ist möglicherweise ein Neustart erforderlich.

Das Speech SDK für Java unterstützt kein Windows auf ARM64.

Installieren Sie ein Java Development Kit wie z. B. Azul Zulu OpenJDK. Der Microsoft-Build von OpenJDK oder Ihr bevorzugtes JDK sollte ebenfalls funktionieren.

Installieren des Speech SDK für Java

In einigen Anweisungen wird eine bestimmte SDK-Version verwendet, z. B. 1.43.0. Um die neueste Version zu ermitteln, durchsuchen Sie unser GitHub-Repository.

Wählen Sie Ihre Zielumgebung aus:

In diesem Leitfaden erfahren Sie, wie Sie das Speech SDK für Java in der Java Runtime installieren.

Unterstützte Betriebssysteme

Das Paket mit dem Speech SDK für Java ist für die folgenden Betriebssysteme verfügbar:

Führen Sie die folgenden Schritte aus, um das Speech SDK für Java mithilfe von Apache Maven zu installieren:

  1. Installieren Sie Apache Maven.

  2. Öffnen Sie am gewünschten Speicherort für das neue Projekt eine Eingabeaufforderung, und erstellen Sie eine neue Datei pom.xml.

  3. Kopieren Sie den folgenden XML-Inhalt in pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.43.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Führen Sie den folgenden Maven-Befehl aus, um das Speech SDK und Abhängigkeiten zu installieren.

    mvn clean dependency:copy-dependencies
    

Referenzdokumentation | Paket (npm) | Zusätzliche Beispiele auf GitHub | Quellcode der Bibliothek

In diesem Schnellstart installieren Sie das Speech SDK für JavaScript.

Das Speech SDK für JavaScript ist als npm-Paket verfügbar. Weitere Informationen finden Sie unter microsoft-cognitiveservices-speech-sdk und im zugehörigen GitHub Repository cognitive-services-speech-sdk-js.

Plattformanforderungen

Berücksichtigen Sie die verschiedenen architektonischen Voraussetzungen bei Node.js und Clientwebbrowsern. Zum Beispiel ist das Document Object Model (DOM) für serverseitige Anwendungen nicht verfügbar. Das Node.js-Dateisystem steht clientseitigen Anwendungen nicht zur Verfügung.

Installieren Sie das Speech SDK für JavaScript

Verwenden Sie je nach Zielumgebung einen der folgenden Leitfäden:

In diesem Leitfaden erfahren Sie, wie Sie das Speech SDK für JavaScript zur Verwendung mit Node.js installieren.

  1. Installieren Sie Node.js.

  2. Erstellen Sie ein neues Verzeichnis, führen Sie npm init aus, und durchlaufen Sie die Eingabeaufforderungen.

  3. Führen Sie den folgenden Befehl npm install aus, um das Speech SDK für JavaScript zu installieren:

    npm install microsoft-cognitiveservices-speech-sdk
    

Weitere Informationen finden Sie in den Node.js Beispielen.

Verwenden des Speech SDK

  • Fügen Sie die folgende import-Anweisung hinzu, um das Speech SDK in Ihrem JavaScript-Projekt zu verwenden:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Weitere Informationen zu import finden Sie auf der JavaScript-Website im Thema zum Exportieren und Importieren.

Alternativ dazu können Sie eine require-Anweisung verwenden:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Referenzdokumentation | Paket (Download) | Zusätzliche Beispiele auf GitHub

In diesem Schnellstart installieren Sie das Speech SDK für Objective-C.

Tip

Weitere Informationen zur Verwendung des Speech SDK für Swift finden Sie unter Importieren von Objective-C in Swift.

Installieren Sie das Speech SDK für Objective-C

Das Speech SDK für Objective-C ist nativ als CocoaPod-Paket für x64- und Arm-basierte Systeme für Mac verfügbar.

Systemanforderungen für Mac:

  • Eine macOS-Version 10.14 oder höher

Das CocoaPod-Paket für macOS steht zum Download zur Verfügung und kann mit der integrierten Entwicklungsumgebung (Integrated Development Environment, IDE) Xcode 9.4.1 oder höher verwendet werden.

  1. Wechseln Sie zu dem Xcode Verzeichnis, in dem sich Ihre .xcodeproj-Projektdatei befindet.

  2. Führen Sie pod init aus, um eine Poddatei namens Podfile zu erstellen.

  3. Ersetzen Sie den Inhalt von Podfile durch folgenden Inhalt. Ersetzen Sie den target-Namen von AppName durch den Namen Ihrer App. Aktualisieren Sie bei Bedarf die Plattform- oder Podversion.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Führen Sie pod install aus, um das Speech SDK zu installieren.

Alternativ können Sie den binären CocoaPod herunterladen und seinen Inhalt extrahieren. Fügen Sie in Ihrem Xcode-Projekt einen Verweis auf den extrahierten Ordner MicrosoftCognitiveServicesSpeech.xcframework und dessen Inhalt hinzu.

Referenzdokumentation | Paket (Download) | Zusätzliche Beispiele auf GitHub

In diesem Schnellstart installieren Sie das Speech SDK für Swift.

Tip

Weitere Informationen zur Verwendung des Speech SDK für Swift finden Sie unter Importieren von Objective-C in Swift.

Installieren des Speech SDK für Swift

Das Speech SDK für Swift ist nativ als CocoaPod-Paket für x64- und ARM-basierte Systeme für Mac verfügbar.

Systemanforderungen für Mac:

  • Eine macOS-Version 10.14 oder höher

Das CocoaPod-Paket für macOS steht zum Download zur Verfügung und kann mit der integrierten Entwicklungsumgebung (Integrated Development Environment, IDE) Xcode 9.4.1 oder höher verwendet werden.

  1. Wechseln Sie zu dem Xcode Verzeichnis, in dem sich Ihre .xcodeproj-Projektdatei befindet.

  2. Führen Sie pod init aus, um eine Poddatei namens Podfile zu erstellen.

  3. Ersetzen Sie den Inhalt von Podfile durch folgenden Inhalt. Ersetzen Sie den target-Namen von AppName durch den Namen Ihrer App. Aktualisieren Sie bei Bedarf die Plattform- oder Podversion.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Führen Sie pod install aus, um das Speech SDK zu installieren.

Alternativ können Sie den binären CocoaPod herunterladen und seinen Inhalt extrahieren. Fügen Sie in Ihrem Xcode-Projekt einen Verweis auf den extrahierten Ordner MicrosoftCognitiveServicesSpeech.xcframework und dessen Inhalt hinzu.

Referenzdokumentation | Paket (PyPi) | Zusätzliche Beispiele auf GitHub

In diesem Schnellstart installieren Sie das Speech SDK für Python.

Plattformanforderungen

Das Speech SDK für Python ist mit Windows, Linux und macOS kompatibel.

Unter Windows müssen Sie die 64-Bit-Zielarchitektur verwenden. Windows 11 oder höher ist erforderlich.

Installieren Sie Microsoft Visual C++ Redistributable für Visual Studio 2015, 2017, 2019 und 2022 für Ihre Plattform. Bei der Erstinstallation dieses Pakets ist möglicherweise ein Neustart erforderlich.

Important

Stellen Sie sicher, dass Pakete der gleichen Zielarchitektur installiert sind. Wenn Sie beispielsweise das Redistributable-Paket für x64 installieren, installieren Sie auch das Python-Paket für x64.

Installieren Sie eine Python-Version ab 3.8.

  • Öffnen Sie ein Terminal, und führen Sie den Befehl python --version aus, um die Installation zu überprüfen. Wenn Python ordnungsgemäß installiert ist, erhalten Sie eine Antwort wie Python 3.8.10.

  • Wenn Sie macOS oder Linux verwenden, müssen Sie möglicherweise stattdessen den Befehl python3 --version ausführen.

    Um die Verwendung von python anstelle von python3 zu aktivieren, führen Sie alias python='python3' aus, um einen Alias einzurichten. Die Schnellstartbeispiele des Speech SDK geben die Verwendung von python an.

Installieren des Speech SDK für Python

Bevor Sie das Speech SDK für Python installieren, stellen Sie sicher, dass die Plattformvoraussetzungen erfüllt sind.

Installieren über PyPI

Führen Sie diesen Befehl in einem Konsolenfenster aus, um das Speech SDK für Python zu installieren:

pip install azure-cognitiveservices-speech

Upgrade auf das neueste Speech SDK

Führen Sie den folgenden Befehl in einem Konsolenfenster aus, um ein Upgrade auf das neueste Speech SDK durchzuführen:

pip install --upgrade azure-cognitiveservices-speech

Die derzeit installierte Version des Speech SDK für Python können Sie der Variablen azure.cognitiveservices.speech.__version__ entnehmen. Führen Sie beispielsweise diesen Befehl in einem Konsolenfenster aus:

pip list

Verwenden des Speech SDK

Fügen Sie die folgende import-Anweisung hinzu, um das Speech SDK in Ihrem Python-Projekt zu verwenden:

import azure.cognitiveservices.speech as speechsdk

Codebeispiele

Codebeispiele sind im Azure-Samples/cognitive-services-speech-sdk-Repository auf GitHub verfügbar. Es gibt Beispiele für C# (einschließlich Universelle Windows-Plattform (UWP)), C++, Java, JavaScript (einschließlich Browser und Node.js), Objective-C, Python und Swift. Codebeispiele für Go stehen im Repository Microsoft/cognitive-services-speech-sdk-go auf GitHub zur Verfügung.