Partilhar via


Guia de início rápido: instalar o SDK de fala

Documentação de referência | Pacote (NuGet) | Exemplos adicionais no GitHub

Neste início rápido, instala o Speech SDK para C#.

Requisitos de plataforma

O SDK de Fala para C# é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Instalar o SDK de Fala para C#

O SDK de Fala para C# está disponível como um pacote NuGet e implementa o .NET Standard 2.0. Para obter mais informações, consulte Microsoft.CognitiveServices.Speech.

O SDK de Fala para C# pode ser instalado a partir da CLI do .NET usando o seguinte dotnet add comando:

dotnet add package Microsoft.CognitiveServices.Speech

Documentação de referência | Pacote (NuGet) | Exemplos adicionais no GitHub

Nesta introdução rápida, instalas o SDK de Fala para C++.

Requisitos de plataforma

O Speech SDK for C++ é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Instalar o SDK de Fala para C++

O SDK de Fala para C++ está disponível como um pacote NuGet. Para obter mais informações, consulte Microsoft.CognitiveServices.Speech.

O SDK de fala para C++ pode ser instalado a partir da CLI do .NET usando o seguinte dotnet add comando:

dotnet add package Microsoft.CognitiveServices.Speech

Pode seguir estes guias para obter mais opções.

Este guia mostra como instalar o Speech SDK para Linux.

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem descarregar as bibliotecas necessárias e os ficheiros de cabeçalho como um ficheiro .tar.

  1. Escolha um diretório para os arquivos do SDK de fala. Defina a SPEECHSDK_ROOT variável de ambiente para apontar para esse diretório. Esta variável facilita a referência ao diretório em comandos futuros.

    Para usar o diretório speechsdk no diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se ele não existir:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia o arquivo .tar.gz que contém os binários do Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide os conteúdos do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter os avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contém arquivos de cabeçalho (.h) e um diretório lib que contém bibliotecas para arm32, arm64, x64 e x86.

    Caminho Descrição
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    incluir Arquivos de cabeçalho necessários para C++
    LIB/ARM32 Biblioteca nativa para ARM32 necessária para vincular seu aplicativo
    LIB/ARM64 Biblioteca nativa para ARM64 necessária para vincular seu aplicativo
    LIB/X64 Biblioteca nativa para x64 necessária para ligar a sua aplicação
    LIB/X86 Biblioteca nativa para x86 necessária para ligar a sua aplicação

Documentação de referência | Pacote (Go) | Amostras adicionais no GitHub

Neste guia de iniciação, instala o Speech SDK para Go.

Requisitos de plataforma

O Speech SDK for Go suporta as seguintes distribuições na arquitetura x64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Importante

Use a versão LTS mais recente da distribuição Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O Speech SDK depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca POSIX Threads Programming, libpthreads.
  • A biblioteca OpenSSL, versão 1.x (libssl1) ou 3.x (libssl3), e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound2).

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instale a versão binária Go 1.13 ou posterior.

Instalar o SDK de Fala para Go

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem descarregar as bibliotecas necessárias e os ficheiros de cabeçalho como um ficheiro .tar.

  1. Escolha um diretório para os arquivos do SDK de fala. Defina a SPEECHSDK_ROOT variável de ambiente para apontar para esse diretório. Esta variável facilita a referência ao diretório em comandos futuros.

    Para usar o diretório speechsdk no diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se ele não existir:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia o arquivo .tar.gz que contém os binários do Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide os conteúdos do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter os avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contém arquivos de cabeçalho (.h) e um diretório lib que contém bibliotecas para arm32, arm64, x64 e x86.

    Caminho Descrição
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    incluir Arquivos de cabeçalho necessários para C++
    LIB/ARM32 Biblioteca nativa para ARM32 necessária para vincular seu aplicativo
    LIB/ARM64 Biblioteca nativa para ARM64 necessária para vincular seu aplicativo
    LIB/X64 Biblioteca nativa para x64 necessária para ligar a sua aplicação
    LIB/X86 Biblioteca nativa para x86 necessária para ligar a sua aplicação

Configurar o ambiente Go

As etapas a seguir permitem que seu ambiente Go encontre o SDK de fala.

  1. Como as associações dependem do cgo, você precisa definir as variáveis de ambiente para que Go possa encontrar o SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Importante

    Substitua <architecture> pela arquitetura do processador da CPU: x64, arm32ou arm64.

  2. Para executar aplicativos e o SDK, você precisa informar ao sistema operacional onde encontrar as bibliotecas.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Importante

    Substitua <architecture> pela arquitetura do processador da CPU: x64, arm32ou arm64.

Documentação | de referência Exemplos adicionais no GitHub

Neste quickstart, instala-se o Speech SDK para Java.

Requisitos de plataforma

Escolha o seu ambiente de destino:

O Speech SDK for Java é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

O SDK de Fala para Java não suporta Windows no ARM64.

Instale um Java Development Kit como o Azul Zulu OpenJDK. O Microsoft Build do OpenJDK ou o seu JDK preferido também deve funcionar.

Instalar o SDK de fala para Java

Algumas das instruções usam uma versão específica do SDK, como 1.43.0. Para verificar a versão mais recente, pesquise nosso repositório GitHub.

Escolha o seu ambiente de destino:

Este guia mostra como instalar o Speech SDK para Java no Ambiente de Execução Java.

Sistemas operativos suportados

O pacote Speech SDK for Java está disponível para estes sistemas operacionais:

  • Windows: apenas 64 bits.
  • Mac: macOS X versão 10.14 ou posterior.
  • Linux: Consulte as distribuições Linux suportadas e as arquiteturas de destino.

Siga estas etapas para instalar o SDK de fala para Java usando o Apache Maven:

  1. Instale o Apache Maven.

  2. Abra um prompt de comando onde você deseja o novo projeto e crie um novo arquivo pom.xml .

  3. Copie o seguinte conteúdo XML para pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.43.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Execute o seguinte comando Maven para instalar o SDK de fala e dependências.

    mvn clean dependency:copy-dependencies
    

Documentação de referência | Pacote (npm) | Exemplos adicionais no GitHub | Código-fonte da biblioteca

Nesta introdução rápida, instala o SDK de fala para JavaScript.

O SDK de Fala para JavaScript está disponível como um pacote npm. Consulte microsoft-cognitiveservices-speech-sdk e o seu repositório GitHub correspondente cognitive-services-speech-sdk-js.

Requisitos de plataforma

Compreenda as implicações arquitetónicas entre Node.js e os navegadores web do cliente. Por exemplo, o modelo de objeto de documento (DOM) não está disponível para aplicativos do lado do servidor. O sistema de arquivos Node.js não está disponível para aplicativos do lado do cliente.

Instalar o SDK de Fala para JavaScript

Dependendo do ambiente de destino, use um dos seguintes guias:

Este guia mostra como instalar o SDK de fala para JavaScript para uso com o Node.js.

  1. Instalar o Node.js.

  2. Crie um novo diretório, execute npm inite percorra os prompts.

  3. Para instalar o SDK de Fala para JavaScript, execute o seguinte npm install comando:

    npm install microsoft-cognitiveservices-speech-sdk
    

Para obter mais informações, consulte as Node.js exemplos.

Usar o SDK de fala

  • Adicione a seguinte instrução import para usar o Speech SDK em seu projeto JavaScript:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Para obter mais informações sobre o import, consulte Exportar e Importar no site JavaScript.

Como alternativa, você pode usar uma instrução require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Documentação de referência | Pacote (download) | Exemplos adicionais no GitHub

Neste guia de início rápido, instala o SDK de Fala para Objective-C.

Gorjeta

Para obter mais informações sobre como usar o Speech SDK for Swift, consulte Importando Objective-C para o Swift.

Instalar o SDK de Fala para Objective-C

O Speech SDK for Objective-C está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados em ARM.

Requisitos do sistema para Mac:

  • Uma versão do macOS 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o Xcode 9.4.1 ou ambiente de desenvolvimento integrado (IDE) posterior.

  1. Vá para o diretório Xcode onde seu arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo pod chamado Podfile.

  3. Substitua o conteúdo do Podfile pelo seguinte conteúdo. Atualize o target nome de AppName para o nome da sua aplicação. Atualize a plataforma ou a versão do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Execute pod install para instalar o SDK de fala.

Alternativamente, descarregue o binário CocoaPod e extraia o seu conteúdo. Em seu projeto Xcode, adicione uma referência à pasta extraída MicrosoftCognitiveServicesSpeech.xcframework e seu conteúdo.

Documentação de referência | Pacote (download) | Exemplos adicionais no GitHub

Neste tutorial rápido, instala o Speech SDK para Swift.

Gorjeta

Para obter mais informações sobre como usar o Speech SDK for Swift, consulte Importando Objective-C para o Swift.

Instalar o SDK de fala para Swift

O Speech SDK for Swift está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados em ARM.

Requisitos do sistema para Mac:

  • Uma versão do macOS 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o Xcode 9.4.1 ou ambiente de desenvolvimento integrado (IDE) posterior.

  1. Vá para o diretório Xcode onde seu arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo pod chamado Podfile.

  3. Substitua o conteúdo do Podfile pelo seguinte conteúdo. Atualize o target nome de AppName para o nome da sua aplicação. Atualize a plataforma ou a versão do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Execute pod install para instalar o SDK de fala.

Alternativamente, descarregue o binário CocoaPod e extraia o seu conteúdo. Em seu projeto Xcode, adicione uma referência à pasta extraída MicrosoftCognitiveServicesSpeech.xcframework e seu conteúdo.

Documentação de referência | Pacote (PyPi) | Amostras adicionais no GitHub

Neste início rápido, você instala o Speech SDK for Python.

Requisitos de plataforma

O Speech SDK for Python é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Importante

Certifique-se de que os pacotes da mesma arquitetura de destino estão instalados. Por exemplo, se você instalar o pacote redistribuível x64, instale o pacote Python x64.

Instale uma versão do Python a partir da 3.8.

  • Para verificar a sua instalação, abra um terminal e execute o comando python --version. Se o Python foi instalado corretamente, você receberá uma resposta como Python 3.8.10.

  • Se você estiver usando macOS ou Linux, talvez seja necessário executar o comando python3 --version .

    Para habilitar o uso de python em vez de python3, execute alias python='python3' para configurar um alias. Os exemplos de início rápido do SDK de fala especificam o uso de python.

Instalar o SDK de Fala para Python

Antes de instalar o Speech SDK for Python, certifique-se de satisfazer os requisitos da plataforma.

Instalar a partir do PyPI

Para instalar o Speech SDK for Python, execute este comando em uma janela do console:

pip install azure-cognitiveservices-speech

Atualize para o SDK de fala mais recente

Para atualizar para o SDK de fala mais recente, execute este comando na janela do console:

pip install --upgrade azure-cognitiveservices-speech

Você pode verificar qual versão do Speech SDK for Python está instalada atualmente inspecionando a azure.cognitiveservices.speech.__version__ variável. Por exemplo, execute este comando em uma janela do console:

pip list

Usar o SDK de fala

Adicione a seguinte instrução import para usar o Speech SDK em seu projeto Python:

import azure.cognitiveservices.speech as speechsdk

Exemplos de código

Exemplos detalhados estão disponíveis no repositório Azure-Samples/cognitive-services-speech-sdk no GitHub. Há exemplos para C# (incluindo UWP e Unity), C++, Java, JavaScript (incluindo Browser e Node.js), Objective-C, Python e Swift. Exemplos de código para Go estão disponíveis no repositório Microsoft/cognitive-services-speech-sdk-go no GitHub.