Ler em inglês

Compartilhar via


Início Rápido: instalar o SDK de Fala

Escolha uma ferramenta ou linguagem de programação

Documentação de referência | Pacote (NuGet) | Exemplos adicionais no GitHub

Neste início rápido, você vai instalar o SDK de Fala para C#.

Os exemplos de código na documentação são gravados no C# 8 e executados no .NET Standard 2.0.

Requisitos de plataforma

O SDK de Fala para C# é compatível com Windows, Linux e macOS.

O SDK de Fala para C# oferece suporte apenas às seguintes distribuições nas arquiteturas x64, ARM32 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Use a versão LTS mais recente da distribuição do Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O SDK de Fala depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca de programação de Threads POSIX, libpthreads.
  • A biblioteca OpenSSL, a versão 1.x (libssl1) ou 3.x (libssl3) e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound2).

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instalar o SDK de Fala para C#

O SDK de Fala para C# está disponível como um pacote NuGet e implementa o .NET Standard 2.0. Para obter mais informações, confira Microsoft.CognitiveServices.Speech.

O SDK de Fala para C# pode ser instalado a partir da CLI do .NET usando o seguinte comando dotnet add:

dotnet add package Microsoft.CognitiveServices.Speech

Você pode seguir estes guias para obter mais opções.

Este guia mostra como instalar o SDK de Fala para um aplicativo de console do .NET Framework (Windows).

Este guia requer:

Criar um projeto do Visual Studio e instalar o SDK de Fala

Você precisa instalar o pacote NuGet do SDK de Fala para referenciá-lo no código. Para fazer isso, primeiro, é preciso criar um projeto helloworld. Se você já tem um projeto com a carga de trabalho do desenvolvimento para desktop com o .NET disponível, pode usar esse projeto e pular para a etapa Usar o Gerenciador do pacote NuGet para instalar o SDK de Fala.

Criar um projeto helloworld

  1. Abra o Visual Studio.

  2. Em Introdução, selecione Criar um novo projeto.

  3. Em Criar um projeto, escolha Aplicativo de Console (.NET Framework) e, em seguida, selecione Próximo.

  4. Em Configurar seu novo projeto, em Nome do projeto, insira helloworld, escolha ou crie o caminho do diretório em Local e selecione Criar.

  5. Na barra de menus do Visual Studio, selecione Ferramentas>Obter Ferramentas e Recursos. Esta etapa abrirá o Instalador do Visual Studio e exibirá a caixa de diálogo Modificando.

  6. Verifique se a carga de trabalho desenvolvimento de área de trabalho do .NET está disponível. Se a carga de trabalho não estiver instalada, selecione-a e, em seguida, selecione Modificar para iniciar a instalação. Talvez o download e a instalação demore alguns minutos.

    Se o desenvolvimento de desktop .NET já estiver selecionado, selecione Fechar para fechar a caixa de diálogo.

    Captura de tela que mostra a ativação do desenvolvimento de área de trabalho do .NET.

  7. Feche o Instalador do Visual Studio.

Usar o Gerenciador do pacote NuGet para instalar o SDK de Fala

  1. No Gerenciador de Soluções, clique com o botão direito do mouse no projeto helloworld e selecione Gerenciar Pacotes NuGet para mostrar o Gerenciador de Pacotes NuGet.

  2. No canto superior direito, localize a caixa suspensa Origem do Pacote e verifique se nuget.org está selecionado.

    Captura de tela que mostra o Gerenciador de Pacotes NuGet.

  3. No canto superior esquerdo, selecione Procurar.

  4. Na caixa de pesquisa, insira Microsoft.CognitiveServices.Speech e selecione Enter.

  5. Nos resultados da pesquisa, selecione o pacote Microsoft.CognitiveServices.Speech e, em seguida, selecione Instalar para instalar a versão estável mais recente.

    Captura de tela que mostra a instalação do pacote NuGet Microsoft.CognitiveServices.Speech.

  6. Aceite todos os contratos e licenças para iniciar a instalação.

    Depois que o pacote for instalado, uma confirmação será exibida no Console do gerenciador de pacotes.

Escolha a arquitetura de destino

Para criar e executar o aplicativo de console, crie uma configuração de plataforma que corresponda à arquitetura do seu computador.

  1. No menu, selecione Compilar>Configuration Manager. A caixa de diálogo Gerenciador de Configurações é exibida.

  2. Na caixa suspensa Plataforma de solução ativa, selecione Novo. A caixa de diálogo Nova plataforma de solução é exibida.

    Captura de tela que mostra a caixa de diálogo do Configuration Manager.

  3. Na caixa suspensa Digite ou selecione a nova plataforma:

    • Se você estiver executando o Windows 64 bits, selecione x64.
    • Se você estiver executando o Windows 32 bits, selecione x86.
  4. Selecione OK e, em seguida, Fechar.

Documentação de referência | Pacote (NuGet) | Exemplos adicionais no GitHub

Neste início rápido, você vai instalar o SDK de Fala para C++.

Requisitos de plataforma

O SDK de Fala para C++ é compatível com Windows, Linux e macOS.

O SDK de Fala para C++ oferece suporte apenas às seguintes distribuições nas arquiteturas x64, ARM32 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Use a versão LTS mais recente da distribuição do Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O SDK de Fala depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca de programação de Threads POSIX, libpthreads.
  • A biblioteca OpenSSL, a versão 1.x (libssl1) ou 3.x (libssl3) e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound2).

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instalar o SDK de Fala para C++

O SDK de Fala para C++ está disponível como um pacote NuGet. Para obter mais informações, confira Microsoft.CognitiveServices.Speech.

O SDK de Fala para C++ pode ser instalado a partir da CLI do .NET usando o seguinte comando dotnet add:

dotnet add package Microsoft.CognitiveServices.Speech

Você pode seguir estes guias para obter mais opções.

Este guia mostra como instalar o SDK de Fala para Linux.

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem o download das bibliotecas e dos arquivos de cabeçalho necessários como um arquivo .tar.

  1. Escolha um diretório para os arquivos do SDK de Fala. Defina a variável de ambiente SPEECHSDK_ROOT para apontar para esse local. Essa variável facilita fazer referência a esse diretório em futuros comandos.

    Para usar o diretório speechsdk no seu diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se não houver um:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia os arquivos .tar.gz que contêm os binários do SDK de Fala:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide o conteúdo do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contenha arquivos de cabeçalho (.h) e um diretório lib que contenha bibliotecas para arm32, arm64, x64 e x86.

    Caminho Descrição
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    include Arquivos de cabeçalho necessários para C++
    lib/arm32 A biblioteca nativa para ARM32 que é necessária para vincular o aplicativo
    lib/arm64 A biblioteca nativa para ARM64 que é necessária para vincular o aplicativo
    lib/x64 Biblioteca nativa para x64 necessária para vincular o aplicativo
    lib/x86 Biblioteca nativa para x86 necessária para vincular o aplicativo

Documentação de referência | Pacote (Go) | Exemplos adicionais no GitHub

Neste início rápido, instale o SDK de Fala para Go.

Requisitos de plataforma

O SDK de Fala para Go dá suporte às seguintes distribuições na arquitetura x64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 12/11

Importante

Use a versão LTS mais recente da distribuição do Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O SDK de Fala depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca de programação de Threads POSIX, libpthreads.
  • A biblioteca OpenSSL, a versão 1.x (libssl1) ou 3.x (libssl3) e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound2).

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instale a versão 1.13 ou posterior do binário Go.

Instalar o SDK de Fala para Go

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem o download das bibliotecas e dos arquivos de cabeçalho necessários como um arquivo .tar.

  1. Escolha um diretório para os arquivos do SDK de Fala. Defina a variável de ambiente SPEECHSDK_ROOT para apontar para esse local. Essa variável facilita fazer referência a esse diretório em futuros comandos.

    Para usar o diretório speechsdk no seu diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se não houver um:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia os arquivos .tar.gz que contêm os binários do SDK de Fala:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide o conteúdo do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contenha arquivos de cabeçalho (.h) e um diretório lib que contenha bibliotecas para arm32, arm64, x64 e x86.

    Caminho Descrição
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    include Arquivos de cabeçalho necessários para C++
    lib/arm32 A biblioteca nativa para ARM32 que é necessária para vincular o aplicativo
    lib/arm64 A biblioteca nativa para ARM64 que é necessária para vincular o aplicativo
    lib/x64 Biblioteca nativa para x64 necessária para vincular o aplicativo
    lib/x86 Biblioteca nativa para x86 necessária para vincular o aplicativo

Configurar o ambiente Go

As etapas a seguir permitem que o ambiente Go encontre o SDK de Fala.

  1. Como as associações dependem de cgo, você precisa definir as variáveis de ambiente para que o Go possa encontrar o SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Importante

    Substitua <architecture> pela arquitetura do processador de sua CPU: x64, arm32 ou arm64.

  2. Para executar aplicativos e o SDK, você precisa informar o sistema operacional do local em que as bibliotecas estão.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Importante

    Substitua <architecture> pela arquitetura do processador de sua CPU: x64, arm32 ou arm64.

Documentação de referência | Exemplos adicionais no GitHub

Neste início rápido, você instalará o SDK de Fala para Java.

Requisitos de plataforma

Escolha o ambiente de destino:

O SDK de Fala para Java é compatível com Windows, Linux e macOS.

O SDK de Fala para Java dá suporte às seguintes distribuições nas arquiteturas x64, ARM32 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Use a versão LTS mais recente da distribuição do Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O SDK de Fala depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca de programação de Threads POSIX, libpthreads.
  • A biblioteca OpenSSL, a versão 1.x (libssl1) ou 3.x (libssl3) e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound2).

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instalar um Kit de Desenvolvimento do Java, como o Azul Zulu OpenJDK. O Build da Microsoft do OpenJDK ou seu JDK preferencial também devem funcionar.

Instalar o SDK de Fala para Java

Algumas das instruções usam uma versão específica do SDK, como 1.24.2. Para verificar a versão mais recente, pesquise nosso repositório do GitHub.

Escolha o ambiente de destino:

Este guia mostra como instalar o SDK de Fala para Java no Java Runtime.

Sistemas operacionais compatíveis

O pacote do SDK de Fala para Java está disponível para estes sistemas operacionais:

Siga estas etapas para instalar o SDK de Fala para Java usando o Apache Maven:

  1. Instale o Apache Maven.

  2. Abra um prompt de comando onde você deseja o novo projeto e crie um novo arquivo chamado pom.xml.

  3. Copie o conteúdo XML a seguir em pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.42.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Execute o comando Maven a seguir para instalar o SDK de Fala e as dependências.

    mvn clean dependency:copy-dependencies
    

Documentação de referência | Pacote (npm) | Exemplos adicionais no GitHub | Código-fonte da biblioteca

Neste início rápido, você instalará o SDK de Fala para JavaScript.

O SDK de Fala para JavaScript está disponível como um pacote npm. Confira microsoft-cognitiveservices-speech-sdk e o respectivo repositório complementar do GitHub, cognitive-services-speech-sdk-js.

Requisitos de plataforma

Compreender as implicações arquitetônicas entre o Node.js e os navegadores da Web do cliente. Por exemplo, o modelo de objeto de documento (DOM) não está disponível para aplicativos no lado do servidor. O sistema de arquivosNode.js não está disponível para aplicativos do lado do cliente.

Instalar o SDK de Fala para JavaScript

Dependendo do ambiente de destino, use um dos seguintes guias:

Este guia mostra como instalar o SDK de Fala para JavaScript para uso com o Node.js.

  1. Instale o Node.js.

  2. Crie um diretório, execute npm init e acompanhe os prompts.

  3. Para instalar o SDK de Fala para JavaScript, execute o comando npm install:

    npm install microsoft-cognitiveservices-speech-sdk
    

Para obter mais informações, confira os Exemplos do Node.js.

Usar o SDK de Fala

  • Adicione a seguinte instrução de importação para usar o SDK de Fala em seu projeto JavaScript:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Para obter mais informações sobre import, consulte Exportar e Importar no site do JavaScript.

Como alternativa, você pode usar uma instrução require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Documentação de referência | Pacote (download) | Exemplos adicionais no GitHub

Neste início rápido, você instalará o SDK de Fala para Objective-C.

Dica

Para obter mais informações sobre como usar o SDK de Fala para Swift, confira Importação do Objective-C para Swift.

Instalar o SDK de Fala para Objective-C

O SDK de Fala para Objective-C está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados no ARM.

Requisitos do sistema para Mac:

  • versãoUm macOS versão 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o ambiente de desenvolvimento integrado (IDE) Xcode 9.4.1 ou posterior.

  1. Vá para o diretório Xcode onde o arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo de pod chamado Podfile.

  3. Substitua o conteúdo do arquivo Podfile pelo seguinte conteúdo. Atualize o nome target de AppName para o nome do seu aplicativo. Atualize a versão da plataforma ou do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
    end
    
  4. Execute pod install para instalar o SDK de Fala.

Como alternativa, baixe o CocoaPod binário e extraia seu conteúdo. No projeto Xcode, adicione uma referência à pasta MicrosoftCognitiveServicesSpeech.xcframework extraída e ao conteúdo dela.

Observação

Os desenvolvedores do .NET podem criar aplicativos macOS nativos usando a estrutura de aplicativos Xamarin.Mac. Para saber mais, confira Xamarin.Mac.

Documentação de referência | Pacote (download) | Exemplos adicionais no GitHub

Neste início rápido, você instalará o SDK de Fala para Swift.

Dica

Para obter mais informações sobre como usar o SDK de Fala para Swift, confira Importação do Objective-C para Swift.

Instalar o SDK de Fala para Swift

O SDK de Fala para Swift está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados em ARM.

Requisitos do sistema para Mac:

  • versãoUm macOS versão 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o ambiente de desenvolvimento integrado (IDE) Xcode 9.4.1 ou posterior.

  1. Vá para o diretório Xcode onde o arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo de pod chamado Podfile.

  3. Substitua o conteúdo do arquivo Podfile pelo seguinte conteúdo. Atualize o nome target de AppName para o nome do seu aplicativo. Atualize a versão da plataforma ou do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
    end
    
  4. Execute pod install para instalar o SDK de Fala.

Como alternativa, baixe o CocoaPod binário e extraia seu conteúdo. No projeto Xcode, adicione uma referência à pasta MicrosoftCognitiveServicesSpeech.xcframework extraída e ao conteúdo dela.

Observação

Os desenvolvedores do .NET podem criar aplicativos macOS nativos usando a estrutura de aplicativos Xamarin.Mac. Para saber mais, confira Xamarin.Mac.

Documentação de referência | Pacote (PyPi) | Exemplos adicionais no GitHub

Neste início rápido, você instalará o SDK de Fala para Python.

Requisitos de plataforma

O SDK de Fala para Python é compatível com Windows, Linux e macOS.

O SDK de Fala para Python é compatível com as seguintes distribuições nas arquiteturas x64 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Use a versão LTS mais recente da distribuição do Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O SDK de Fala depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca de programação de Threads POSIX, libpthreads.
  • A biblioteca OpenSSL, a versão 1.x (libssl1) ou 3.x (libssl3) e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound2).

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instale uma versão do Python a partir da versão 3.8 ou posterior.

  • Para verificar sua instalação, abra um terminal e execute o comando python --version. Se o Python estiver instalado corretamente, você obterá uma resposta como Python 3.8.10.

  • Se você estiver usando macOS ou Linux, talvez precise executar o comando python3 --version em vez disso.

    Para habilitar o uso de python em vez de python3, execute alias python='python3' para configurar um alias. Os exemplos de início rápido do SDK de Fala especificam o uso de python.

Instalar o SDK de Fala para Python

Antes de instalar o SDK de Fala para Python, certifique-se de satisfazer os requisitos da plataforma.

Instalar do PyPI

Para instalar o SDK de Fala para Python, execute este comando em uma janela de console:

pip install azure-cognitiveservices-speech

Como atualizar para o SDK de Fala mais recente

Para atualizar para o SDK de Fala mais recente, execute este comando na janela do console:

pip install --upgrade azure-cognitiveservices-speech

Você pode verificar qual versão do SDK de Fala para Python está instalada no momento inspecionando a variável azure.cognitiveservices.speech.__version__. Por exemplo, execute este comando em uma janela do console:

pip list

Usar o SDK de Fala

Adicione a seguinte instrução de importação para usar o SDK de Fala em seu projeto do Python:

import azure.cognitiveservices.speech as speechsdk