Partilhar via


Guia de início rápido: instalar o SDK de fala

Pacote de documentação | de referência (NuGet) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para C#.

Os exemplos de código na documentação são escritos em C# 8 e executados no .NET standard 2.0.

Requisitos de plataforma

O SDK de Fala para C# é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Instalar o SDK de Fala para C#

O SDK de Fala para C# está disponível como um pacote NuGet e implementa o .NET Standard 2.0. Para obter mais informações, consulte Microsoft.CognitiveServices.Speech.

O SDK de Fala para C# pode ser instalado a partir da CLI do .NET usando o seguinte dotnet add comando:

dotnet add package Microsoft.CognitiveServices.Speech

Pode seguir estes guias para obter mais opções.

Este guia mostra como instalar o SDK de Fala para um aplicativo de console do .NET Framework (Windows).

Este guia requer:

Criar um projeto do Visual Studio e instalar o SDK de fala

Você precisa instalar o pacote NuGet do SDK de fala para poder fazer referência a ele em seu código. Para fazer isso, você pode primeiro precisar criar um projeto helloworld . Se você já tiver um projeto com a carga de trabalho de desenvolvimento da área de trabalho .NET disponível, poderá usar esse projeto e pular para Usar o Gerenciador de Pacotes NuGet para instalar o SDK de Fala.

Criar um projeto helloworld

  1. Abra o Visual Studio.

  2. Em Introdução, selecione Criar um novo projeto.

  3. Em Criar um novo projeto, escolha Aplicativo de Console (.NET Framework) e selecione Avançar.

  4. Em Configurar seu novo projeto, para Nome do projeto , digite helloworld, escolha ou crie o caminho do diretório em Local e selecione Criar.

  5. Na barra de menus do Visual Studio, selecione Ferramentas>Obter Ferramentas e Recursos. Esta etapa abre o Visual Studio Installer e exibe a caixa de diálogo Modificando .

  6. Verifique se a carga de trabalho de desenvolvimento da área de trabalho .NET está disponível. Se a carga de trabalho não estiver instalada, selecione-a e, em seguida, selecione Modificar para iniciar a instalação. Pode levar alguns minutos para baixar e instalar.

    Se o desenvolvimento da área de trabalho .NET já estiver selecionado, selecione Fechar para fechar a caixa de diálogo.

    Captura de tela que mostra a habilitação do desenvolvimento da área de trabalho .NET.

  7. Feche o instalador do Visual Studio.

Usar o Gerenciador de Pacotes NuGet para instalar o SDK de Fala

  1. No Gerenciador de Soluções, clique com o botão direito do mouse no projeto helloworld e selecione Gerenciar Pacotes NuGet para mostrar o Gerenciador de Pacotes NuGet.

  2. No canto superior direito, localize a caixa suspensa Origem do pacote e verifique se nuget.org está selecionado.

    Captura de tela que mostra o Gerenciador de Pacotes NuGet.

  3. No canto superior esquerdo, selecione Procurar.

  4. Na caixa de pesquisa, digite Microsoft.CognitiveServices.Speech e selecione Enter.

  5. Nos resultados da pesquisa, selecione o pacote Microsoft.CognitiveServices.Speech e, em seguida, selecione Instalar para instalar a versão estável mais recente.

    Captura de tela que mostra a instalação do pacote NuGet Microsoft.CognitiveServices.Speech.

  6. Aceite todos os contratos e licenças para iniciar a instalação.

    Depois que o pacote for instalado, uma confirmação aparecerá na janela Console do Gerenciador de Pacotes.

Escolha a arquitetura de destino

Para criar e executar o aplicativo de console, crie uma configuração de plataforma que corresponda à arquitetura do seu computador.

  1. No menu, selecione Build>Configuration Manager. É apresentada a caixa de diálogo Configuration Manager.

  2. Na caixa suspensa Plataforma de solução ativa, selecione Novo. A caixa de diálogo Nova plataforma de solução é exibida.

    Captura de ecrã que mostra a caixa de diálogo Gestor de configuração.

  3. Na caixa suspensa Digite ou selecione a nova plataforma:

    • Se você estiver executando o Windows de 64 bits, selecione x64.
    • Se você estiver executando o Windows de 32 bits, selecione x86.
  4. Selecione OK e, em seguida, Fechar.

Pacote de documentação | de referência (NuGet) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para C++.

Requisitos de plataforma

O Speech SDK for C++ é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Instalar o SDK de Fala para C++

O SDK de Fala para C++ está disponível como um pacote NuGet. Para obter mais informações, consulte Microsoft.CognitiveServices.Speech.

O SDK de fala para C++ pode ser instalado a partir da CLI do .NET usando o seguinte dotnet add comando:

dotnet add package Microsoft.CognitiveServices.Speech

Pode seguir estes guias para obter mais opções.

Este guia mostra como instalar o Speech SDK para Linux.

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem baixar as bibliotecas necessárias e os arquivos de cabeçalho como um arquivo .tar .

  1. Escolha um diretório para os arquivos do SDK de fala. Defina a SPEECHSDK_ROOT variável de ambiente para apontar para esse diretório. Esta variável facilita a referência ao diretório em comandos futuros.

    Para usar o diretório speechsdk no diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se ele não existir:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia o arquivo .tar.gz que contém os binários do Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide os conteúdos do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter os avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contém arquivos de cabeçalho (.h) e um diretório lib que contém bibliotecas para arm32, arm64, x64 e x86.

    Caminho Description
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    incluem Arquivos de cabeçalho necessários para C++
    LIB/ARM32 Biblioteca nativa para ARM32 necessária para vincular seu aplicativo
    LIB/ARM64 Biblioteca nativa para ARM64 necessária para vincular seu aplicativo
    LIB/X64 Biblioteca nativa para x64 necessária para ligar a sua aplicação
    LIB/X86 Biblioteca nativa para x86 necessária para ligar a sua aplicação

Pacote de documentação | de referência (Go) | Amostras adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Go.

Requisitos de plataforma

O Speech SDK for Go suporta as seguintes distribuições na arquitetura x64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Importante

Use a versão LTS mais recente da distribuição Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O Speech SDK depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca POSIX Threads Programming, libpthreads.
  • A biblioteca OpenSSL, versão 1.x (libssl1) ou 3.x (libssl3), e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound2).

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Instale a versão binária Go 1.13 ou posterior.

Instalar o SDK de Fala para Go

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem baixar as bibliotecas necessárias e os arquivos de cabeçalho como um arquivo .tar .

  1. Escolha um diretório para os arquivos do SDK de fala. Defina a SPEECHSDK_ROOT variável de ambiente para apontar para esse diretório. Esta variável facilita a referência ao diretório em comandos futuros.

    Para usar o diretório speechsdk no diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se ele não existir:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia o arquivo .tar.gz que contém os binários do Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide os conteúdos do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter os avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contém arquivos de cabeçalho (.h) e um diretório lib que contém bibliotecas para arm32, arm64, x64 e x86.

    Caminho Description
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    incluem Arquivos de cabeçalho necessários para C++
    LIB/ARM32 Biblioteca nativa para ARM32 necessária para vincular seu aplicativo
    LIB/ARM64 Biblioteca nativa para ARM64 necessária para vincular seu aplicativo
    LIB/X64 Biblioteca nativa para x64 necessária para ligar a sua aplicação
    LIB/X86 Biblioteca nativa para x86 necessária para ligar a sua aplicação

Configurar o ambiente Go

As etapas a seguir permitem que seu ambiente Go encontre o SDK de fala.

  1. Como as associações dependem do cgo, você precisa definir as variáveis de ambiente para que Go possa encontrar o SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Importante

    Substitua <architecture> pela arquitetura do processador da CPU: x64, arm32ou arm64.

  2. Para executar aplicativos e o SDK, você precisa informar ao sistema operacional onde encontrar as bibliotecas.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Importante

    Substitua <architecture> pela arquitetura do processador da CPU: x64, arm32ou arm64.

Documentação | de referência Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Java.

Requisitos de plataforma

Escolha o seu ambiente de destino:

O Speech SDK for Java é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

O SDK de Fala para Java não suporta Windows no ARM64.

Instale um Java Development Kit como o Azul Zulu OpenJDK. O Microsoft Build do OpenJDK ou o seu JDK preferido também deve funcionar.

Instalar o SDK de fala para Java

Algumas das instruções usam uma versão específica do SDK, como 1.24.2. Para verificar a versão mais recente, pesquise nosso repositório GitHub.

Escolha o seu ambiente de destino:

Este guia mostra como instalar o Speech SDK for Java no Java Runtime.

Sistemas operativos suportados

O pacote Speech SDK for Java está disponível para estes sistemas operacionais:

  • Windows: apenas 64 bits.
  • Mac: macOS X versão 10.14 ou posterior.
  • Linux: Consulte as distribuições Linux suportadas e as arquiteturas de destino.

Siga estas etapas para instalar o SDK de fala para Java usando o Apache Maven:

  1. Instale o Apache Maven.

  2. Abra um prompt de comando onde você deseja o novo projeto e crie um novo arquivo pom.xml .

  3. Copie o seguinte conteúdo XML para pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.40.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Execute o seguinte comando Maven para instalar o SDK de fala e dependências.

    mvn clean dependency:copy-dependencies
    

Pacote de documentação | de referência (npm) | Exemplos adicionais no código-fonte da Biblioteca GitHub |

Neste início rápido, você instala o SDK de fala para JavaScript.

O SDK de Fala para JavaScript está disponível como um pacote npm. Consulte microsoft-cognitiveservices-speech-sdk e seu repositório GitHub companheiro cognitive-services-speech-sdk-js.

Requisitos de plataforma

Compreenda as implicações arquitetônicas entre Node.js navegadores da Web e navegadores. Por exemplo, o modelo de objeto de documento (DOM) não está disponível para aplicativos do lado do servidor. O sistema de arquivos Node.js não está disponível para aplicativos do lado do cliente.

Instalar o SDK de Fala para JavaScript

Dependendo do ambiente de destino, use um dos seguintes guias:

Este guia mostra como instalar o SDK de fala para JavaScript para uso com o Node.js.

  1. Instalar o Node.js.

  2. Crie um novo diretório, execute npm inite percorra os prompts.

  3. Para instalar o SDK de Fala para JavaScript, execute o seguinte npm install comando:

    npm install microsoft-cognitiveservices-speech-sdk
    

Para obter mais informações, consulte as Node.js exemplos.

Usar o SDK de fala

  • Adicione a seguinte instrução import para usar o Speech SDK em seu projeto JavaScript:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Para obter mais informações sobre importo , consulte Exportar e importar no site JavaScript.

Como alternativa, você pode usar uma instrução require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Pacote de documentação | de referência (download) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Objective-C.

Gorjeta

Para obter mais informações sobre como usar o Speech SDK for Swift, consulte Importando Objective-C para o Swift.

Instalar o SDK de Fala para Objective-C

O Speech SDK for Objective-C está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados em ARM.

Requisitos do sistema para Mac:

  • Um macOS versão 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o Xcode 9.4.1 ou ambiente de desenvolvimento integrado (IDE) posterior.

  1. Vá para o diretório Xcode onde seu arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo pod chamado Podfile.

  3. Substitua o conteúdo do Podfile pelo seguinte conteúdo. Atualize o target nome de AppName para o nome do seu aplicativo. Atualize a plataforma ou a versão do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
    end
    
  4. Execute pod install para instalar o SDK de fala.

Em alternativa, descarregue o binário CocoaPod e extraia o seu conteúdo. Em seu projeto Xcode, adicione uma referência à pasta extraída MicrosoftCognitiveServicesSpeech.xcframework e seu conteúdo.

Nota

Os desenvolvedores .NET podem criar aplicativos macOS nativos usando a estrutura de aplicativos Xamarin.Mac. Para obter mais informações, consulte Xamarin.Mac.

Pacote de documentação | de referência (download) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Swift.

Gorjeta

Para obter mais informações sobre como usar o Speech SDK for Swift, consulte Importando Objective-C para o Swift.

Instalar o SDK de fala para Swift

O Speech SDK for Swift está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados em ARM.

Requisitos do sistema para Mac:

  • Um macOS versão 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o Xcode 9.4.1 ou ambiente de desenvolvimento integrado (IDE) posterior.

  1. Vá para o diretório Xcode onde seu arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo pod chamado Podfile.

  3. Substitua o conteúdo do Podfile pelo seguinte conteúdo. Atualize o target nome de AppName para o nome do seu aplicativo. Atualize a plataforma ou a versão do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
    end
    
  4. Execute pod install para instalar o SDK de fala.

Em alternativa, descarregue o binário CocoaPod e extraia o seu conteúdo. Em seu projeto Xcode, adicione uma referência à pasta extraída MicrosoftCognitiveServicesSpeech.xcframework e seu conteúdo.

Nota

Os desenvolvedores .NET podem criar aplicativos macOS nativos usando a estrutura de aplicativos Xamarin.Mac. Para obter mais informações, consulte Xamarin.Mac.

Pacote de documentação | de referência (PyPi) | Amostras adicionais no GitHub

Neste início rápido, você instala o Speech SDK for Python.

Requisitos de plataforma

O Speech SDK for Python é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Importante

Certifique-se de que os pacotes da mesma arquitetura de destino estão instalados. Por exemplo, se você instalar o pacote redistribuível x64, instale o pacote Python x64.

Instale uma versão do Python a partir da versão 3.8 ou posterior.

  • Para verificar a sua instalação, abra um terminal e execute o comando python --version. Se o Python foi instalado corretamente, você receberá uma resposta como Python 3.8.10.

  • Se você estiver usando macOS ou Linux, talvez seja necessário executar o comando python3 --version .

    Para habilitar o uso de em vez de python python3, execute alias python='python3' para configurar um alias. Os exemplos de início rápido do SDK de fala especificam python o uso.

Instalar o SDK de Fala para Python

Antes de instalar o Speech SDK for Python, certifique-se de satisfazer os requisitos da plataforma.

Instalar a partir do PyPI

Para instalar o Speech SDK for Python, execute este comando em uma janela do console:

pip install azure-cognitiveservices-speech

Atualize para o SDK de fala mais recente

Para atualizar para o SDK de fala mais recente, execute este comando na janela do console:

pip install --upgrade azure-cognitiveservices-speech

Você pode verificar qual versão do Speech SDK for Python está instalada atualmente inspecionando a azure.cognitiveservices.speech.__version__ variável. Por exemplo, execute este comando em uma janela do console:

pip list

Usar o SDK de fala

Adicione a seguinte instrução import para usar o Speech SDK em seu projeto Python:

import azure.cognitiveservices.speech as speechsdk