Instalar as ferramentas de Big Data do SQL Server 2019

Aplica-se a: SQL Server 2019 (15.x)

Importante

O complemento Clusters de Big Data do Microsoft SQL Server 2019 será desativado. O suporte para Clusters de Big Data do SQL Server 2019 será encerrado em 28 de fevereiro de 2025. Todos os usuários existentes do SQL Server 2019 com Software Assurance terão suporte total na plataforma e o software continuará a ser mantido por meio de atualizações cumulativas do SQL Server até esse momento. Para obter mais informações, confira a postagem no blog de anúncio e as opções de Big Data na plataforma do Microsoft SQL Server.

Este artigo descreve as ferramentas de cliente que devem ser instaladas para criar, gerenciar e usar Clusters de Big Data do SQL Server 2019. A seção a seguir fornece uma lista de ferramentas e links para instruções de instalação. Antes de implantar um cluster de Big Data, configure as ferramentas marcadas como necessárias no Windows ou no Linux.

Ferramentas de cluster de Big Data

A seguinte tabela lista as ferramentas comuns de cluster de Big Data e como instalá-las:

Ferramenta Obrigatório Descrição Instalação
python Sim O Python é uma linguagem de programação de alto nível interpretada e orientada a objeto com semântica dinâmica. Muitas partes dos clusters de Big Data do SQL Server usam o Python. Instalar o Python
CLI de Dados do Azure (azdata) Sim Ferramenta de linha de comando para instalar e gerenciar um cluster de Big Data. Instalar
kubectl1 Sim Ferramenta de linha de comando para monitorar o cluster do Kubernetes subjacente (mais informações). Windows | Linux
Azure Data Studio Sim Ferramenta gráfica multiplataforma para consultar o SQL Server. Instalar
Extensão de Virtualização de Dados Sim Extensão para o Azure Data Studio que fornece um assistente de Virtualização de Dados. Instalar
CLI do Azure2 Para o AKS Interface de linha de comando moderna para gerenciar serviços do Azure. Usada com implantações de cluster de Big Data do AKS (mais informações). Instalar
mssql-cli Opcional Interface de linha de comando moderna para consulta do SQL Server (mais informações). Windows | Linux
sqlcmd Para alguns scripts Ferramenta de linha de comando herdada para consulta do SQL Server (mais informações). Talvez seja necessário instalar o Microsoft ODBC Driver 11 for SQL Server antes de instalar o pacote SQLCMD. Windows | Linux
curl3 Para alguns scripts Ferramenta de linha de comando para transferência de dados com URLs. Windows | Linux: instalar pacote do curl
oc Necessário para as implantações do Red Hat OpenShift e do Red Hat OpenShift no Azure. oc é a CLI (interface de linha de comando) do OpenShift. Como instalar a CLI

1 É necessário usar o kubectl versão 1.13 ou posterior. Além disso, a versão do kubectl deve estar acima ou abaixo de uma versão secundária do cluster do Kubernetes. Caso deseje instalar uma versão específica no cliente do kubectl, confira Instalar o binário do kubectl por meio da ondulação (no Windows 10 e no Windows 11, use cmd.exe e não o Windows PowerShell para executar a ondulação).

Dica

Para usar o kubectl com um cluster implantado anteriormente no AKS (Serviço de Kubernetes do Azure), é necessário definir o contexto do cluster com o seguinte comando da CLI do Azure:

az aks get-credentials --name <aks_cluster_name> --resource-group <azure_resource_group_name>

2 É necessário estar usando a CLI do Azure versão 2.0.4 ou posterior. Execute az --version para localizar a versão, se necessário.

3 Caso esteja executando-a no Windows 10 ou Windows 11, o curl já estará no CAMINHO ao executar em um prompt de comando. Para outras versões do Windows, baixe o curl usando o link e coloque-o no CAMINHO.

Quais ferramentas são necessárias?

A tabela anterior fornece todas as ferramentas comuns que são usadas com clusters de Big Data. As ferramentas que são necessárias dependem do cenário. Mas, em geral, as seguintes ferramentas são mais importantes para gerenciar, conectar e consultar o cluster:

  • CLI de Dados do Azure (azdata)
  • kubectl
  • Azure Data Studio
  • Extensão de Virtualização de Dados

As ferramentas restantes só são necessárias em determinados cenários. A CLI do Azure pode ser usada para gerenciar os serviços do Azure associados a implantações do AKS. mssql-cli é uma ferramenta opcional, mas útil, que permite que você se conecte à instância mestra do SQL Server no cluster e execute consultas na linha de comando. O sqlcmd e o curl são necessários se você planeja instalar dados de exemplo com o script do GitHub.

Instalar o Python offline

  1. Em um computador com acesso à Internet, baixe um dos seguintes arquivos compactados que contêm o Python:

    Sistema operacional Baixar
    Windows https://go.microsoft.com/fwlink/?linkid=2074021
    Linux https://go.microsoft.com/fwlink/?linkid=2065975
    OSX https://go.microsoft.com/fwlink/?linkid=2065976
  2. Copie o arquivo compactado para o computador de destino e extraia-o em uma pasta de sua escolha.

  3. Somente para o Windows, execute installLocalPythonPackages.bat nessa pasta e passe o caminho completo para a mesma pasta como um parâmetro.

    installLocalPythonPackages.bat "C:\python-3.6.6-win-x64-0.0.1-offline\0.0.1"
    

Baixar e instalar o Azure Data Studio

O Azure Data Studio fornece recursos e funcionalidades especificamente para Clusters de Big Data do SQL Server.

Obter o Azure Data Studio mais recente.

Para obter detalhes sobre a versão mais recente, confira as notas sobre a versão.

Próximas etapas

Depois de configurar as ferramentas, implante um cluster de Big Data do SQL Server 2019 no Kubernetes na nuvem ou localmente. Para obter mais informações, confira os seguintes artigos sobre implantação:

Para saber mais sobre Clusters de Big Data, confira Introdução a Clusters de Big Data do SQL Server 2019.