Instalar as ferramentas de Big Data do SQL Server 2019
Aplica-se a: SQL Server 2019 (15.x)
Importante
O complemento Clusters de Big Data do Microsoft SQL Server 2019 será desativado. O suporte para Clusters de Big Data do SQL Server 2019 será encerrado em 28 de fevereiro de 2025. Todos os usuários existentes do SQL Server 2019 com Software Assurance terão suporte total na plataforma e o software continuará a ser mantido por meio de atualizações cumulativas do SQL Server até esse momento. Para obter mais informações, confira a postagem no blog de anúncio e as opções de Big Data na plataforma do Microsoft SQL Server.
Este artigo descreve as ferramentas de cliente que devem ser instaladas para criar, gerenciar e usar Clusters de Big Data do SQL Server 2019. A seção a seguir fornece uma lista de ferramentas e links para instruções de instalação. Antes de implantar um cluster de Big Data, configure as ferramentas marcadas como necessárias no Windows ou no Linux.
Ferramentas de cluster de Big Data
A seguinte tabela lista as ferramentas comuns de cluster de Big Data e como instalá-las:
Ferramenta | Obrigatório | Descrição | Instalação |
---|---|---|---|
python |
Sim | O Python é uma linguagem de programação de alto nível interpretada e orientada a objeto com semântica dinâmica. Muitas partes dos clusters de Big Data do SQL Server usam o Python. | Instalar o Python |
CLI de Dados do Azure (azdata ) |
Sim | Ferramenta de linha de comando para instalar e gerenciar um cluster de Big Data. | Instalar |
kubectl 1 |
Sim | Ferramenta de linha de comando para monitorar o cluster do Kubernetes subjacente (mais informações). | Windows | Linux |
Azure Data Studio | Sim | Ferramenta gráfica multiplataforma para consultar o SQL Server. | Instalar |
Extensão de Virtualização de Dados | Sim | Extensão para o Azure Data Studio que fornece um assistente de Virtualização de Dados. | Instalar |
CLI do Azure2 | Para o AKS | Interface de linha de comando moderna para gerenciar serviços do Azure. Usada com implantações de cluster de Big Data do AKS (mais informações). | Instalar |
mssql-cli | Opcional | Interface de linha de comando moderna para consulta do SQL Server (mais informações). | Windows | Linux |
sqlcmd | Para alguns scripts | Ferramenta de linha de comando herdada para consulta do SQL Server (mais informações). Talvez seja necessário instalar o Microsoft ODBC Driver 11 for SQL Server antes de instalar o pacote SQLCMD. | Windows | Linux |
curl 3 |
Para alguns scripts | Ferramenta de linha de comando para transferência de dados com URLs. | Windows | Linux: instalar pacote do curl |
oc |
Necessário para as implantações do Red Hat OpenShift e do Red Hat OpenShift no Azure. | oc é a CLI (interface de linha de comando) do OpenShift. |
Como instalar a CLI |
1 É necessário usar o kubectl
versão 1.13 ou posterior. Além disso, a versão do kubectl
deve estar acima ou abaixo de uma versão secundária do cluster do Kubernetes. Caso deseje instalar uma versão específica no cliente do kubectl
, confira Instalar o binário do kubectl
por meio da ondulação (no Windows 10 e no Windows 11, use cmd.exe
e não o Windows PowerShell para executar a ondulação).
Dica
Para usar o kubectl
com um cluster implantado anteriormente no AKS (Serviço de Kubernetes do Azure), é necessário definir o contexto do cluster com o seguinte comando da CLI do Azure:
az aks get-credentials --name <aks_cluster_name> --resource-group <azure_resource_group_name>
2 É necessário estar usando a CLI do Azure versão 2.0.4 ou posterior. Execute az --version
para localizar a versão, se necessário.
3 Caso esteja executando-a no Windows 10 ou Windows 11, o curl
já estará no CAMINHO ao executar em um prompt de comando. Para outras versões do Windows, baixe o curl
usando o link e coloque-o no CAMINHO.
Quais ferramentas são necessárias?
A tabela anterior fornece todas as ferramentas comuns que são usadas com clusters de Big Data. As ferramentas que são necessárias dependem do cenário. Mas, em geral, as seguintes ferramentas são mais importantes para gerenciar, conectar e consultar o cluster:
- CLI de Dados do Azure (
azdata
) kubectl
- Azure Data Studio
- Extensão de Virtualização de Dados
As ferramentas restantes só são necessárias em determinados cenários. A CLI do Azure pode ser usada para gerenciar os serviços do Azure associados a implantações do AKS. mssql-cli é uma ferramenta opcional, mas útil, que permite que você se conecte à instância mestra do SQL Server no cluster e execute consultas na linha de comando. O sqlcmd e o curl
são necessários se você planeja instalar dados de exemplo com o script do GitHub.
Instalar o Python offline
Em um computador com acesso à Internet, baixe um dos seguintes arquivos compactados que contêm o Python:
Sistema operacional Baixar Windows https://go.microsoft.com/fwlink/?linkid=2074021 Linux https://go.microsoft.com/fwlink/?linkid=2065975 OSX https://go.microsoft.com/fwlink/?linkid=2065976 Copie o arquivo compactado para o computador de destino e extraia-o em uma pasta de sua escolha.
Somente para o Windows, execute
installLocalPythonPackages.bat
nessa pasta e passe o caminho completo para a mesma pasta como um parâmetro.installLocalPythonPackages.bat "C:\python-3.6.6-win-x64-0.0.1-offline\0.0.1"
Baixar e instalar o Azure Data Studio
O Azure Data Studio fornece recursos e funcionalidades especificamente para Clusters de Big Data do SQL Server.
Obter o Azure Data Studio mais recente.
Para obter detalhes sobre a versão mais recente, confira as notas sobre a versão.
Próximas etapas
Depois de configurar as ferramentas, implante um cluster de Big Data do SQL Server 2019 no Kubernetes na nuvem ou localmente. Para obter mais informações, confira os seguintes artigos sobre implantação:
- Início Rápido: Implantar um cluster de Big Data do SQL Server no AKS (Serviço de Kubernetes do Azure)
- Como implantar o Clusters de Big Data do SQL Server no Kubernetes
Para saber mais sobre Clusters de Big Data, confira Introdução a Clusters de Big Data do SQL Server 2019.