Carregar dados no Azure Synapse Analytics usando um pipeline do Azure Data Factory ou do Synapse

Artigo
07/20/2023

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!

O Azure Synapse Analytics é um banco de dados com base na nuvem e expansível com capacidade de processar volumes imensos de dados, relacionais e não relacionais. O Azure Synapse Analytics foi desenvolvido com base na arquitetura MPP (processamento paralelo maciço) otimizada para cargas de trabalho de Data Warehouse corporativo. Ele oferece a elasticidade da nuvem com a flexibilidade de dimensionar o armazenamento e a computação de modo independente.

Agora está mais fácil do que nunca começar a usar o Azure Synapse Analytics. O Azure Data Factory e seu recurso de pipelines equivalentes no Azure Synapse fornecem um serviço de integração de dados totalmente gerenciado baseado em nuvem. Você pode usar o serviço para preencher o Azure Synapse Analytics com dados do sistema existente e poupar tempo ao criar suas soluções analíticas.

Os pipelines do Azure Data Factory ou do Synapse oferecem os seguintes benefícios para carregar dados no Azure Synapse Analytics:

Fácil de configurar: um assistente intuitivo de cinco etapas sem necessidade de script.
Suporte avançado de armazenamento de dados: suporte interno para um conjunto avançado de armazenamentos de dados locais e baseados em nuvem. Para obter uma lista detalhada, consulte a tabela de Suporte para repositórios de dados.
Seguro e em conformidade: os dados são transferidos via HTTPS ou ExpressRoute. A presença do serviço global garante que os dados nunca saiam do limite geográfico.
Desempenho incomparável usando o PolyBase: o uso do PolyBase é a maneira mais eficiente de mover dados para o Azure Synapse Analytics. Use o recurso de objeto binário em etapas para obter velocidades de alta carga de todos os tipos de armazenamentos de dados, incluindo armazenamento Azure Blob e Data Lake Store. O Polybase dá suporte ao Armazenamento de blobs do Azure e ao Azure Data Lake Store por padrão. Para saber os detalhes, veja Desempenho da atividade Copy.

Este artigo mostra como usar a ferramenta Copiar Dados para carregar dados do Banco de Dados SQL do Azure no Azure Synapse Analytics. Você pode seguir as etapas semelhantes para copiar dados de outros tipos de armazenamentos de dados.

Observação

Para obter mais informações, confira Copiar dados para ou do Azure Synapse Analytics.

Pré-requisitos

Assinatura do Azure: Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.
Azure Synapse Analytics: o data warehouse contém os dados copiados do banco de dados SQL. Se você não tiver um Azure Synapse Analytics, veja as instruções em Criar um Azure Synapse Analytics.
Banco de Dados SQL do Azure: Este tutorial copia os dados do conjunto de dados de amostra do Adventure Works LT no Banco de Dados SQL do Azure. Você pode criar um banco de dados de exemplo no Banco de Dados SQL seguindo as instruções em Criar um banco de dados de exemplo no Banco de Dados SQL do Azure.
Conta de armazenamento do Azure: armazenamento do Azure é usado como blob de processo de reparo na operação de cópia em massa. Se você não tiver uma conta de armazenamento do Azure, confira as instruções em Criar uma conta de armazenamento.

Criar uma data factory

Se você ainda não criou o data factory, siga as etapas no Início Rápido: crie um data factory usando o portal do Azure e o Estúdio do Azure Data Factory para criar um. Depois de criá-lo, navegue até o data factory no portal do Azure.
Selecione Abrir no bloco Abrir Estúdio do Azure Data Factory para iniciar o aplicativo Data Integration em uma guia separada.