Conector de ingestão do Microsoft SQL Server

Esta página ajuda você a entender o fluxo de trabalho de ingestão do SQL Server, incluindo os fatores que determinam sua abordagem de instalação e as etapas envolvidas para diferentes personas de usuário.

CDC padrão versus CDC integrado

SQL Server dá suporte a duas arquiteturas de ingestão. A tabela a seguir os compara:

Característica CDC padrão (baseado em gateway) CDC integrado (Beta)
Número de pipelines 2 (portal de ingestão e fluxo de ingestão) Um (fluxo unificado)
Configuração Crie um gateway e crie um pipeline de ingestão que referencie a ID do gateway Criar um único pipeline que faça referência a uma conexão do Unity Catalog
Modo Gateway O gateway fica em execução continuamente. O pipeline incorpora a extração em cada atualização
Referência de conexão ingestion_gateway_id connection_name (uma conexão do Unity Catalog)
Tipo de conector Implícito Explícito: connector_type: CDC
Volume de preparo O gateway gerencia o volume de preparação internamente Você configura o volume de preparação por meio de data_staging_options. O pipeline cria automaticamente um, se não especificado.

A mesma configuração de banco de dados de origem se aplica a ambas as arquiteturas. Consulte Configurar Microsoft SQL Server para ingestão em Azure Databricks. Para obter mais informações, consulte Criar um pipeline CDC integrado para SQL Server.

Disponibilidade de funcionalidades

Característica Availability
Criação de pipelines com base em interface gráfica Ícone de verificação verde Suportado
Criação de pipeline baseada em API Ícone de verificação verde Suportado
Pacotes de Automação Declarativa Ícone de verificação verde Suportado
Ingestão incremental Ícone de verificação verde Suportado
Governança do Catálogo do Unity Ícone de verificação verde Suportado
Orquestração com Lakeflow Jobs Ícone de verificação verde Suportado
SCD do tipo 2 Ícone de verificação verde Suportado
Seleção e desseleção de coluna baseada em API Ícone de verificação verde Suportado
Filtragem de linha baseada em API Ícone do X Vermelho Sem suporte
Evolução do esquema automatizado: colunas novas e excluídas Ícone de verificação verde Suportado
Evolução automatizada do esquema: alterações de tipo de dados Ícone do X Vermelho Sem suporte
Evolução automatizada do esquema: renomeações de coluna Ícone do X Vermelho Sem suporte
Requer uma atualização completa.
Evolução do esquema automatizado: novas tabelas Ícone de verificação verde Suportado
Se você ingerir o esquema completo. Consulte as limitações no número de tabelas para cada pipeline.
Quantidade máxima de tabelas por pipeline 250

Métodos de autenticação

Método de autenticação Availability
OAuth U2M Ícone do X Vermelho Sem suporte
OAuth M2M Ícone do X Vermelho Sem suporte
OAuth (token de atualização manual) Ícone do X Vermelho Sem suporte
Autenticação básica (nome de usuário/senha) Ícone de verificação verde Suportado
Autenticação básica (chave de API) Ícone do X Vermelho Sem suporte
Autenticação básica (chave JSON da conta de serviço) Ícone do X Vermelho Sem suporte

O que saber antes de começar

Tópico Por que isso importa
Persona de usuário do Azure Databricks O fluxo de trabalho depende da persona do usuário do Azure Databricks:
  • Usuário único: um usuário administrador configura o banco de dados de origem e cria uma conexão do Catálogo do Unity, um gateway de ingestão e um pipeline de ingestão.
  • Multiusuário: um usuário administrador configura o banco de dados de origem e cria uma conexão para usuários não administradores criarem pares de gateway-pipeline.
Variação do banco de dados A configuração do banco de dados de origem depende do ambiente de implantação do SQL Server.
Método de controle de alterações A configuração do banco de dados de origem depende de como você escolhe controlar as alterações na origem.
Método de autenticação As etapas para criar uma conexão dependem do método de autenticação escolhido.
Interface As etapas para criar uma conexão, um gateway e um pipeline dependem da interface.
Frequência de ingestão O agendamento do pipeline depende de seus requisitos de latência e custo.
Padrões comuns Dependendo das suas necessidades de ingestão, o pipeline pode usar configurações como acompanhamento de histórico, seleção de coluna e filtragem de linhas. As configurações com suporte variam de acordo com o conector. Veja Disponibilidade de funcionalidades.

Iniciar a ingestão a partir do SQL Server

A tabela a seguir fornece uma visão geral do fluxo de trabalho de ingestão do SQL Server de ponta a ponta, com base no tipo de usuário:

Utilizador Steps
Admin
Não administrador Use qualquer interface com suporte para criar um gateway e um pipeline. Consulte Ingestão de dados do SQL Server.