Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Esta página ajuda você a entender o fluxo de trabalho de ingestão do SQL Server, incluindo os fatores que determinam sua abordagem de instalação e as etapas envolvidas para diferentes personas de usuário.
CDC padrão versus CDC integrado
SQL Server dá suporte a duas arquiteturas de ingestão. A tabela a seguir os compara:
| Característica | CDC padrão (baseado em gateway) | CDC integrado (Beta) |
|---|---|---|
| Número de pipelines | 2 (portal de ingestão e fluxo de ingestão) | Um (fluxo unificado) |
| Configuração | Crie um gateway e crie um pipeline de ingestão que referencie a ID do gateway | Criar um único pipeline que faça referência a uma conexão do Unity Catalog |
| Modo Gateway | O gateway fica em execução continuamente. | O pipeline incorpora a extração em cada atualização |
| Referência de conexão | ingestion_gateway_id |
connection_name (uma conexão do Unity Catalog) |
| Tipo de conector | Implícito | Explícito: connector_type: CDC |
| Volume de preparo | O gateway gerencia o volume de preparação internamente | Você configura o volume de preparação por meio de data_staging_options. O pipeline cria automaticamente um, se não especificado. |
A mesma configuração de banco de dados de origem se aplica a ambas as arquiteturas. Consulte Configurar Microsoft SQL Server para ingestão em Azure Databricks. Para obter mais informações, consulte Criar um pipeline CDC integrado para SQL Server.
Disponibilidade de funcionalidades
| Característica | Availability |
|---|---|
| Criação de pipelines com base em interface gráfica |
|
| Criação de pipeline baseada em API |
|
| Pacotes de Automação Declarativa |
|
| Ingestão incremental |
|
| Governança do Catálogo do Unity |
|
| Orquestração com Lakeflow Jobs |
|
| SCD do tipo 2 |
|
| Seleção e desseleção de coluna baseada em API |
|
| Filtragem de linha baseada em API |
|
| Evolução do esquema automatizado: colunas novas e excluídas |
|
| Evolução automatizada do esquema: alterações de tipo de dados |
|
| Evolução automatizada do esquema: renomeações de coluna |
Requer uma atualização completa. |
| Evolução do esquema automatizado: novas tabelas |
Se você ingerir o esquema completo. Consulte as limitações no número de tabelas para cada pipeline. |
| Quantidade máxima de tabelas por pipeline | 250 |
Métodos de autenticação
| Método de autenticação | Availability |
|---|---|
| OAuth U2M |
|
| OAuth M2M |
|
| OAuth (token de atualização manual) |
|
| Autenticação básica (nome de usuário/senha) |
|
| Autenticação básica (chave de API) |
|
| Autenticação básica (chave JSON da conta de serviço) |
|
O que saber antes de começar
| Tópico | Por que isso importa |
|---|---|
| Persona de usuário do Azure Databricks | O fluxo de trabalho depende da persona do usuário do Azure Databricks:
|
| Variação do banco de dados | A configuração do banco de dados de origem depende do ambiente de implantação do SQL Server. |
| Método de controle de alterações | A configuração do banco de dados de origem depende de como você escolhe controlar as alterações na origem. |
| Método de autenticação | As etapas para criar uma conexão dependem do método de autenticação escolhido. |
| Interface | As etapas para criar uma conexão, um gateway e um pipeline dependem da interface. |
| Frequência de ingestão | O agendamento do pipeline depende de seus requisitos de latência e custo. |
| Padrões comuns | Dependendo das suas necessidades de ingestão, o pipeline pode usar configurações como acompanhamento de histórico, seleção de coluna e filtragem de linhas. As configurações com suporte variam de acordo com o conector. Veja Disponibilidade de funcionalidades. |
Iniciar a ingestão a partir do SQL Server
A tabela a seguir fornece uma visão geral do fluxo de trabalho de ingestão do SQL Server de ponta a ponta, com base no tipo de usuário:
| Utilizador | Steps |
|---|---|
| Admin |
|
| Não administrador | Use qualquer interface com suporte para criar um gateway e um pipeline. Consulte Ingestão de dados do SQL Server. |