Introdução
A virtualização de dados no SQL Server 2025 é a capacidade de acessar dados onde eles estão. A virtualização de dados integra dados no momento da consulta, sem replicar ou mover os dados originais.
A figura a seguir mostra a extensão total do suporte à virtualização de dados no SQL Server 2025.
Este módulo de treinamento analisa as opções de virtualização de dados no SQL Server 2025, incluindo:
- Serviços PolyBase
- Conectores de API REST, como o Armazenamento Azure Data Lake, o Armazenamento de Blobs do Azure e o armazenamento de objetos compatível com o Amazon S3, que permitem novos acessos com virtualização de dados
- Transact-SQL (T-SQL) usado para virtualização de dados, incluindo OPENROWSET, CREATE EXTERNAL TABLE (CET) e CREATE EXTERNAL TABLE AS SELECT (CETAS)
Princípios de virtualização de dados
A virtualização de dados baseia-se em três princípios:
Abstração de dados: A abstração de dados oculta as complexidades do acesso aos dados do sistema, formatos e estruturas de dados subjacentes.
Replicação zero: Ao contrário do ETL (extract-transform-load) tradicional, a virtualização de dados não precisa coletar os dados em um repositório separado para transformá-los no formato de destino, mas lida com a transformação e a agregação em tempo real.
Dados em tempo real: Como a virtualização de dados se conecta à fonte de dados em tempo real, ela sempre usa os dados disponíveis mais recentes.
Benefícios da virtualização de dados
A virtualização de dados tem os seguintes benefícios principais:
Sem movimentação de dados: Acede aos dados na sua localização atual.
Linguagem T-SQL: Usa todos os benefícios da linguagem T-SQL, seus comandos, aprimoramentos e familiaridade.
Uma fonte para todos os seus dados: Usa o SQL Server 2025 como uma única fonte de dados e hub de dados para todos os dados necessários, ocultando a complexidade dos dados dos aplicativos. Os administradores de banco de dados e engenheiros de dados podem manter um único ambiente.
Segurança: usa recursos de segurança do SQL Server para permissões granulares, gerenciamento de credenciais e controle.
Flexibilidade de custos: Está disponível em todas as edições do SQL Server 2025.
Casos de uso de virtualização de dados
O SQL Server 2025 oferece os seguintes casos principais de uso de virtualização de dados:
Análise no banco de dados: Use e combine todos os recursos e familiaridade do SQL Server ao usar a virtualização de dados.
Descarregar ou exportar dados para outras fontes de dados.
Hub de dados: Use o SQL Server como um hub centralizado para conectar, proteger e consultar diferentes fontes de dados e arquivos, ocultando a complexidade dos aplicativos. Não há necessidade de usar uma ferramenta ETL para agregar, copiar ou mover os dados para uma área de preparação.
Objetivos de aprendizagem
Depois de concluir este módulo, você:
- Compreender os benefícios e princípios da virtualização de dados.
- Saiba o que é o PolyBase e como utilizar as suas capacidades.
- Estão familiarizados com soluções de armazenamento de objetos e suporte do SQL Server 2025 para armazenamento de objetos compatível com o S3.
- Saiba como instalar e configurar o PolyBase no SQL Server 2025.
- Saiba como acessar e consultar dados externos usando o PolyBase no SQL Server 2025.
Pré-requisitos
- Conhecimento básico de trabalho do SQL Server 2025
- Conhecimento fundamental de execução de consultas T-SQL e SQL
- SQL Server 2025 instalado
- SQL Server Management Studio (SSMS) instalado