Introdução
A virtualização de dados no SQL Server 2025 é a capacidade de acessar dados em que reside. A virtualização de dados integra dados em tempo de consulta, sem replicar ou mover os dados originais.
A figura a seguir mostra toda a extensão do suporte à virtualização de dados no SQL Server 2025.
Este módulo de treinamento analisa as opções de virtualização de dados no SQL Server 2025, incluindo:
- Serviços do PolyBase
- Conectores da API REST, como o Azure Data Lake Storage, o Armazenamento de Blobs do Azure e o armazenamento de objetos compatíveis com o Amazon S3, que permitem um novo acesso com a virtualização de dados
- Transact-SQL (T-SQL) usado para virtualização de dados, incluindo OPENROWSET, CREATE EXTERNAL TABLE (CET) e CREATE EXTERNAL TABLE AS SELECT (CETAS)
Princípios de virtualização de dados
A virtualização de dados depende de três princípios:
Abstração de dados: A abstração de dados oculta as complexidades do acesso a dados do sistema de dados subjacente, dos formatos e das estruturas.
Replicação zero: Ao contrário do ETL (extração-transformação-carga) tradicional, a virtualização de dados não precisa coletar os dados em um repositório separado para transformá-los no formato de destino, mas manipula a transformação e a agregação em tempo real.
Dados em tempo real: Como a virtualização de dados se conecta à fonte de dados em tempo real, ela sempre usa os dados disponíveis mais recentes.
Benefícios da virtualização de dados
A virtualização de dados tem os seguintes principais benefícios:
Sem movimentação de dados: Acessa dados em seu local atual.
Idioma T-SQL: Usa todos os benefícios da linguagem T-SQL, seus comandos, aprimoramentos e familiaridade.
Uma fonte para todos os seus dados: Usa o SQL Server 2025 como uma única fonte de dados e um hub de dados para todos os dados necessários, ocultando a complexidade dos dados de aplicativos. Administradores de banco de dados e engenheiros de dados podem manter um único ambiente.
Segurança: usa recursos de segurança do SQL Server para permissões granulares, gerenciamento de credenciais e controle.
Flexibilidade de custo: Está disponível em todas as edições do SQL Server 2025.
Casos de uso de virtualização de dados
O SQL Server 2025 oferece os seguintes casos principais de uso de virtualização de dados:
Análise no banco de dados: Use e combine todos os recursos e familiaridade do SQL Server ao usar a virtualização de dados.
Descarregar ou exportar dados para outras fontes de dados.
Hub de dados: Use o SQL Server como um hub centralizado para se conectar, proteger e consultar diferentes fontes de dados e arquivos, ocultando a complexidade dos aplicativos. Não é necessário usar uma ferramenta ETL para agregar, copiar ou mover os dados para uma área de preparo.
Objetivos de aprendizagem
Depois de concluir este módulo, você:
- Entenda os benefícios e os princípios da virtualização de dados.
- Saiba o que é o PolyBase e como usar seus recursos.
- Estão familiarizados com soluções de armazenamento de objetos e suporte ao SQL Server 2025 para armazenamento de objetos compatível com S3.
- Saiba como instalar e configurar o PolyBase no SQL Server 2025.
- Saiba como acessar e consultar dados externos usando o PolyBase no SQL Server 2025.
Pré-requisitos
- Conhecimento básico de trabalho do SQL Server 2025
- Conhecimento fundamental da execução de consulta T-SQL e SQL
- SQL Server 2025 instalado
- SQL Server Management Studio (SSMS) instalado