Introducción
La virtualización de datos en SQL Server 2025 es la capacidad de acceder a los datos donde reside. La virtualización de datos integra los datos en tiempo de consulta, sin replicar ni mover los datos originales.
En la ilustración siguiente se muestra la extensión completa de la compatibilidad con la virtualización de datos en SQL Server 2025.
En este módulo de entrenamiento se revisan las opciones de virtualización de datos en SQL Server 2025, entre las que se incluyen:
- Servicios de PolyBase
- Conectores de API REST como Azure Data Lake Storage, Azure Blob Storage y almacenamiento de objetos compatibles con Amazon S3 que permiten un nuevo acceso con virtualización de datos
- Transact-SQL (T-SQL) se utiliza para la virtualización de datos, incluyendo OPENROWSET, CREATE EXTERNAL TABLE (CET) y CREATE EXTERNAL TABLE AS SELECT (CETAS)
Principios de virtualización de datos
La virtualización de datos se basa en tres principios:
Abstracción de datos: La abstracción de datos oculta las complejidades del acceso a datos del sistema de datos subyacente, los formatos y las estructuras.
Replicación cero: A diferencia de la carga tradicional de extracción y transformación (ETL), la virtualización de datos no necesita recopilar los datos en un repositorio independiente para transformarlos en el formato de destino, pero controla la transformación y la agregación sobre la marcha.
Datos en tiempo real: Dado que la virtualización de datos se conecta al origen de datos sobre la marcha, siempre usa los datos disponibles más recientes.
Ventajas de la virtualización de datos
La virtualización de datos tiene las siguientes ventajas principales:
Sin movimiento de datos: Obtiene acceso a los datos en su ubicación actual.
Lenguaje T-SQL: Usa todas las ventajas del lenguaje T-SQL, sus comandos, mejoras y familiaridad.
Un origen para todos los datos: Usa SQL Server 2025 como un único origen de datos y un centro de datos para todos los datos necesarios, ocultando la complejidad de los datos de las aplicaciones. Los administradores de bases de datos y los ingenieros de datos pueden mantener un único entorno.
Seguridad: usa características de seguridad de SQL Server para permisos granulares, administración de credenciales y control.
Flexibilidad de costos: Está disponible en todas las ediciones de SQL Server 2025.
Casos de uso de virtualización de datos
SQL Server 2025 ofrece los siguientes casos de uso principales de virtualización de datos:
Análisis en base de datos: Use y combine todas las funcionalidades y familiaridad de SQL Server al usar la virtualización de datos.
Descargue o exporte datos a otros orígenes de datos.
Centro de datos: Use SQL Server como un centro centralizado para conectar, proteger y consultar diferentes orígenes de datos y archivos, ocultando la complejidad de las aplicaciones. No es necesario usar una herramienta ETL para agregar, copiar ni mover los datos a un área de almacenamiento provisional.
Objetivos de aprendizaje
Después de completar este módulo, podrá:
- Conozca las ventajas y los principios de la virtualización de datos.
- Sepa qué es PolyBase y cómo usar sus funcionalidades.
- Están familiarizados con las soluciones de almacenamiento de objetos y la compatibilidad de SQL Server 2025 con el almacenamiento de objetos compatible con S3.
- Sepa cómo instalar y configurar PolyBase en SQL Server 2025.
- Saber cómo acceder a datos externos y consultarlos mediante PolyBase en SQL Server 2025.
Prerrequisitos
- Conocimientos básicos de trabajo de SQL Server 2025
- Conocimientos básicos sobre la ejecución de consultas T-SQL y SQL
- SQL Server 2025 instalado
- SQL Server Management Studio (SSMS) instalado