Présentation
La virtualisation des données dans SQL Server 2025 est la possibilité d’accéder aux données où elles se trouvent. La virtualisation des données intègre les données au moment de la requête, sans répliquer ni déplacer les données d’origine.
La figure suivante montre l’étendue complète de la prise en charge de la virtualisation des données dans SQL Server 2025.
Ce module d’apprentissage passe en revue les options de virtualisation des données dans SQL Server 2025, notamment :
- Services PolyBase
- Connecteurs d’API REST tels qu’Azure Data Lake Storage, Azure Blob Storage et le stockage d’objets compatibles avec Amazon S3 qui permettent un nouvel accès aux données avec la virtualisation des données.
- Transact-SQL (T-SQL) utilisée pour la virtualisation des données, notamment OPENROWSET, CREATE EXTERNAL TABLE (CET) et CREATE EXTERNAL TABLE AS SELECT (CETAS)
Principes de virtualisation des données
La virtualisation des données repose sur trois principes :
Abstraction des données : L’abstraction des données masque les complexités de l’accès aux données à partir du système de données, des formats et des structures sous-jacents.
Réplication zéro : Contrairement à l’extraction-transformation (ETL), la virtualisation des données n’a pas besoin de collecter les données dans un référentiel distinct pour la transformer au format de destination, mais gère la transformation et l’agrégation à la volée.
Données en temps réel : Étant donné que la virtualisation des données se connecte à la source de données à la volée, elle utilise toujours les données disponibles les plus récentes.
Avantages de la virtualisation des données
La virtualisation des données présente les principaux avantages suivants :
Aucun déplacement de données : Accède aux données à son emplacement actuel.
Langage T-SQL : Utilise tous les avantages du langage T-SQL, de ses commandes, de ses améliorations et de sa familiarité.
Une source pour toutes vos données : Utilise SQL Server 2025 comme source de données unique et hub de données pour toutes les données requises, masquant la complexité des données des applications. Les administrateurs de base de données et les ingénieurs données peuvent gérer un environnement unique.
Sécurité : utilise des fonctionnalités de sécurité SQL Server pour les autorisations granulaires, la gestion des informations d’identification et le contrôle.
Flexibilité des coûts : Est disponible dans toutes les éditions de SQL Server 2025.
Cas d’utilisation de la virtualisation des données
SQL Server 2025 propose les principaux cas d’usage de virtualisation des données suivants :
Analytique dans la base de données : Utilisez et combinez toutes les fonctionnalités de SQL Server et la familiarité lors de l’utilisation de la virtualisation des données.
Déchargez ou exportez des données vers d’autres sources de données.
Hub de données : Utilisez SQL Server comme hub centralisé pour connecter, protéger et interroger différentes sources de données et fichiers, en masquant la complexité des applications. Il n’est pas nécessaire d’utiliser un outil ETL pour agréger, copier ou déplacer les données vers une zone intermédiaire.
Objectifs d’apprentissage
Une fois ce module terminé, vous devez :
- Comprendre les avantages et les principes de la virtualisation des données.
- Savez ce que PolyBase est et comment utiliser ses fonctionnalités.
- Familiarisez-vous avec les solutions de stockage d’objets et la prise en charge de SQL Server 2025 pour le stockage d’objets compatible avec S3.
- Savez comment installer et configurer PolyBase sur SQL Server 2025.
- Savez comment accéder aux données externes et les interroger à l’aide de PolyBase dans SQL Server 2025.
Conditions préalables
- Connaissances de base sur l’utilisation de SQL Server 2025
- Connaissance fondamentale de l’exécution des requêtes T-SQL et SQL
- SQL Server 2025 installé
- SQL Server Management Studio (SSMS) installé