Einführung

Abgeschlossen

Die Datenvirtualisierung in SQL Server 2025 ist die Möglichkeit, auf Daten zuzugreifen, wo sie sich befinden. Die Datenvirtualisierung integriert Daten zur Abfragezeit, ohne die ursprünglichen Daten zu replizieren oder zu verschieben.

In diesem Schulungsmodul werden die Datenvirtualisierungsoptionen in SQL Server 2025 überprüft, einschließlich:

  • PolyBase-Dienste
  • REST-API-Connectors wie Azure Data Lake Storage, Azure Blob Storage und Amazon S3-kompatibler Objektspeicher, der neuen Zugriff mit Datenvirtualisierung ermöglicht
  • Transact-SQL (T-SQL), das für die Datenvirtualisierung verwendet wird, einschließlich OPENROWSET, CREATE EXTERNAL TABLE (CET) und CREATE EXTERNAL TABLE AS SELECT (CETAS)

Prinzipien der Datenvirtualisierung

Die Datenvirtualisierung basiert auf drei Prinzipien:

  • Datenstraktion: Die Datenstraktion blendet die Komplexität des Datenzugriffs aus dem zugrunde liegenden Datensystem, Formaten und Strukturen aus.

  • Null-Replikation: Im Gegensatz zu herkömmlichen Extract-Transform-Load (ETL)-Prozessen muss bei der Datenvirtualisierung die Daten nicht in einem separaten Repository gesammelt werden, um sie in das Zielformat zu transformieren. Stattdessen werden Transformation und Aggregation in Echtzeit durchgeführt.

  • Echtzeitdaten: Da die Datenvirtualisierung eine Verbindung mit der Datenquelle unterwegs herstellt, werden immer die neuesten verfügbaren Daten verwendet.

Vorteile der Datenvirtualisierung

Die Datenvirtualisierung hat die folgenden großen Vorteile:

  • Keine Datenverschiebung: Greift auf Daten an seinem aktuellen Speicherort zu.

  • T-SQL-Sprache: Verwendet alle Vorteile der T-SQL-Sprache, deren Befehle, Verbesserungen und Vertrautheit.

  • Eine Quelle für alle Ihre Daten: Verwendet SQL Server 2025 als einzelne Datenquelle und Data Hub für alle erforderlichen Daten, um die Datenkomplexität aus Anwendungen auszublenden. Datenbankadministratoren und Datentechniker können eine einzelne Umgebung verwalten.

  • Sicherheit: Verwendet SQL Server-Sicherheitsfeatures für granulare Berechtigungen, die Verwaltung von Anmeldeinformationen und die Kontrolle.

  • Kostenflexibilität: Ist in allen SQL Server 2025-Editionen verfügbar.

Anwendungsfälle für die Datenvirtualisierung

SQL Server 2025 bietet die folgenden Wichtigsten Anwendungsfälle für die Datenvirtualisierung:

  • Datenbankinterne Analysen: Nutzen und kombinieren Sie bei der Verwendung der Datenvirtualisierung alle SQL Server-Funktionen, und profitieren Sie von der Vertrautheit mit ihnen.
  • Auslagern oder Exportieren von Daten in andere Datenquellen.
  • Datenhub: Verwenden Sie SQL Server als zentralen Hub, um verschiedene Datenquellen und Dateien zu verbinden, zu schützen und abzufragen, um die Komplexität von Anwendungen auszublenden. Es ist nicht erforderlich, ein ETL-Tool zum Aggregieren, Kopieren oder Verschieben der Daten in einen Stagingbereich zu verwenden.

Screenshot von SQL Server als Data Hub für die Datenvirtualisierung.

Lernziele

Nachdem Sie dieses Modul abgeschlossen haben, haben Sie folgende Aufgaben:

  • Verstehen der Vorteile und Prinzipien der Datenvirtualisierung.
  • Wissen Sie, was PolyBase ist und wie Sie ihre Funktionen verwenden.
  • Sind mit Objektspeicherlösungen und SQL Server 2025-Unterstützung für S3-kompatible Objektspeicher vertraut.
  • Erfahren Sie, wie Sie PolyBase auf SQL Server 2025 installieren und konfigurieren.
  • Erfahren Sie, wie Sie mithilfe von PolyBase in SQL Server 2025 auf externe Daten zugreifen und diese abfragen können.

Voraussetzungen

  • Grundlegendes Arbeitswissen von SQL Server 2025
  • Grundlegende Kenntnisse der T-SQL- und SQL-Abfrageausführung
  • SQL Server 2025 installiert
  • SQL Server Management Studio (SSMS) installiert