Sichern und Wiederherstellen dedizierter SQL-Pools in Azure Synapse Analytics

In diesem Artikel erfahren Sie, wie Sie Sicherungen und Wiederherstellungen in einem dedizierten Azure Synapse-SQL-Pool verwenden.

Mithilfe von Wiederherstellungspunkten des dedizierten SQL-Pools können Sie einen vorherigen Zustand Ihres Data Warehouse in der primären Region wiederherstellen oder kopieren. Mithilfe von georedundanten Data Warehouse-Sicherungen können Sie eine Wiederherstellung in einer anderen geografischen Region ausführen.

Hinweis

Nicht alle Features des dedizierten SQL Pools in Azure Synapse Arbeitsbereichen gelten für dedizierte SQL Pools (ehemals SQL DW) und umgekehrt. Wie Sie Arbeitsbereichsfunktionen für einen vorhandenen dedizierten SQL-Pool (ehemals SQL DW) aktivieren, erfahren Sie unter Aktivieren von Synapse-Arbeitsbereichsfunktionen für einen dedizierten SQL-Pool (ehemals SQL DW). Weitere Informationen finden Sie unter Was ist der Unterschied zwischen dedizierten SQL-Pools in Azure Synapse (ehemals SQL DW) und dedizierten SQL-Pools in einem Azure Synapse Analytics-Arbeitsbereich?.

Was ist eine Data Warehouse-Momentaufnahme?

Mit einer Data Warehouse-Momentaufnahme wird ein Wiederherstellungspunkt erstellt, mit dessen Hilfe Sie einen vorherigen Zustand Ihres Data Warehouse wiederherstellen oder kopieren können. Da ein dedizierter SQL-Pool ein verteiltes System ist, besteht eine Data Warehouse-Momentaufnahme aus vielen Dateien, die in Azure Storage gespeichert sind. Momentaufnahmen erfassen inkrementelle Änderungen der Daten, die in Ihrem Data Warehouse gespeichert sind.

Hinweis

Die RTO-Raten (Recovery Time Objective, Wiederherstellungszeitziel) für dedizierte SQL-Pools können variieren. Folgende Faktoren können sich auf die Wiederherstellungszeit auswirken:

  • Die Datenbankgröße
  • Der Standort des Quell- und Ziel-Data Warehouse (im Fall der Geowiederherstellung)
  • Data Warehouse-Momentaufnahme kann nicht als separate Datei exportiert werden (z. B. für Azure Storage, lokale Umgebung)

Eine Data Warehouse-Wiederherstellung ist ein neues Data Warehouse, das auf der Grundlage eines Wiederherstellungspunkts eines vorhandenen oder gelöschten Data Warehouse erstellt wird. Die Wiederherstellung Ihrer Data Warehouse-Instanz ist ein wesentlicher Bestandteil jeder Strategie für Geschäftskontinuität und Notfallwiederherstellung, da Ihre Daten nach versehentlichen Beschädigungen oder Löschungen neu erstellt werden. Die Data Warehouse-Momentaufnahme ist darüber hinaus ein leistungsstarker Mechanismus, mit dem Sie zu Test- und Entwicklungszwecken Kopien Ihres Data Warehouse erstellen können.

Hinweis

Die RTO-Raten (Recovery Time Objective, Wiederherstellungszeitziel) für dedizierte SQL-Pools können variieren. Folgende Faktoren können sich auf die Wiederherstellungszeit auswirken:

  • Die Datenbankgröße
  • Der Standort des Quell- und Ziel-Data Warehouse (im Fall der Geowiederherstellung)

Automatische Wiederherstellungspunkte

Bei Momentaufnahmen handelt es sich um ein integriertes Feature zum Erstellen von Wiederherstellungspunkten. Sie müssen das Feature nicht aktivieren. Der dedizierte SQL-Pool sollte jedoch für die Erstellung des Wiederherstellungspunkts einen aktiven Zustand aufweisen. Wenn er häufig angehalten wird, werden möglicherweise keine automatischen Wiederherstellungspunkte erstellt. Sie sollten daher einen benutzerdefinierten Wiederherstellungspunkt erstellen, bevor Sie den dedizierten SQL-Pool anhalten. Automatische Wiederherstellungspunkte können derzeit nicht von Benutzern gelöscht werden, da der Dienst mithilfe dieser Wiederherstellungspunkte SLAs für die Wiederherstellung verwaltet.

Die Momentaufnahmen Ihres Data Warehouse werden im Verlauf des Tages erstellt, und die generierten Wiederherstellungspunkte sind für sieben Tage verfügbar. Dieser Aufbewahrungszeitraum kann nicht geändert werden. Ein dedizierter SQL-Pool unterstützt eine RPO (Recovery Point Objective) von acht Stunden. Sie können das Data Warehouse in der primären Region anhand einer beliebigen Momentaufnahme wiederherstellen, die in den vergangenen sieben Tagen erstellt wurde.

Wenn Sie sehen möchten, wann die letzte Momentaufnahme gestartet wurde, führen Sie die folgende Abfrage in Ihrem dedizierten Online-SQL-Pool aus.

SELECT TOP 1 *
FROM sys.pdw_loader_backup_runs
ORDER BY run_id desc;

Hinweis

Sicherungen werden alle vier (4) Stunden durchgeführt, um eine SLA von acht (8) Stunden einzuhalten. Daher zeigt die dynamische Verwaltungsansicht sys.pdw_loader_backup_runs die Sicherungsaktivität alle vier (4) Stunden an.

Benutzerdefinierte Wiederherstellungspunkte

Dieses Feature ermöglicht das manuelle Auslösen von Momentaufnahmen, um vor und nach umfangreichen Änderungen Wiederherstellungspunkte Ihres Data Warehouse zu erstellen. Diese Funktion gewährleistet die logische Konsistenz von Wiederherstellungspunkten und sorgt somit für zusätzlichen Datenschutz und eine schnelle Wiederherstellung bei Workloadunterbrechungen oder Benutzerfehlern. Benutzerdefinierte Wiederherstellungspunkte sind sieben Tage lang verfügbar und werden automatisch für Sie gelöscht. Sie können die Aufbewahrungsdauer für benutzerdefinierte Wiederherstellungspunkte nicht ändern. 42 benutzerdefinierte Wiederherstellungspunkte werden jeweils garantiert. Vor der Erstellung eines weiteren Wiederherstellungspunkts müssen also erst andere Wiederherstellungspunkte gelöscht werden. Sie können mithilfe des Azure-Portals oder programmgesteuert nur über PowerShell oder die REST-APIs Momentaufnahmen auslösen, um benutzerdefinierte Wiederherstellungspunkte zu erstellen.

Hinweis

Wenn Wiederherstellungspunkte länger als 7 Tage zur Verfügung stehen sollen, stimmen Sie für diese Funktion ab.

Hinweis

T-SQL-Skript kann nicht für die Sicherung nach Bedarf verwendet werden. Benutzerdefinierte Wiederherstellungspunkte können mithilfe des Azure-Portals oder programmgesteuert über PowerShell oder die REST-APIs erstellt werden.

Wenn Sie nach einem langfristigen Sicherungskonzept (LTR) suchen:

  1. Erstellen Sie einen neuen benutzerdefinierten Wiederherstellungspunkt, oder verwenden Sie einen der automatisch generierten Wiederherstellungspunkte.
  2. Führen Sie die Wiederherstellung auf der Grundlage des neu erstellten Wiederherstellungspunkts in einem neuen Data Warehouse durch.
  3. Nach der Wiederherstellung ist der dedizierte SQL-Pool online. Halten Sie ihn dauerhaft an, um Computekosten zu sparen. Für die angehaltene Datenbank fallen Speichergebühren gemäß Azure Synapse-Speichertarif an.

Falls Sie eine aktive Kopie des wiederhergestellten Data Warehouse benötigen, können Sie die Datenbank fortsetzen. Dies sollte nur wenige Minuten dauern.

Erstellen benutzerdefinierter Wiederherstellungspunkte

Sie können programmgesteuert einen neuen benutzerdefinierten Wiederherstellungspunkt erstellen. Wählen Sie die richtige Methode basierend auf dem verwendeten SQL-Pool aus: Entweder einem eigenständigen dedizierten SQL-Pool (vormals SQL DW) oder einem dedizierten SQL-Pool in einem Synapse-Arbeitsbereich.

Azure PowerShell

REST-APIs

Löschen von benutzerdefinierten Wiederherstellungspunkten

Sie können einen bestimmten benutzerdefinierten Wiederherstellungspunkt programmgesteuert löschen. Wählen Sie die richtige Methode basierend auf dem verwendeten SQL-Pool aus: Entweder einem eigenständigen dedizierten SQL-Pool (vormals SQL DW) oder einem dedizierten SQL-Pool in einem Synapse-Arbeitsbereich.

Azure PowerShell

REST-APIs

Aufbewahrung des Wiederherstellungspunkts

In Folgenden sind ausführliche Details zu den Aufbewahrungszeiträumen für Wiederherstellungspunkte aufgeführt:

  1. Der dedizierte SQL-Pool löscht einen Wiederherstellungspunkt, wenn der Aufbewahrungszeitraum von sieben Tagen erreicht wird und insgesamt mindestens 42 (benutzerdefinierte und automatische) Wiederherstellungspunkte vorhanden sind.
  2. Wenn ein dedizierter SQL-Pool angehalten wurde, werden keine Momentaufnahmen erstellt.
  3. Das Alter eines Wiederherstellungspunkts basiert auf den absoluten Kalendertagen ab Erstellung des Wiederherstellungspunkts und umfasst auch Zeiten, in denen der SQL-Pool angehalten war.
  4. Es wird garantiert, dass ein dedizierter SQL-Pool jeweils 42 benutzerdefinierte Wiederherstellungspunkte oder 42 automatische Wiederherstellungspunkte speichern kann, solange diese Wiederherstellungspunkte den siebentägigen Aufbewahrungszeitraum nicht erreicht haben.
  5. Wenn eine Momentaufnahme erstellt wurde, dann der dedizierte SQL-Pool länger als sieben Tage angehalten und anschließend fortgesetzt wird, wird der Wiederherstellungspunkt so lange beibehalten, bis insgesamt 42 (benutzerdefinierte und automatische) Wiederherstellungspunkte vorhanden sind.

Aufbewahrung von Momentaufnahmen, wenn ein SQL-Pool gelöscht wird

Wenn Sie einen dedizierten SQL-Pool löschen, wird eine abschließende Momentaufnahme erstellt und sieben Tage lang gespeichert. Sie können den dedizierten SQL-Pool anhand des letzten Wiederherstellungspunkts wiederherstellen, der zum Zeitpunkt der Löschung erstellt wurde. Wenn der dedizierte SQL-Pool im angehaltenen Zustand gelöscht wird, wird keine Momentaufnahme erstellt. Erstellen Sie in diesem Fall einen benutzerdefinierten Wiederherstellungspunkt, bevor Sie den dedizierten SQL-Pool löschen.

Geosicherungen und Notfallwiederherstellung

Eine Geosicherung wird einmal täglich in einem gekoppelten Rechenzentrum erstellt. Die RPO für eine Geowiederherstellung beträgt 24 Stunden. Eine Geo-Wiederherstellung ist immer ein Datenverschiebungsvorgang, und der RTO hängt von der Datengröße ab. Nur die neueste Geo-Sicherung wird beibehalten. Sie können die Geosicherung auf einem Server in einer beliebigen anderen Region wiederherstellen, in der dedizierte SQL-Pools unterstützt werden. Mit einer Geosicherung wird sichergestellt, dass Sie ein Data Warehouse wiederherstellen können, wenn Sie nicht auf die Wiederherstellungspunkte in Ihrer primären Region zugreifen können.

Wenn Sie keine Geosicherungen für Ihren dedizierten SQL-Pool benötigen, können Sie sie deaktivieren und die Speicherkosten für die Notfallwiederherstellung einsparen. Informationen hierzu finden Sie unter Schrittanleitung: Deaktivieren von Geosicherungen für einen dedizierten SQL-Pool (früher SQL Data Warehouse). Wenn Sie Geosicherungen deaktivieren, können Sie Ihren dedizierten SQL-Pool nicht in der gekoppelten Azure-Region wiederherstellen, wenn Ihr primäres Azure-Rechenzentrum nicht verfügbar ist.

Hinweis

Wenn Sie eine kürzere RPO für Geosicherungen benötigen, stimmen Sie für diese Funktion ab. Sie können auch einen benutzerdefinierten Wiederherstellungspunkt erstellen und auf der Grundlage dieses neuen Wiederherstellungspunkts ein neues Data Warehouse in einer anderen Region wiederherstellen. Nach der Wiederherstellung ist das Data Warehouse online, und Sie können es unbegrenzt anhalten, um Computekosten zu sparen. Für die angehaltene Datenbank fallen Speichergebühren nach dem Azure Storage Premium-Tarif an. Ein weiteres gängiges Muster für einen kürzeren Wiederherstellungspunkt ist die parallele Erfassung von Daten in primären und sekundären Instanzen eines Data Warehouse. In diesem Szenario werden Daten aus einer (oder mehreren) Quelle(n) in zwei separaten Instanzen des Data Warehouse (primär und sekundär) gespeichert. Sie können die sekundäre Instanz des Warehouse anhalten, um Computekosten zu sparen. Falls Sie eine aktive Kopie des Data Warehouse benötigen, können Sie die Datenbank fortsetzen. Dies sollte nur wenige Minuten dauern.

Datenresidenz

Wenn sich Ihr gekoppeltes Rechenzentrum außerhalb Ihres Landes befindet, können Sie sicherstellen, dass Ihre Daten in Ihrer Region verbleiben, indem Sie Ihre Datenbank in lokal redundanten Speichern (LRS) bereitstellen. Wenn Ihre Datenbank bereits in RA-GRS (Georedundanter Speicher mit Lesezugriff, aktuelle Standardeinstellung) bereitgestellt wurde, können Sie Geosicherungen deaktivieren. Ihre Datenbank befindet sich jedoch weiterhin im Speicher, der in einem regionsbezogenen Paar repliziert wird. Um sicherzustellen, dass Kundendaten in Ihrer Region verbleiben, können Sie Ihren dedizierten SQL-Pool in lokal redundanten Speicher bereitstellen oder wiederherstellen. Weitere Informationen zum Bereitstellen oder Wiederherstellen in einem lokal redundanten Speicher finden Sie in der Anleitung zum Konfigurieren der Einregionsresidenz für einen dedizierten SQL-Pool (ehemals SQL DW) in Azure Synapse Analytics.

Unter Gekoppelte Azure-Regionen erfahren Sie, ob sich Ihr gekoppeltes Rechenzentrum in einem anderen Land bzw. einer anderen Region befindet.

Kosten für Sicherung und Wiederherstellung

Beachten Sie, dass die Azure-Rechnung einen Eintrag für Storage und einen Eintrag für den Speicher für die Notfallwiederherstellung aufweist. Die Storage-Gebühren sind die Gesamtkosten für das Speichern Ihrer Daten in der primären Region und die von Momentaufnahmen erfassten inkrementellen Änderungen. Eine detailliertere Erläuterung, wie Momentaufnahmen in Rechnung gestellt werden, finden Sie unter Grundlegendes zur Ermittlung der Gebühren für Momentaufnahmen. Die Gebühr für georedundanten Speicher umfasst die Kosten für das Speichern von Geosicherungen.

Die Gesamtkosten für Ihr primäres Data Warehouse und die Speicherung von Momentaufnahmenänderungen für sieben Tage werden auf die nächsten TB aufgerundet. Wenn Ihr Data Warehouse beispielsweise 1,5 TB umfasst und die Momentaufnahmen 100 GB erfassen, werden Ihnen 2 TB Daten zum Azure Storage Premium-Tarif in Rechnung gestellt.

Bei Verwendung von georedundantem Speicher wird Ihnen dieser separat in Rechnung gestellt. Der georedundante Speicher wird zum Standardsatz für georedundanten Speicher mit Lesezugriff (Read-Access Geographically Redundant Storage, RA-GRS) berechnet.

Weitere Informationen zu den Preisen von Azure Synapse finden Sie unter Azure Synapse – Preise. Bei der Wiederherstellung überregionaler Daten werden Ihnen keine Kosten für ausgehenden Datenverkehr in Rechnung gestellt.

Wiederherstellen anhand von Wiederherstellungspunkten

Jede Momentaufnahme erstellt einen Wiederherstellungspunkt, der den Zeitpunkt zu Beginn der Momentaufnahme darstellt. Um ein Data Warehouse wiederherzustellen, wählen Sie einen Wiederherstellungspunkt aus und geben einen Wiederherstellungsbefehl aus.

Sie können entweder das wiederhergestellte Data Warehouse und das aktuelle beibehalten oder eines davon löschen. Wenn Sie das aktuelle Data Warehouse durch das wiederhergestellte Data Warehouse ersetzen möchten, können Sie es über „ALTER DATABASE“ mit der Option „MODIFY NAME“ umbenennen.

Hinweis

Die Wiederherstellung auf Tabellenebene wird in dedizierten SQL-Pools nicht unterstützt. Sie können nur eine vollständige Datenbank aus Ihrer Sicherung wiederherstellen und dann die erforderlichen Tabellen kopieren, indem Sie

  • ETL-Tools-Aktivitäten wie Copy-Aktivität
  • Export und Import
    • Exportieren der Daten aus der wiederhergestellten Sicherung in Ihren Data Lake mithilfe von CETAS CETAS-Beispiel
    • Importieren der Daten mithilfe von COPY oder Polybase

Abonnementübergreifende Wiederherstellung

Sie können eine abonnementübergreifende Wiederherstellung durchführen.

Georedundante Wiederherstellung

Sie können Ihren dedizierten SQL-Pool in jeder beliebigen Region wiederherstellen, die dedizierte SQL-Pools auf Ihrer ausgewählten Leistungsebene unterstützt.

Hinweis

Zum Ausführen einer georedundanten Wiederherstellung müssen Sie dieses Feature nicht deaktiviert haben.

Supportvorgang

Sie können ein Supportticket für Azure Synapse Analytics über das Azure-Portal einreichen.