Teilen über


Sichern und Wiederherstellen

Beschreibt, wie die Datensicherung und -wiederherstellung für Parallel Data Warehouse (PDW) funktioniert. Sicherungs- und Wiederherstellungsvorgänge werden für die Notfallwiederherstellung verwendet. Sicherung und Wiederherstellung können auch verwendet werden, um eine Datenbank von einem Anwendung in eine andere Anwendung zu kopieren.

Grundlagen der Sicherung und Wiederherstellung

Eine PDW-Datenbanksicherung ist eine Kopie einer Anwendung Datenbank, die in einem Format gespeichert ist, sodass sie verwendet werden kann, um die ursprüngliche Datenbank in einem Anwendung wiederherzustellen.

Eine PDW-Datenbanksicherung wird mit der BACKUP DATABASE t-sql-Anweisung erstellt und für die Verwendung mit der RESTORE DATABASE-Anweisung formatiert. Sie ist für jeden anderen Zweck nicht verwendbar. Die Sicherung kann nur in einer Anwendung mit derselben Anzahl oder einer größeren Anzahl von Computeknoten wiederhergestellt werden.

PDW verwendet DIE SQL Server-Sicherungstechnologie, um Anwendung Datenbanken zu sichern und wiederherzustellen. SQL Server-Sicherungsoptionen sind vorkonfiguriert, um die Komprimierung von Sicherungen zu verwenden. Sie können keine Sicherungsoptionen wie Komprimierung, Prüfsumme, Blockgröße und Pufferanzahl festlegen.

Datenbanksicherungen werden auf einem oder mehreren Sicherungsservern gespeichert, die in Ihrem eigenen Kundennetzwerk vorhanden sind. PDW schreibt eine Benutzerdatenbanksicherung parallel von den Computeknoten auf einen Sicherungsserver und stellt eine Benutzerdatenbanksicherung parallel vom Sicherungsserver auf die Computeknoten wieder her.

Sicherungen werden auf dem Sicherungsserver als Eine Reihe von Dateien im Windows-Dateisystem gespeichert. Eine PDW-Datenbanksicherung kann nur in PDW wiederhergestellt werden. Sie können Jedoch Datenbanksicherungen vom Sicherungsserver an einen anderen Speicherort archivieren, indem Sie standardmäßige Windows-Dateisicherungsprozesse verwenden. Weitere Informationen zu Sicherungsservern finden Sie unter Abrufen und Konfigurieren eines Sicherungsservers.

Datenbanksicherungstypen

Es gibt zwei Arten von Daten, die eine Sicherung erfordern: Benutzerdatenbanken und Systemdatenbanken (z. B. die Masterdatenbank). PDW sichert das Transaktionsprotokoll nicht.

Eine vollständige Datenbanksicherung ist eine Sicherung einer gesamten PDW-Datenbank. Dies ist der Standardsicherungstyp. Eine vollständige Sicherung einer Benutzerdatenbank umfasst Datenbankbenutzer und Datenbankrollen. Eine Sicherung des Master umfasst Anmeldungen.

Eine differenzielle Sicherung enthält alle Änderungen seit der letzten vollständigen Sicherung. Eine differenzielle Sicherung nimmt normalerweise weniger Zeit in Anspruch als eine vollständige Sicherung und kann häufiger ausgeführt werden. Wenn mehrere differenzielle Sicherungen auf derselben vollständigen Sicherung basieren, umfasst jedes Differenzial alle Änderungen im vorherigen Differenzial.

Sie können beispielsweise wöchentlich eine vollständige Sicherung und eine differenzielle Sicherung täglich erstellen. Um die Benutzerdatenbank wiederherzustellen, muss die vollständige Sicherung plus der letzten Differenz (sofern vorhanden) wiederhergestellt werden.

Eine differenzielle Sicherung wird nur für Benutzerdatenbanken unterstützt. Eine Sicherung des Master-Shapes ist immer eine vollständige Sicherung.

Um die gesamte Anwendung zu sichern, müssen Sie eine Sicherung aller Benutzerdatenbanken und eine Sicherung der Masterdatenbank durchführen.

Datenbanksicherungsprozess

Das folgende Diagramm zeigt den Datenfluss während einer Datenbanksicherung.

PDW backup process

Der Sicherungsvorgang funktioniert wie folgt:

  1. Der Benutzer sendet eine BACKUP DATABASE tsql-Anweisung an den Control-Knoten.

    • Die Sicherung ist entweder eine vollständige oder differenzielle Sicherung.
  2. Für Benutzerdatenbanken erstellt der Steuerelementknoten (MPP Engine) einen verteilten Abfrageplan, um eine parallele Datenbanksicherung durchzuführen.

  3. Jeder knoten, der an der Sicherung beteiligt ist, kopiert seine Sicherungsdatei mithilfe der SQL Server-Sicherungsfunktionalität auf den Sicherungsserver.

    • Jeder beteiligte Knoten kopiert eine Sicherungsdatei auf den Sicherungsserver.

    • Die Sicherung der Benutzerdatenbank (vollständig oder differenzial) umfasst eine Sicherung des Teils der Datenbank, der auf jedem Computeknoten gespeichert ist, und eine Sicherung der Datenbankbenutzer und Datenbankrollen.

  4. Die Anwendung führt die Sicherung parallel mit dem InfiniBand-Netzwerk aus.

    • PDW führt jede vollständige und differenzielle Sicherung parallel aus. Mehrere Datenbanksicherungen werden jedoch nicht gleichzeitig ausgeführt. Jede Sicherungsanforderung muss warten, bis zuvor übermittelte Sicherungen abgeschlossen sind.

    • Eine Sicherung der Masterdatenbank sichert nur Daten vom Knoten "Steuerelement". Dieser Sicherungstyp wird fortlaufend ausgeführt.

  5. Eine PDW-Datenbanksicherung ist eine Gruppe von Dateien, die sich in einem Verzeichnis befinden, das sich aus dem Anwendung befindet. Der Verzeichnisname wird als Netzwerkpfad und Verzeichnisname angegeben. Das Verzeichnis kann kein lokaler Pfad sein, und es kann sich nicht auf dem Anwendung befinden.

  6. Nachdem die Sicherung abgeschlossen ist, können Sie das Windows-Dateisystem verwenden, um das Sicherungsverzeichnis bei Bedarf an einen anderen Speicherort zu kopieren.

    • Eine Sicherung kann nur in einer PDW-Anwendung wiederhergestellt werden, die eine gleiche oder größere Anzahl von Computeknoten aufweist.

    • Sie können den Namen der Sicherung nicht ändern, bevor Sie eine Wiederherstellung durchführen. Der Name des Sicherungsverzeichnisses muss mit dem Namen des ursprünglichen Namens der Sicherung übereinstimmen. Der ursprüngliche Name der Sicherung befindet sich in der Datei "backup.xml" im Sicherungsverzeichnis. Um eine Datenbank unter einem anderen Namen wiederherzustellen, können Sie den neuen Namen im Wiederherstellungsbefehl angeben. Beispiel: RESTORE DATABASE MyDB1 FROM DISK = ꞌ\\10.192.10.10\backups\MyDB2ꞌ

Modi für die Datenbankwiederherstellung

Eine vollständige Datenbankwiederherstellung erstellt die PDW-Datenbank mithilfe der Daten in der Datenbanksicherung erneut. Die Datenbankwiederherstellung wird ausgeführt, indem zuerst eine vollständige Sicherung wiederhergestellt und dann optional eine differenzielle Sicherung wiederhergestellt wird. Die Datenbankwiederherstellung umfasst die Datenbankbenutzer und Datenbankrollen.

Eine Kopfzeile gibt nur die Kopfzeileninformationen für eine Datenbank zurück. Daten werden nicht auf dem Anwendung wiederhergestellt.

Eine Anwendung Wiederherstellung ist eine Wiederherstellung der gesamten Anwendung. Dazu gehört das Wiederherstellen aller Benutzerdatenbanken und der Masterdatenbank.

Wiederherstellungsvorgang

Das folgende Diagramm zeigt den Datenfluss während einer Datenbankwiederherstellung.

Restore process

Wiederherstellen einer Appliance mit derselben Anzahl von Computeknoten**

Beim Wiederherstellen von Daten erkennt die Anwendung die Anzahl der Computeknoten in der Quelle Anwendung und des Ziel-Anwendung. Wenn beide Anwendung eine gleiche Anzahl von Computeknoten haben, funktioniert der Wiederherstellungsvorgang wie folgt:

  1. Die wiederhergestellte Datenbanksicherung ist auf einer Windows-Dateifreigabe auf einem Sicherungsserver ohne Anwendung verfügbar. Um eine optimale Leistung zu erzielen, ist dieser Server mit dem Anwendung InfiniBand-Netzwerk verbunden.

  2. Der Benutzer sendet eine RESTORE DATABASE tsql-Anweisung an den Control-Knoten.

    • Die Wiederherstellung ist entweder eine vollständige Wiederherstellung oder eine Headerwiederherstellung. Die vollständige Wiederherstellung stellt eine vollständige Sicherung wieder her und stellt dann optional eine differenzielle Sicherung wieder her.
  3. Der Steuerelementknoten (MPP Engine) erstellt einen verteilten Abfrageplan, um eine parallele Datenbankwiederherstellung durchzuführen.

    • Das Analytics Platform System (PDW) führt parallel die Wiederherstellung einer Benutzerdatenbank durch. Mehrere Datenbanksicherungen und -wiederherstellungen werden jedoch nicht gleichzeitig ausgeführt. Das MPP-Modul fügt jede Wiederherstellungs-Anweisung in eine Warteschlange ein; es muss warten, bis zuvor gesendete Sicherungs- und Wiederherstellungsanforderungen abgeschlossen sind.

    • Eine Wiederherstellung der Masterdatenbank stellt nur Daten auf dem Steuerelementknoten wieder her; die Wiederherstellung wird fortlaufend ausgeführt.

    • Eine Wiederherstellung der Kopfzeileninformationen ist ein schneller Vorgang und stellt keine Daten auf den Compute- oder Control-Knoten wieder her. Stattdessen gibt der Knoten "Steuerelement" die Ergebnisse als Abfrageausgabe zurück.

  4. Die Sicherungsdateien werden parallel in die richtigen Computeknoten kopiert, in der Regel über das Anwendung InfiniBand-Netzwerk.

  5. Jeder Computeknoten stellt seinen Teil der Benutzerdatenbank wieder her. Wenn eine der Wiederherstellungen nicht erfolgreich abgeschlossen wird, werden alle Datenbanken entfernt, und die Wiederherstellung ist erfolglos abgeschlossen.

Wiederherstellen auf einer Appliance mit einer größeren Anzahl von Computeknoten

Beim Wiederherstellen einer Sicherung auf einer Appliance mit einer größeren Anzahl von Computeknoten wächst die Größe der zugeordneten Datenbank entsprechend der Anzahl der Computeknoten.

Wenn Sie beispielsweise eine 60 GB-Datenbank aus einer 2-Knoten-Anwendung (30 GB pro Knoten) in eine 6-Knoten-Anwendung wiederherstellen, erstellt SQL Server PDW eine 180-GB-Datenbank (6 Knoten mit 30 GB pro Knoten) auf dem 6-Knoten-Anwendung. SQL Server PDW stellt zunächst die Datenbank auf 2 Knoten wieder her, um der Quellkonfiguration zu entsprechen, und verteilt die Daten dann auf alle 6 Knoten.

Nach der Umverteilung enthält jeder Computeknoten weniger tatsächliche Daten und mehr freien Speicherplatz als jeder Computeknoten in der kleineren Quelle Anwendung. Dank des zusätzlichen Speicherplatzes können Sie der Datenbank weitere Daten hinzufügen. Wenn die wiederhergestellte Datenbankgröße größer ist, als Sie benötigen, können Sie ALTER DATABASE verwenden, um die Datenbankdateigrößen zu verkleinern.

Sicherungs- und Wiederherstellungsaufgabe Beschreibung
Bereiten Sie einen Server als Sicherungsserver vor. Erwerb und Konfiguration eines Sicherungsservers
Sichern einer Datenbank. SICHERUNGSDATENBANK
Wiederherstellen einer Datenbank RESTORE DATABASE