Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
GILT FÜR:
NoSQL
MongoDB
Mit der Zeitreise können Sie auf Azure Cosmos DB-Daten im Analysespeicher zugreifen, genau so, wie sie zu bestimmten Zeitpunkten in der Vergangenheit angezeigt wurden (bis auf Millisekundenebene). Mit Zeitreisen können Sie mühelos vergangene Daten abfragen, die aktualisiert oder gelöscht wurden, Trends analysieren und Unterschiede zwischen zwei Points of Interest vergleichen.
In diesem Artikel erfahren Sie, wie Sie eine Zeitreiseanalyse für Ihre im Analysespeicher gespeicherten Azure Cosmos DB-Daten durchführen. Der Analysespeicher wird erstellt, wenn Sie Azure Synapse Link in Ihren Containern aktivieren.
Wie funktioniert dies?
Stellen Sie zum Ausführen von Zeitreisevorgängen für Azure Cosmos DB-Daten sicher, dass Ihr Azure Cosmos DB-Konto für Azure Synapse Link aktiviert wurde. Stellen Sie außerdem sicher, dass Sie Azure Synapse Link in Ihrem Container aktiviert haben. Azure Synapse Link aktiviert den Analysespeicher für Ihren Container und wird dann für Azure Synapse Link-Analyse einschließlich Zeitreisen verwendet.
Wenn für den Azure Cosmos DB-Container eine analytische Lebenszeit (Analytical Time-To-Live, ATTL) definiert ist, dient dies als maximaler Aufbewahrungszeitraum für Zeitreisevorgänge. Wenn ATTL nicht als -1 definiert oder festgelegt ist, haben Sie eine maximale Aufbewahrungsdauer. Mit anderen Worten, Sie können zu jedem Zeitpunkt zurückreisen, seit dem Azure Synapse Link aktiviert wurde.
Einsatzgebiete
Hier sind einige unterstützte Zeitreiseszenarien:
- Datenüberwachung: Die Überwachung von Datenänderungen ist für die Datenkonformität und das Verstehen der Datenentwicklung im Laufe der Zeit von entscheidender Bedeutung. Mit dem Zeitreisefeature können Sie Änderungen nachverfolgen, auf alle Versionen von Updates zugreifen und Datenanalysen für jeden gewünschten Zeitpunkt durchführen.
- Trendanalyse: Wenn Sie die Kombination der Konfigurationen „spark.cosmos.timetravel.startTimestamp“ und „spark.cosmos.timetravel.timestampAsOf“ angeben, können Sie Unterschiede zwischen zwei bestimmten Zeitpunkten vergleichen und analysieren. Sie können beispielsweise die Produktbestandsmenge von vor drei Monaten mit der Menge von vor sechs Monaten vergleichen.
- Reparieren versehentlicher Datenänderungen: Das Zeitreisefeature ist von unschätzbarem Wert, um einzelne Datensätze in ihren letzten bekannten guten Zustand zu korrigieren, sodass Reparaturen effizient ausgeführt werden können, ohne auf Sicherungen und Wiederherstellungen zurückzugreifen. Wenn Sie mithilfe des Werts „timestampAsOf“ auf die gewünschten Daten zugreifen, wie sie im letzten bekannten guten Zustand vorhanden waren, können Sie entweder den Azure Cosmos DB-Container mit diesen Daten aktualisieren oder die Datensätze in einem neuen Container erfassen.
- Azure Cosmos DB-Container als langsam veränderliche Dimension: Langsam veränderliche Dimensionen werden verwendet, um Änderungen an Attributwerten nachzuverfolgen und Verlaufsdaten zu einem bestimmten Zeitpunkt zu melden. Zeitreiseabfragen bieten zusammen mit der Option „fullFidelity“ die Funktionalität von Typ 2 der langsam veränderlichen Dimensionen, indem sie die Attributwertänderungen nachverfolgen, die als separate Zeilen mit Gültigkeitszeitraum dargestellt werden.
Verwenden von Zeitreisen
In diesem Codebeispiel wird veranschaulicht, wie ein Spark DataFrame mit Datensätzen aus dem Produktcontainer geladen und mit dem Azure Synapse Spark-Notebook ausgeführt werden kann.
import com.microsoft.azure.cosmos.analytics.spark.connector.datasource.CosmosOlapTimeTravel
val configuration = Map(
"spark.synapse.linkedService" -> "CosmosDBLS",
"spark.cosmos.container" -> "product",
"spark.cosmos.timetravel.timestampAsOf" -> "2022-01-01 00:00:00"
)
val df = CosmosOlapTimeTravel.load(configuration)
display(df)
Konfiguration
Einstellung | Standard | BESCHREIBUNG |
---|---|---|
spark.cosmos.timetravel.timestampAsOf |
aktueller Zeitstempel | Historischer Zeitstempel mit Millisekundengenauigkeit, um in der Zeit zurück zu reisen. |
spark.cosmos.timetravel.startTimestamp |
von Anfang an | Zeitstempel, ab dem die Zeitreise gestartet werden soll. Diese Konfiguration kann in Kombination mit „spark.cosmos.timetravel.timestampAsOf“ verwendet werden, um Unterschiede zwischen zwei bestimmten Zeitpunkten für Anwendungsfälle wie die Trendanalyse zu vergleichen und zu analysieren. |
spark.cosmos.timetravel.ignoreTransactionalTTLDeletes |
FALSE |
Ignorieren Sie die Datensätze, die aus dem Transaktionsspeicher mit TTL entfernt wurden. Legen Sie diese Einstellung auf TRUE fest, wenn Sie Datensätze im Ergebnissatz für Zeitreisen sehen wollen, die aus dem Transaktionsspeicher mit TTL entfernt wurden. |
spark.cosmos.timetravel.ignoreTransactionalUserDeletes |
FALSE |
Ignorieren Sie die Datensätze, die der Benutzer aus dem Transaktionsspeicher gelöscht hat. Legen Sie diese Einstellung auf TRUE fest, wenn Sie Datensätze im Ergebnissatz für Zeitreisen sehen wollen, die aus dem Transaktionsspeicher gelöscht wurden. |
spark.cosmos.timetravel.fullFidelity |
FALSE |
Legen Sie diese Einstellung auf TRUE fest, wenn Sie an einem bestimmten Punkt im Verlauf auf alle Versionen von Datensätzen (einschließlich zwischenzeitlichen Updates) zugreifen möchten. |
Wichtig
Alle Konfigurationseinstellungen werden in der UTC-Zeitzone verwendet.
Einschränkungen
- Zeitreise ist nur für Azure Synapse Spark verfügbar.
- Zeitreise ist nur für API für NoSQL und API für MongoDB verfügbar. APIs für Gremlin und Cassandra werden derzeit nicht unterstützt.
- Sie können Zeitreisen erst verwenden, nachdem Azure Synapse Link in Ihrem Container aktiviert wurde.
Preise
Für dieses Feature fallen keine zusätzlichen Kosten an. Die Kosten für die Verwendung dieses Features enthalten die Azure Synapse Link-Preise und die Azure Synapse Apache Synapse Spark-Preise für Laufzeitreiseaufträge im Analysespeicher.
Nächste Schritte
Weitere Informationen finden Sie in den folgenden Dokumenten: