Διατήρηση δεδομένων σε Fabric αποθήκη δεδομένων (Προεπισκόπηση)

Ισχύει για:✅ Warehouse στο Microsoft Fabric

Στο Microsoft Fabric, μια αποθήκη αποθηκεύει και διατηρεί αυτόματα διάφορες εκδόσεις των δεδομένων με βάση τη ρυθμισμένη περίοδο διατήρησης. Αυτή η περίοδος διατήρησης καθορίζει πόσο πίσω στο χρόνο μπορείτε να εκτελέσετε ερωτήματα ταξιδιού στο χρόνο , να δημιουργήσετε κλώνους πινάκων, να χρησιμοποιήσετε σημεία επαναφοράς και να δημιουργήσετε στιγμιότυπα αποθήκης.

Η διατήρηση δεδομένων ξεκινά αυτόματα όταν δημιουργείτε την αποθήκη. Από προεπιλογή, οι αποθήκες διατηρούν το ιστορικό δεδομένων για 30 ημερολογιακές ημέρες. Μπορείτε να διαμορφώσετε την περίοδο διατήρησης σε οποιαδήποτε τιμή μεταξύ 1 και 120 ημερών. Το σύστημα διαγράφει αυτόματα τα αρχεία που έχουν λήξει μετά τη λήξη της περιόδου διατήρησης.

Η αποθήκη διατηρεί όλα τα ένθετα, τις ενημερώσεις και τις διαγραφές εντός της διαμορφωμένης περιόδου διατήρησης.

  • Η αύξηση της περιόδου διατήρησης παρέχει ένα μεγαλύτερο παράθυρο για ερωτήματα ταξιδιού στο χρόνο, κλώνους πινάκων σε παρελθόντα χρονικά σημεία, σημεία επαναφοράς και στιγμιότυπα αποθήκης. Ωστόσο, μια μεγαλύτερη περίοδος διατήρησης αυξάνει την κατανάλωση αποθήκευσης και το σχετικό κόστος.
  • Η μείωση της περιόδου διατήρησης μειώνει το κόστος αποθήκευσης, αλλά περιορίζει το πόσο πίσω μπορείτε να υποβάλετε ερωτήματα ή να ανακτήσετε ιστορικά δεδομένα.

Πώς λειτουργεί η διατήρηση δεδομένων

Όταν τροποποιούνται δεδομένα, η αποθήκη δεν απορρίπτει αμέσως την κατάσταση της προηγούμενης έκδοσης. Αντίθετα, οι προηγούμενες εκδόσεις των δεδομένων διατηρούνται ως μέρος του αρχείου καταγραφής συναλλαγών Delta Lake. Αυτός ο μηχανισμός έκδοσης εκδόσεων είναι που επιτρέπει τη λειτουργία του ταξιδιού στο χρόνο, των κλώνων πινάκων, των σημείων επαναφοράς και των στιγμιότυπων αποθήκης.

Όταν οι εκδόσεις ιστορικών δεδομένων υπερβαίνουν τη διαμορφωμένη περίοδο διατήρησης, μια διαδικασία συλλογής απορριμμάτων στο παρασκήνιο καταργεί αυτόματα τα ληγμένα αρχεία από το OneLake. Αυτή η διαδικασία εκκαθάρισης εκτελείται ασύγχρονα και δεν επηρεάζει τα ενεργά ερωτήματα ή τις τρέχουσες συναλλαγές.

Η αποθήκη μετρά την ηλικία των διατηρούμενων δεδομένων σε απόλυτες ημερολογιακές ημέρες από τη στιγμή που δημιουργήθηκε η έκδοση δεδομένων, συμπεριλαμβανομένης της παύσης των εκχωρημένων πόρων του Microsoft Fabric.

Εύρος περιόδου διατήρησης

Εάν δεν διαμορφώσετε ρητά την περίοδο διατήρησης, οι υπάρχουσες αποθήκες χρησιμοποιούν την προεπιλεγμένη περίοδο διατήρησης των 30 ημερολογιακών ημερών. Μπορείτε να διαμορφώσετε την περίοδο διατήρησης δεδομένων από 1 έως 120 ημέρες.

Ρύθμιση παραμέτρων διατήρησης δεδομένων

Ορίστε την περίοδο διατήρησης δεδομένων για μια αποθήκη χρησιμοποιώντας τη βάση δεδομένων ALTER ... Εντολή SET T-SQL. Για βήματα και περισσότερες πληροφορίες, ανατρέξτε στο θέμα Τρόπος ρύθμισης παραμέτρων διατήρησης δεδομένων στο Fabric αποθήκη δεδομένων.

Συμπεριφορά κατά την αλλαγή της περιόδου διατήρησης

Η κατανόηση της συμπεριφοράς όταν αλλάζετε την περίοδο διατήρησης σάς βοηθά να σχεδιάσετε αλλαγές για να αποφύγετε την απροσδόκητη απώλεια δεδομένων ή την αύξηση του μεγέθους του χώρου αποθήκευσης.

Αυξήστε την περίοδο διατήρησης

Όταν αυξάνετε την περίοδο διατήρησης, η νέα ρύθμιση τίθεται σε ισχύ αμέσως. Ωστόσο, δεν μπορείτε να ανακτήσετε δεδομένα ιστορικού που το σύστημα έχει ήδη εκκαθαρίσει κατά την προηγούμενη μικρότερη περίοδο διατήρησης. Μόνο οι εκδόσεις δεδομένων που εξακολουθούν να υπάρχουν στο OneLake κατά τη στιγμή της αλλαγής επωφελούνται από την εκτεταμένη περίοδο διατήρησης.

Για παράδειγμα, εάν η αποθήκη σας έχει επί του παρόντος περίοδο διατήρησης 7 ημερών και την αυξήσετε σε 60 ημέρες, η αλλαγή ισχύει από εκείνο το σημείο και μετά. Οι εκδόσεις δεδομένων που έχουν ήδη εκκαθαριστεί από το σύστημα πριν από την αλλαγή (παλαιότερες από 7 ημέρες) δεν μπορούν να ανακτηθούν. Ωστόσο, όλες οι εκδόσεις δεδομένων που εξακολουθούν να βρίσκονται εντός του παραθύρου των 7 ημερών κατά τη στιγμή της αλλαγής, μαζί με τυχόν νέες εκδόσεις που θα δημιουργηθούν στο μέλλον, θα διατηρηθούν για έως και 60 ημέρες.

Μειώστε την περίοδο διατήρησης

Όταν μειώνετε την περίοδο διατήρησης, οι εκδόσεις δεδομένων που τώρα δεν εμπίπτουν στη νέα μικρότερη περίοδο διατήρησης γίνονται επιλέξιμες για εκκαθάριση. Η διαδικασία καθαρισμού εκτελείται ασύγχρονα στο παρασκήνιο και δεν συμβαίνει ακαριαία. Τα ενεργά ερωτήματα που βρίσκονται ήδη σε εξέλιξη δεν επηρεάζονται.

Για παράδειγμα, εάν η αποθήκη σας έχει περίοδο διατήρησης 30 ημερών και τη μειώσετε σε 7 ημέρες, οι εκδόσεις δεδομένων μεταξύ 8 και 30 ημερών γίνονται επιλέξιμες για εκκαθάριση παρασκηνίου.

Σημαντικό

Η μείωση της περιόδου διατήρησης είναι μη αναστρέψιμη, από την άποψη της πρόσβασης στα δεδομένα.

Ακόμα κι αν αυξήσετε ξανά την περίοδο διατήρησης λίγο αργότερα, τα δεδομένα που έπεσαν εκτός του μικρότερου παραθύρου κατά τη διάρκεια αυτής της περιόδου δεν είναι πλέον προσβάσιμα. Πριν μειώσετε την περίοδο διατήρησης, βεβαιωθείτε ότι η νέα περίοδος διατήρησης πληροί τις απαιτήσεις ανάκτησης δεδομένων και συμμόρφωσης του οργανισμού σας.

Καταληκτική ημερομηνία διατήρησης

Η time_travel_retention_cutoff_date στήλη στην προβολή καταλόγου συστήματος sys.databases αντικατοπτρίζει την πραγματική παλαιότερη ημερομηνία από την οποία είναι διαθέσιμα τα δεδομένα ταξιδιού στο χρόνο και όχι την τρέχουσα ρυθμισμένη περίοδο διατήρησης. Τα παλαιότερα πραγματικά δεδομένα μπορεί να διαφέρουν από τη διαμορφωμένη περίοδο διατήρησης.

Η περίοδος διατήρησης που έχει διαμορφωθεί από τον χρήστη καθορίζει πόσες ημέρες ιστορικού θα πρέπει να διατηρήσει το σύστημα στο μέλλον. Ωστόσο, το πραγματικό ανακτήσιμο ιστορικό εξαρτάται από τα δεδομένα που διατηρήθηκαν πριν από οποιαδήποτε αλλαγή διατήρησης.

Δύο καταστάσεις προκαλούν απόκλιση μεταξύ της διαμορφωμένης διατήρησης και του πραγματικού διαθέσιμου ιστορικού:

  • Η διατήρηση μειώθηκε - Η αποθήκη επισημαίνει αμέσως ιστορικά δεδομένα παλαιότερα από τη νέα περίοδο διατήρησης για τη συλλογή σκουπιδιών και τα αφαιρεί οριστικά.
  • Στη συνέχεια, η διατήρηση αυξήθηκε - Η αποθήκη δεν μπορεί να επαναφέρει το διαγραμμένο ιστορικό. Πρέπει να περιμένει να συσσωρευτεί νέο ιστορικό για να είναι διαθέσιμο το πλήρως διαμορφωμένο παράθυρο.

Σενάρια διατήρησης δεδομένων

Λάβετε υπόψη τα ακόλουθα σενάρια όταν αποφασίζετε πώς να διαμορφώσετε την περίοδο διατήρησής σας:

Συμμόρφωση και έλεγχος

Οι οργανισμοί με κανονιστικές απαιτήσεις ή απαιτήσεις συμμόρφωσης ενδέχεται να χρειαστεί να διατηρήσουν δεδομένα για μεγαλύτερες περιόδους για να ικανοποιήσουν τις υποχρεώσεις ελέγχου. Η διαμόρφωση μιας περιόδου διατήρησης 90 ή 120 ημερών μπορεί να προσφέρει ένα ευρύτερο ιστορικό παράθυρο στους ελεγκτές για να ελέγξουν τις αλλαγές δεδομένων με την πάροδο του χρόνου.

Ανάπτυξη και δοκιμές

Για χώρους εργασίας ανάπτυξης ή δοκιμής όπου τα ιστορικά δεδομένα είναι λιγότερο σημαντικά, μια μικρότερη περίοδος διατήρησης από 1 έως 7 ημέρες μπορεί να μειώσει το κόστος αποθήκευσης. Αυτή η μείωση είναι χρήσιμη όταν ο χώρος εργασίας χρησιμοποιείται για γρήγορη δημιουργία πρωτοτύπων ή επαναληπτική ανάπτυξη.

Βελτιστοποίηση κόστους

Εάν η αποθήκη σας υφίσταται συχνές τροποποιήσεις δεδομένων μεγάλης κλίμακας (όπως καθημερινά πλήρη φορτία), ο όγκος των διατηρούμενων ιστορικών δεδομένων μπορεί να αυξηθεί σημαντικά. Σε αυτά τα σενάρια, η μείωση της περιόδου διατήρησης βοηθά στον έλεγχο του κόστους αποθήκευσης, διατηρώντας παράλληλα ένα εύλογο παράθυρο ανάκτησης.

Ετοιμότητα ανάκτησης δεδομένων

Για τις αποθήκες παραγωγής, η διατήρηση μεγαλύτερης περιόδου διατήρησης παρέχει μεγαλύτερη ευελιξία για την ανάκτηση δεδομένων μέσω σημείων επαναφοράς, κλώνων πινάκων και ερωτημάτων ταξιδιού στο χρόνο , εάν υπάρχει τυχαία καταστροφή δεδομένων.

Πώς η διαμορφώσιμη διατήρηση επηρεάζει τα εξαρτώμενα χαρακτηριστικά

Η διαμορφωμένη περίοδος διατήρησης ισχύει ομοιόμορφα για τις ακόλουθες δυνατότητες στο Fabric αποθήκη δεδομένων. Η αλλαγή της περιόδου διατήρησης επηρεάζει άμεσα τη διαθεσιμότητα και τη συμπεριφορά αυτών των λειτουργιών.

Ταξίδι στο χρόνο

Το ταξίδι στο χρόνο σάς επιτρέπει να υποβάλετε ερωτήματα για δεδομένα όπως υπήρχαν σε μια προηγούμενη χρονική στιγμή εντός της περιόδου διατήρησης. Η FOR TIMESTAMP AS OF υπόδειξη ερωτήματος μπορεί να ανακτήσει δεδομένα από οποιοδήποτε σημείο εντός της διαμορφωμένης περιόδου διατήρησης.

Για παράδειγμα, εάν η περίοδος διατήρησης έχει οριστεί σε 15 ημέρες, μπορείτε να υποβάλετε ερωτήματα για δεδομένα όπως υπήρχαν έως και 15 ημερολογιακές ημέρες στο παρελθόν.

Κλωνοποίηση πίνακα

Οι κλώνοι πινάκων βασίζονται στην περίοδο διατήρησης. Μπορείτε να δημιουργήσετε έναν κλώνο ενός πίνακα σε μια παρελθοντική χρονική στιγμή μόνο εντός της καθορισμένης περιόδου διατήρησης. Εάν ζητήσετε έναν κλώνο πέρα από την περίοδο διατήρησης, παρουσιάζεται σφάλμα.

Σημεία επαναφοράς

Χρησιμοποιήστε σημεία επαναφοράς για να επαναφέρετε μια αποθήκη. Το σύστημα διατηρεί σημεία επαναφοράς που δημιουργούνται από το σύστημα και ορίζονται από τον χρήστη για τη διαμορφωμένη περίοδο διατήρησης. Μετά τη λήξη της περιόδου διατήρησης, το σύστημα διαγράφει αυτόματα τα σημεία επαναφοράς.

  • Η αποθήκη δημιουργεί αυτόματα σημεία επαναφοράς που δημιουργούνται από το σύστημα κάθε οκτώ ώρες. Αυτά τα σημεία επαναφοράς είναι διαθέσιμα για τη διαμορφωμένη περίοδο διατήρησης.
  • Τα σημεία επαναφοράς που ορίζονται από το χρήστη είναι διαθέσιμα για τη διαμορφωμένη περίοδο διατήρησης. Το σύστημα διαγράφει αυτόματα αυτά τα σημεία επαναφοράς μετά τη λήξη.

Fabric διατηρεί έναν ελάχιστο αριθμό σημείων επαναφοράς για να διασφαλίσει ότι υπάρχουν πάντα διαθέσιμα επαρκή σημεία επαναφοράς.

Στιγμιότυπα αποθήκης

Τα στιγμιότυπα αποθήκης μπορούν να αναφέρουν δεδομένα εντός της διαμορφωμένης περιόδου διατήρησης. Η χρονική σήμανση στιγμιότυπου μπορεί να οριστεί σε οποιοδήποτε σημείο εντός της διαμορφωμένης περιόδου διατήρησης ή στο χρόνο δημιουργίας της βάσης δεδομένων, όποιο από τα δύο είναι μεταγενέστερο.

Χρέωση χώρου αποθήκευσης

Η διατήρηση δεδομένων επηρεάζει άμεσα την κατανάλωση αποθήκευσης OneLake. Κάθε διατηρούμενη έκδοση δεδομένων καταλαμβάνει χώρο αποθήκευσης και οι μεγαλύτερες περίοδοι διατήρησης συσσωρεύουν περισσότερες ιστορικές εκδόσεις.

Κατά τον σχεδιασμό της διαμόρφωσης διατήρησης, λάβετε υπόψη την αντιστάθμιση μεταξύ των πλεονεκτημάτων της μεγαλύτερης πρόσβασης στο ιστορικό δεδομένων και του σχετικού κόστους αποθήκευσης. Για περισσότερες πληροφορίες σχετικά με την παρακολούθηση του χώρου αποθήκευσης, ανατρέξτε στην ενότητα Αναφορές χρέωσης και χρήσης στο Fabric αποθήκη δεδομένων.

  • Διατηρημένα αρχεία δεδομένων: Οι ιστορικές εκδόσεις δεδομένων που είναι αποθηκευμένα ως αρχεία parquet στο OneLake καταναλώνουν χώρο αποθήκευσης. Το κόστος αποθήκευσης είναι ανάλογο με τον όγκο και τη συχνότητα των τροποποιήσεων δεδομένων κατά την περίοδο διατήρησης.
  • Σημεία επαναφοράς: Τα μεταδεδομένα για τα σημεία επαναφοράς που δημιουργούνται από το σύστημα και ορίζονται από τον χρήστη καταναλώνουν επίσης χώρο αποθήκευσης. Ωστόσο, τα σημεία επαναφοράς αποθηκεύουν κυρίως μεταδεδομένα και αναφέρονται σε υπάρχοντα αρχεία δεδομένων, επομένως η επιβάρυνση αποθήκευσης είναι σχετικά μικρή.
  • Δεν υπάρχουν υπολογιστικές χρεώσεις για τη διατήρηση: Δεν υπάρχουν υπολογιστικές χρεώσεις που πραγματοποιούνται αποκλειστικά για τη διατήρηση ιστορικών δεδομένων. Οι υπολογιστικές χρεώσεις ισχύουν μόνο όταν υποβάλλετε ενεργά ερωτήματα ή επαναφέρετε δεδομένα.

Για να εκτιμήσετε τον αντίκτυπο αποθήκευσης μιας αλλαγής περιόδου διατήρησης, λάβετε υπόψη:

  • Ο μέσος ημερήσιος όγκος τροποποιήσεων δεδομένων στην αποθήκη σας.
  • Η τρέχουσα περίοδος διατήρησης και η προτεινόμενη νέα περίοδος διατήρησης.
  • Το δέλτα μεταξύ των δύο περιόδων πολλαπλασιασμένο με τον μέσο ημερήσιο όγκο τροποποίησης δίνει μια κατά προσέγγιση αλλαγή στην κατανάλωση αποθήκευσης.

Σημεία προσοχής για τη σχεδίαση

  • Ρυθμίστε τις παραμέτρους της περιόδου διατήρησης με βάση τις απαιτήσεις ανάκτησης δεδομένων, συμμόρφωσης και κόστους του οργανισμού σας. Η προεπιλογή των 30 ημερών παρέχει μια ισορροπία μεταξύ της διαθεσιμότητας δεδομένων και του κόστους αποθήκευσης για τους περισσότερους φόρτους εργασίας.
  • Συντονίστε τις αλλαγές της περιόδου διατήρησης με τη στρατηγική δημιουργίας αντιγράφων ασφαλείας και αποκατάστασης καταστροφών. Βεβαιωθείτε ότι η περίοδος διατήρησης ευθυγραμμίζεται με τους στόχους του σημείου ανάκτησης (RPO).
  • Παρακολουθήστε την κατανάλωση αποθήκευσης OneLake μετά την αλλαγή της περιόδου διατήρησης για να κατανοήσετε τον αντίκτυπο στο κόστος αποθήκευσης.
  • Η περίοδος διατήρησης του προγράμματος αλλάζει κατά τη διάρκεια περιόδων χαμηλής δραστηριότητας, όταν είναι δυνατόν, ώστε να μην υπάρχει αντίκτυπος στους χρήστες.
  • Η περίοδος διατήρησης ορίζεται σε επίπεδο αποθήκης. Εάν χρειάζεστε διαφορετικές περιόδους διατήρησης για διαφορετικά σύνολα δεδομένων, εξετάστε το ενδεχόμενο να τα οργανώσετε σε ξεχωριστές αποθήκες. Προς το παρόν, οι μεμονωμένες ρυθμίσεις διατήρησης σε επίπεδο πίνακα δεν υποστηρίζονται.

Limitations

  • Καθορίστε την περίοδο διατήρησης σε ολόκληρες ημέρες. Οι κλασματικές τιμές δεν υποστηρίζονται.
  • Η μείωση της περιόδου διατήρησης δεν ανακτά αμέσως τον χώρο αποθήκευσης. Η εκκαθάριση των ληγμένων δεδομένων πραγματοποιείται ασύγχρονα στο παρασκήνιο.
  • Η παύση των εκχωρημένων πόρων του Microsoft Fabric επηρεάζει τη δραστηριότητα εκκαθάρισης απορριμμάτων. Η διαδικασία δεν καταργεί δεδομένα ιστορικού που είναι παλαιότερα από τις τρέχουσες ρυθμίσεις διατήρησης δεδομένων ενώ οι εκχωρημένοι πόροι είναι σε παύση. Οι δραστηριότητες καθαρισμού καλύπτουν τη διαφορά μόλις ξαναρχίσει η χωρητικότητα.
  • Η ρύθμιση διατήρησης ισχύει μόνο για αποθήκες. Το τελικό σημείο ανάλυσης SQL του Lakehouse δεν υποστηρίζεται.
  • Τα αρχεία καταγραφής πληροφοριών ερωτημάτων και ελέγχου SQL δεν υπόκεινται σε αυτήν την πολιτική διατήρησης δεδομένων και η διαχείρισή τους γίνεται ξεχωριστά.

Απόρριψη διατήρησης στοιχείου (έκδοση προεπισκόπησης)

Η διατήρηση απορριφθέντων στοιχείων διατηρεί τις αποθήκες και τους σχετικούς πίνακες, σχήματα, στιγμιότυπα, δικαιώματα και αποθηκευμένα ερωτήματα για μια διαμορφώσιμη περίοδο μετά την απόρριψη ή τη διαγραφή τους. Αυτό διασφαλίζει ότι οι τυχαίες διαγραφές δεν οδηγούν σε μόνιμη απώλεια δεδομένων ή διακοπές που επηρεάζουν την επιχείρηση. Η διακοπείσα διατήρηση εγγυάται μια ελάχιστη περίοδο διατήρησης 7 ημερολογιακών ημερών και έχει ξεχωριστή διαμόρφωση διατήρησης σε επίπεδο μισθωτή. Μπορείτε να ρυθμίσετε τις παραμέτρους της περιόδου διατήρησης απορριφθέντων στοιχείων στη ρύθμιση μισθωτή Ανάκτηση στοιχείων.

Επόμενο βήμα