Bagikan melalui


Memahami retensi data di Azure Time Series Insights Gen1

Catatan

Layanan Time Series Insights akan dihentikan pada 7 Juli 2024. Pertimbangkan untuk memigrasikan lingkungan yang ada ke solusi alternatif sesegera mungkin. Untuk informasi selengkapnya tentang penghentian dan migrasi, kunjungi dokumentasi kami.

Perhatian

Ini adalah artikel Gen1.

Artikel ini menjelaskan dua pengaturan utama yang mempengaruhi retensi data di lingkungan Azure Time Series Insights Anda.

Video

Video berikut ini meringkas retensi data Azure Time Series Insights dan cara merencanakannya.

Setiap lingkungan Azure Time Series Insights Anda memiliki pengaturan yang mengontrol waktu retensi data. Nilainya membentang dari 1 hingga 400 hari. Data akan dihapus berdasarkan kapasitas penyimpanan lingkungan atau durasi retensi yang mana pun yang lebih dulu muncul.

Selain itu, lingkungan Azure Time Series Insights Anda memiliki pengaturan batas Penyimpanan diperluas perilaku. Pengaturan ini mengontrol ingress dan hapus menyeluruh perilaku ketika kapasitas maksimal lingkungan tercapai. Ada dua perilaku yang dapat dipilih saat pengonfigurasian:

  • Hapus data lama (default)
  • Jeda Ingress

Catatan

Secara default, saat membuat lingkungan baru, retensi dikonfigurasi untuk Hapus menyeluruh data lama. Pengaturan ini dapat dialihkan sesuai kebutuhan setelah waktu pembuatan menggunakan portal Microsoft Azure, pada halaman Konfigurasikan lingkungan Azure Time Series Insights.

Kedua kebijakan retensi data dijelaskan secara lebih rinci di bawah ini.

Hapus menyeluruh data lama

  • Hapus menyeluruh data lama adalah pengaturan default untuk lingkungan Azure Time Series Insights.
  • Hapus menyeluruh data lama lebih disukai saat pengguna ingin selalu memiliki data terbaru mereka di lingkungan Azure Time Series Insights mereka.
  • Pengaturan Hapus menyeluruh Data lamamenghapus data secara menyeluruh setelah batas lingkungan (waktu retensi, ukuran, atau jumlah, mana pun yang lebih dulu) tercapai. Retensi diatur ke 30 hari secara default.
  • Data paling lama yang diserap dihapus menyeluruh terlebih dahulu (pendekatan "First In First Out").

Contoh satu

Pertimbangkan lingkungan contoh dengan perilaku retensi Lanjutkan ingress dan hapus menyeluruh data lama:

Waktu retensi data diatur ke 400 hari. Kapasitas diatur ke unit S1, yang berisi 30 GB dari total kapasitas. Mari kita asumsikan data masuk terakumulasi rata-rata hingga 500 MB setiap hari. Lingkungan ini hanya dapat menyimpan data selama 60 hari berdasarkan laju data masuk, karena kapasitas maksimum tercapai pada 60 hari. Data masuk terakumulasi sebagai: 500 MB setiap hari x 60 hari = 30 GB.

Pada hari ke-61, lingkungan menunjukkan data terbaru, tetapi menghapus menyeluruh data paling lama, yang lebih dari 60 hari. Hapus menyeluruh membuat ruang untuk streaming data baru, sehingga data baru dapat terus dieksplorasi. Jika pengguna ingin menyimpan data lebih lama, mereka dapat meningkatkan ukuran lingkungan dengan menambahkan unit tambahan atau dapat mendorong lebih sedikit data.

Contoh dua

Pertimbangkan lingkungan juga dikonfigurasi perilaku retensi Lanjutkan ingress dan hapus menyeluruh data lama. Dalam contoh ini, Waktu retensi data diatur ke nilai yang lebih rendah yaitu 180 hari. Kapasitas diatur ke unit S1, yang berisi 30 GB dari total kapasitas. Untuk menyimpan data selama 180 hari penuh, ingress harian tidak boleh melebihi 0,166 GB (166 MB) per hari.

Setiap kali laju ingress harian lingkungan ini melebihi 0,166 GB per hari, data tidak dapat disimpan selama 180 hari, karena beberapa data dihapus menyeluruh. Pertimbangkan lingkungan yang sama ini selama jangka waktu yang sibuk. Asumsikan laju ingress lingkungan dapat meningkat menjadi rata-rata 0,189 GB per hari. Dalam jangka waktu yang sibuk itu, sekitar 158 hari data dipertahankan (30GB/0,189 = 158,73 hari retensi). Kali ini kurang dari jangka waktu retensi data yang diinginkan.

Jeda ingress

  • Pengaturan Jeda Ingress dirancang untuk memastikan data tidak dihapus menyeluruh jika batas ukuran dan hitungan tercapai sebelum periode retensi.

  • Jeda Ingress memberikan waktu tambahan bagi pengguna untuk meningkatkan kapasitas lingkungan mereka sebelum data dihapus menyeluruh karena pelanggaran periode retensi.

  • Ini membantu melindungi Anda dari kehilangan data tetapi dapat memiliki risiko hilangnya data terbaru Anda jika ingress dijeda di luar periode retensi sumber peristiwa Anda.

  • Namun, setelah kapasitas maksimum lingkungan tercapai, lingkungan menjeda ingress data hingga terjadi tindakan tambahan berikut:

Contoh tiga

Pertimbangkan lingkungan dengan perilaku retensi yang dikonfigurasi untuk jeda ingress. Dalam contoh ini, periode retensi Data dikonfigurasi hingga 60 hari. Kapasitas diatur ke tiga (3) unit S1. Asumsikan lingkungan ini memiliki ingress data 2-GB setiap hari. Di lingkungan ini, ingress dijeda setelah kapasitas maksimum tercapai.

Pada saat itu, lingkungan menunjukkan set data yang sama sampai ingress dilanjutkan atau sampai ingress diteruskan diaktifkan (yang akan menghapus menyeluruhn data yang lebih lama untuk memberikan ruang bagi data baru).

Ketika ingress berlanjut:

  • Aliran data dalam urutan diterima oleh sumber peristiwa
  • Peristiwa diindeks berdasarkan tanda waktunya, kecuali Anda telah memperluas kebijakan retensi pada sumber peristiwa Anda. Untuk informasi selengkapnya tentang konfigurasi retensi sumber peristiwa, Tanya Jawab Umum Azure Event Hubs

Penting

Anda harus mengatur peringatan untuk memberikan pemberitahuan yang membantu menghindari ingress dijeda. Kehilangan data mungkin terjadi karena retensi default adalah 1 hari untuk sumber peristiwa Azure. Oleh karena itu, setelah ingress dijeda, Anda mungkin kehilangan data terbaru kecuali tindakan tambahan diambil. Anda harus meningkatkan kapasitas, atau beralih perilaku untuk Hapus menyeluruh data lama untuk menghindari potensi kehilangan data.

Di Pusat Aktivitas yang terpengaruh, pertimbangkan untuk menyesuaikan properti Retensi Pesan untuk meminimalkan kehilangan data saat jeda ingress terjadi di Azure Time Series Insights.

Pusat aktivitas retensi pesan.

Jika tidak ada properti yang dikonfigurasi pada sumber peristiwa (timeStampPropertyName), Azure Time Series Insights default ke tanda waktu kedatangan di hub peristiwa sebagai sumbu X. Jika timeStampPropertyName dikonfigurasi untuk menjadi sesuatu yang lain, lingkungan mencari yang timeStampPropertyName dikonfigurasi dalam paket data saat peristiwa diurai.

Baca Cara menskalakan lingkungan Azure Time Series Insights untuk menskalakan lingkungan Anda untuk mengakomodasi kapasitas tambahan atau meningkatkan panjang retensi.

Langkah berikutnya