Udostępnij za pośrednictwem


Omówienie przechowywania danych w usłudze Azure Time Series Insights Gen1

Uwaga

Usługa Time Series Insights zostanie wycofana 7 lipca 2024 r. Rozważ migrację istniejących środowisk do alternatywnych rozwiązań tak szybko, jak to możliwe. Aby uzyskać więcej informacji na temat wycofywania i migracji, odwiedź naszą dokumentację.

Uwaga

Jest to artykuł z generacji 1.

W tym artykule opisano dwa podstawowe ustawienia wpływające na przechowywanie danych w środowisku usługi Azure Time Series Insights.

Wideo

W poniższym filmie wideo przedstawiono podsumowanie przechowywania danych usługi Azure Time Series Insights i sposobu ich planowania.

Każde ze środowisk usługi Azure Time Series Insights ma ustawienie kontrolujące czas przechowywania danych. Wartość obejmuje od 1 do 400 dni. Dane są usuwane na podstawie pojemności magazynu środowiska lub czasu przechowywania, w zależności od tego, co nastąpi wcześniej.

Ponadto środowisko usługi Azure Time Series Insights ma ustawienie przekroczenia limitu magazynu . Steruje on zachowaniem ruchu przychodzącego i przeczyszczania po osiągnięciu maksymalnej pojemności środowiska. Istnieją dwa zachowania, które należy wybrać podczas konfigurowania:

  • Przeczyść stare dane (ustawienie domyślne)
  • Wstrzymywanie ruchu przychodzącego

Uwaga

Domyślnie podczas tworzenia nowego środowiska przechowywanie jest skonfigurowane do przeczyszczania starych danych. To ustawienie można przełączać zgodnie z potrzebami po utworzeniu witryny Azure Portal na stronie Konfigurowanie środowiska usługi Azure Time Series Insights.

Obie zasady przechowywania danych zostały opisane bardziej szczegółowo poniżej.

Przeczyszczanie starych danych

  • Przeczyszczanie starych danych jest ustawieniem domyślnym dla środowisk usługi Azure Time Series Insights.
  • Przeczyszczanie starych danych jest preferowane, gdy użytkownicy chcą zawsze mieć najnowsze dane w swoim środowisku usługi Azure Time Series Insights.
  • Przeczyść stare ustawienie danych czyści dane po osiągnięciu limitów środowiska (czasu przechowywania, rozmiaru lub liczby). Okres przechowywania jest domyślnie ustawiony na 30 dni.
  • Najstarsze pozyskane dane są najpierw przeczyszczane (podejście "First In First Out").

Przykładowy

Rozważmy przykładowe środowisko z zachowaniem przechowywania Kontynuuj ruch przychodzący i przeczyszczanie starych danych:

Czas przechowywania danych wynosi 400 dni. Pojemność jest ustawiona na jednostkę S1, która zawiera 30 GB całkowitej pojemności. Załóżmy, że dane przychodzące gromadzą się średnio do 500 MB każdego dnia. To środowisko może przechowywać tylko dane o wartości 60 dni, biorąc pod uwagę szybkość danych przychodzących, ponieważ maksymalna pojemność jest osiągana przez 60 dni. Dane przychodzące gromadzą się w postaci: 500 MB każdego dnia x 60 dni = 30 GB.

W 61 dniu środowisko pokazuje najświeższe dane, ale czyści najstarsze dane, starsze niż 60 dni. Przeczyszczenie sprawia, że miejsce na nowe przesyłanie strumieniowe danych jest możliwe, dzięki czemu nowe dane mogą być nadal eksplorowane. Jeśli użytkownik chce dłużej przechowywać dane, może zwiększyć rozmiar środowiska przez dodanie dodatkowych jednostek lub wypchnięcie mniejszej ilości danych.

Przykład dwa

Rozważ również skonfigurowane zachowanie przechowywania kontynuuj ruch przychodzący i przeczyść stare dane. W tym przykładzie czas przechowywania danych jest ustawiony na niższą wartość 180 dni. Pojemność jest ustawiona na jednostkę S1, która zawiera 30 GB całkowitej pojemności. Aby przechowywać dane przez pełne 180 dni, dzienny ruch przychodzący nie może przekraczać 0,166 GB (166 MB) dziennie.

Za każdym razem, gdy dzienna szybkość ruchu przychodzącego tego środowiska przekracza 0,166 GB dziennie, dane nie mogą być przechowywane przez 180 dni, ponieważ niektóre dane są czyszczone. Rozważ to samo środowisko w okresie zajętości. Załóżmy, że szybkość ruchu przychodzącego środowiska może wzrosnąć do średnio 0,189 GB dziennie. W tym zajętym przedziale czasowym dane są zachowywane przez około 158 dni (30 GB/0,189 = 158,73 dni przechowywania). Ten czas jest krótszy niż żądany przedział czasu przechowywania danych.

Wstrzymywanie ruchu przychodzącego

  • Ustawienie Wstrzymywanie ruchu przychodzącego zostało zaprojektowane w celu zapewnienia, że dane nie są czyszczone, jeśli rozmiar i liczba limitów zostaną osiągnięte przed upływem okresu przechowywania.

  • Wstrzymywanie ruchu przychodzącego zapewnia użytkownikom dodatkowy czas na zwiększenie pojemności środowiska przed przeczyszczeniem danych z powodu naruszenia okresu przechowywania.

  • Pomaga chronić cię przed utratą danych, ale może stworzyć możliwość utraty najnowszych danych, jeśli ruch przychodzący zostanie wstrzymany poza okres przechowywania źródła zdarzeń.

  • Jednak po osiągnięciu maksymalnej pojemności środowiska środowisko wstrzymuje ruch przychodzący do momentu wystąpienia następujących dodatkowych akcji:

    • Maksymalna pojemność środowiska zwiększa się, aby dodać więcej jednostek skalowania zgodnie z opisem w temacie Jak skalować środowisko usługi Azure Time Series Insights.
    • Osiągnięto okres przechowywania danych, a dane są czyszczone, przenosząc środowisko poniżej maksymalnej pojemności.

Przykład trzy

Rozważ środowisko z zachowaniem przechowywania skonfigurowanym do wstrzymania ruchu przychodzącego. W tym przykładzie okres przechowywania danych jest skonfigurowany do 60 dni. Pojemność jest ustawiona na trzy (3) jednostki S1. Załóżmy, że to środowisko każdego dnia ma dane przychodzące o rozmiarze 2 GB. W tym środowisku ruch przychodzący jest wstrzymany po osiągnięciu maksymalnej pojemności.

W tym czasie środowisko pokazuje ten sam zestaw danych do momentu wznowienia ruchu przychodzącego lub do momentu włączenia dalszego ruchu przychodzącego (co spowoduje przeczyszczenie starszych danych w celu zapewnienia miejsca na nowe dane).

Po wznowieniu ruchu przychodzącego:

  • Przepływy danych w kolejności, w których zostały odebrane przez źródło zdarzeń
  • Zdarzenia są indeksowane na podstawie sygnatury czasowej, chyba że przekroczono zasady przechowywania w źródle zdarzeń. Aby uzyskać więcej informacji na temat konfiguracji przechowywania źródła zdarzeń, usługa Event Hubs — często zadawane pytania

Ważne

Należy ustawić alerty, aby zapewnić powiadomienie, aby uniknąć wstrzymania ruchu przychodzącego. Utrata danych jest możliwa, ponieważ domyślny okres przechowywania wynosi 1 dzień dla źródeł zdarzeń platformy Azure. W związku z tym po wstrzymaniu ruchu przychodzącego prawdopodobnie utracisz najnowsze dane, chyba że zostanie podjęta dodatkowa akcja. Aby uniknąć potencjalnego utraty danych, musisz zwiększyć pojemność lub przełączyć zachowanie w celu przeczyszczania starych danych .

W przypadku usługi Event Hubs, której to dotyczy, rozważ dostosowanie właściwości Przechowywanie komunikatów w celu zminimalizowania utraty danych w przypadku wstrzymania ruchu przychodzącego w usłudze Azure Time Series Insights.

Przechowywanie komunikatów centrum zdarzeń.

Jeśli żadne właściwości nie są skonfigurowane w źródle zdarzeń (timeStampPropertyName), usługa Azure Time Series Insights domyślnie określa znacznik czasu przybycia do centrum zdarzeń jako oś X. Jeśli timeStampPropertyName jest skonfigurowany jako coś innego, środowisko wyszukuje skonfigurowane timeStampPropertyName w pakiecie danych, gdy zdarzenia są analizowane.

Przeczytaj artykuł Jak skalować środowisko usługi Azure Time Series Insights w celu skalowania środowiska w celu dostosowania się do dodatkowej pojemności lub zwiększenia czasu przechowywania.

Następne kroki