다음을 통해 공유


Azure Time Series Insights Gen1의 데이터 보존 이해

참고 항목

Time Series Insights 서비스는 2024년 7월 7일에 사용 중지됩니다. 최대한 빨리 기존 환경을 대체 솔루션으로 마이그레이션하는 것이 좋습니다. 사용 중단 및 마이그레이션에 대한 자세한 내용은 설명서를 참조하세요.

주의

이는 Gen1 문서입니다.

이 문서에서는 Azure Time Series Insights 환경의 데이터 보존에 영향을 미치는 두 가지 기본 설정을 설명합니다.

동영상

다음 비디오에서는 Azure Time Series Insights 데이터 보존 및 이를 계획하는 방법을 간략하게 설명합니다.

각 Azure Time Series Insights 환경에는 데이터 보존 시간을 제어하는 설정이 있습니다. 값의 범위는 1~400일입니다. 데이터는 환경 스토리지 용량 또는 보존 기간 중 먼저 발생하는 조건을 기준으로 삭제됩니다.

또한 Azure Time Series Insights 환경에는 스토리지 한도 초과 시 동작 설정이 있습니다. 해당 설정은 환경의 최대 용량에 도달하면 수신 및 제거 동작을 제어합니다. 구성할 때 선택할 수 있는 두 가지 동작이 있습니다.

  • 이전 데이터 삭제(기본값)
  • 수신 일시 중지

참고 항목

기본적으로 새 환경을 만들면 보존 기간이 이전 데이터 삭제로 구성됩니다. 이 설정은 Azure Time Series Insights 환경의 구성 페이지에서 Azure Portal을 사용하여 생성 시간 후에 필요에 따라 토글할 수 있습니다.

데이터 보존 정책은 둘 다 아래에서 더 자세히 설명합니다.

이전 데이터 삭제

  • 이전 데이터 삭제는 Azure Time Series Insights 환경의 기본 설정입니다.
  • 사용자가 항상 Azure Time Series Insights 환경에 ‘최신 데이터’를 포함하기를 원하는 경우에는 이전 데이터 삭제를 사용하는 것이 좋습니다.
  • 이전 데이터 삭제 설정은 환경의 한도(보존 시간, 크기 또는 개수 중 먼저 발생하는 조건)에 도달한 후 데이터를 ‘제거’합니다. 기본적으로 보존 기간은 30일로 설정됩니다.
  • 가장 오래된 수집 데이터가 먼저 제거됩니다(“선입선출” 접근 방식).

예 1

보존 동작 수신을 계속하고 이전 데이터 삭제가 지정된 예제 환경을 고려해 보세요.

데이터 보존 시간이 400일로 설정됩니다. 용량은 30GB의 총 용량을 포함하는 S1 단위로 설정됩니다. 인바운드 데이터가 매일 평균 500MB 누적된다고 가정하겠습니다. 인바운드 데이터의 속도에 따르면 60일째에 최대 용량에 도달하므로 이 환경은 데이터를 60일만 보존할 수 있습니다. 이 기간 동안 인바운드 데이터의 누적량을 계산해 보면 다음과 같습니다. 500MB x 60일 = 30GB.

61일째에 가장 최신 데이터를 보여 주지만 60일보다 오래된 데이터는 삭제됩니다. 삭제를 통해 스트리밍되는 새 데이터를 위한 공간을 확보하여 새 데이터를 계속 탐색할 수 있습니다. 데이터를 더 오래 보존하려면 단위를 추가하여 환경의 규모를 늘리거나 푸시되는 데이터의 양을 줄여야 합니다.

예제 2

보존 동작이 수신을 계속하고 이전 데이터 삭제로 구성되어 있는 환경도 생각해 보세요. 이 예제에서는 데이터 보존 시간이 더 낮은 값인 180일로 설정됩니다. 용량은 30GB의 총 용량을 포함하는 S1 단위로 설정됩니다. 180일 내내 데이터를 저장하려면 일일 수신 규모가 0.166GB(166MB)를 초과하지 않아야 합니다.

이 환경의 일일 수신 속도가 0.166GB를 초과할 때마다 일부 데이터가 삭제되므로 데이터가 180일 동안 보관되지 않습니다. 이와 동일한 환경을 바쁜 시간대에 사용한다고 생각해 보세요. 환경의 수신 속도가 일일 평균 0.189GB로 증가할 수 있다고 가정해 보겠습니다. 이러한 바쁜 시간대에는 데이터가 약 158일 동안 보존됩니다(30GB/0.189 = 158.73일). 원하는 데이터 보존 기간보다 줄어든 기간입니다.

수신 일시 중지

  • 수신 일시 중지 설정은 보존 기간 전에 크기 및 개수 한도에 도달하는 경우 데이터가 제거되지 않도록 디자인됩니다.

  • 수신 일시 중지는 보존 기간 위반으로 데이터가 제거되기 전에 사용자가 해당 환경의 용량을 늘릴 수 있는 추가 시간을 제공합니다.

  • 이 설정은 데이터 손실을 방지하는 데 도움이 되지만 이벤트 원본의 보존 기간이 지나서 수신이 일시 중지될 경우 가장 최근 데이터가 손실될 가능성이 생길 수 있습니다.

  • 하지만 환경의 최대 용량에 도달하면 환경은 다음 추가 작업이 수행될 때까지 데이터 수신을 일시 중지합니다.

예 3

보존 동작이 수신 일시 중지로 구성된 환경을 생각해 보세요. 이 예제에서는 데이터 보존 기간 60일로 구성됩니다. 용량은 S1의 3개 단위로 설정됩니다. 이 환경에 매일 2GB 데이터가 수신된다고 가정하겠습니다. 이 환경에서 최대 용량에 도달하면 수신이 일시 중지됩니다.

이때 수신이 다시 시작되거나 수신 계속이 사용하도록 설정될 때까지 환경에 동일한 데이터 세트가 표시됩니다(더 오래된 데이터를 제거하여 새 데이터를 위한 공간 확보).

수신이 다시 시작되면:

  • 이벤트 원본이 수신한 순서대로 데이터가 흐릅니다.
  • 이벤트 원본의 보존 정책을 초과하지 않은 경우, 타임스탬프에 따라 이벤트가 인덱싱됩니다. 이벤트 원본 보존 기간 구성에 대한 자세한 내용은 Event Hubs FAQ를 참조하세요.

Important

수신이 일시 중지되는 것을 방지하는 데 도움이 되는 통지를 제공하도록 경고를 설정해야 합니다. Azure 이벤트 원본의 기본 보존 기간은 1일이므로 데이터가 손실될 수 있습니다. 따라서 수신이 일시 중지된 후 추가 조치를 취하지 않을 경우 가장 최근의 데이터가 손실될 수 있습니다. 데이터 손실 가능성을 피하려면 용량을 늘리거나 이전 데이터 삭제로 동작을 전환해야 합니다.

영향을 받는 Event Hubs에서는 Azure Time Series Insights에서 수신 일시 중지가 발생할 경우 데이터 손실을 최소화하기 위해 메시지 보존 속성을 조정하는 것이 좋습니다.

이벤트 허브 메시지 보존.

이벤트 원본에 구성된 속성이 없는 경우(timeStampPropertyName) Azure Time Series Insights는 기본적으로 이벤트 허브 도착 타임스탬프를 X축으로 설정합니다. timeStampPropertyName이 다른 값으로 구성된 경우 환경은 이벤트가 구문 분석될 때 데이터 패킷에서 구성된 timeStampPropertyName을 검색합니다.

Azure Time Series Insights 환경을 스케일링하는 방법을 참조하여 추가 용량을 수용할 수 있도록 환경을 스케일링하거나 보존 기간을 늘립니다.

다음 단계