Azure Managed Instance for Apache Cassandra의 관리 작업

Azure Managed Instance for Apache Cassandra는 순수 오픈 소스 Apache Cassandra 클러스터를 위한 완전 관리형 서비스입니다. 또한 이 서비스를 사용하면 각 워크로드의 특정 요구 사항에 따라 구성을 재정의할 수 있으므로 필요한 경우 최대한의 유연성과 제어가 가능합니다. 이 문서에서는 해당 서비스에서 제공하는 관리 작업 및 기능을 정의합니다. 또한 하이브리드 클러스터를 유지 관리할 때 Azure 지원 팀과 고객 간의 책임 분리에 대해서도 설명합니다.

압축

  • 다양한 압축 형식이 있습니다. 현재 복구를 통해 간단한 압축을 수행하고 있습니다(유지 관리 참조). 이는 특별한 종류의 압축인 Merkle 트리 압축을 수행합니다.
  • CQL을 사용하여 테이블에 설정된 압축 전략(예: WITH compaction = { 'class' : 'LeveledCompactionStrategy' })에 따라 Cassandra는 테이블이 특정 크기에 도달하면 자동으로 압축합니다. 워크로드에 대한 압축 전략을 신중하게 선택하고 전략을 벗어난 수동 압축을 수행하지 않는 것이 좋습니다.

패치

  • 운영 체제 수준 패치는 약 2주 주기로 자동으로 수행됩니다.

  • Apache Cassandra 소프트웨어 수준 패치는 보안 취약성이 식별될 때 수행됩니다. 패치 주기는 다를 수 있습니다.

  • 패치 중 컴퓨터는 한 번에 하나의 랙씩 재부팅됩니다. 쿼럼 ALL 설정이 사용되지 않고 복제 요소가 3 이상인 한, 애플리케이션 쪽에서 성능 저하가 발생해서는 안 됩니다.

  • Apache Cassandra의 버전은 X.Y.Z 형식입니다. 서비스 도구를 통해 주(X) 및 부(Y) 버전의 배포를 수동으로 제어할 수 있습니다. 반면 해당 주/부 버전 조합에 필요할 수 있는 Cassandra 패치(Z)는 자동으로 수행됩니다.

참고 항목

이 서비스는 현재 Cassandra 버전 3.11 및 4.0을 지원합니다. 두 버전 모두 GA입니다. 클러스터 배포 중에 Cassandra 버전을 지정하는 경우 Azure CLI 빠른 시작(5단계)을 참조하세요.

유지 관리

  • Nodetool 복구reaper를 사용하여 서비스에서 자동으로 실행됩니다. 이 도구는 매주 한 번 실행됩니다. 하이브리드 배포에 고유한 서비스를 사용하는 경우 이 기능을 사용하지 않도록 설정할 수 있습니다.

  • 노드 상태 모니터링은 다음으로 구성됩니다.

    • Cassandra 링에서 각 노드의 멤버 자격을 적극적으로 모니터링합니다.
    • 가상 머신, 네트워크, 스토리지, Linux 및 지원 소프트웨어 오류와 같은 인프라 문제를 자동 검색하고 자동화합니다.
    • CPU, 디스크, 쿼럼 손실 및 기타 리소스 문제를 사전에 모니터링합니다.
    • 가능한 경우 실패한 노드를 자동으로 불러오고, 자동 생성된 경고에 대한 응답으로 노드를 수동으로 불러옵니다.

지원

Azure Managed Instance for Apache Cassandra는 관리형 클러스터의 데이터 센터 가용성을 위한 SLA를 제공합니다. 서비스 사용과 관련된 문제가 발생하는 경우 Azure Portal에서 지원 요청을 제출합니다.

지원 혜택은 다음과 같습니다.

  • Cassandra 인프라 문제에 대한 단일 연락 창구 - IaaS 팀(디스크, 컴퓨팅, 네트워킹)에 별도로 지원 사례를 제기할 필요가 없습니다.
  • 성능 병목 현상, 크기 조정 및 기타 리소스 제약 조건 문제에 대해 이메일을 통해 사전 조언을 제공합니다.
  • 심각한 중단 인시던트에 대해 자동 생성된 인시던트를 포함하여 연중무휴 24시간 지원이 제공됩니다.
  • 커뮤니티 승인 패치 지원(패치 참조).
  • 사내 Java JDK/JVM 엔지니어링 팀 지원.
  • 소프트웨어 공급망 보안을 통해 Linux 운영 체제를 지원합니다.

Important

지원 사례를 통해 보고된 문제를 조사 및 진단하고 가능한 경우 해결하거나 완화할 것입니다. 그러나 CPU, 디스크 또는 네트워크 문제를 일으키는 Apache Cassandra 구성 수준 사용에 대한 책임은 사용자에게 있습니다.

이러한 문제의 예는 다음과 같습니다.

  • 비효율적인 쿼리 작업
  • 용량을 초과하는 처리량
  • 스토리지 용량을 초과하는 데이터 수집
  • 잘못된 Keyspace 구성 설정
  • 잘못된 데이터 모델 또는 파티션 키 전략

지원 사례를 조사하고 문제의 근본 원인이 Apache Cassandra 구성 수준(유지 관리하는 기본 플랫폼 수준 측면이 아님)에 있는 경우, 사례를 종료하기 전에 수정 또는 완화(가능한 경우)에 대한 권장 사항과 지침을 제공할 것입니다.

위와 같은 Apache Cassandra의 일반적인 애플리케이션/구성 수준 문제를 방지하기 위해 메트릭을 사용하도록 설정하고/또는 Azure Monitor 통합에 익숙해지는 것이 좋습니다.

Warning

Apache Cassandra용 Azure Managed Instance를 사용하면 일상적인 DBA 관리를 위해 nodetoolsstable 명령을 실행할 수 있습니다. 여기에서 문서를 참조하세요. 이러한 명령 중 일부는 cassandra 클러스터를 불안정하게 만들 수 있으며 비프로덕션 환경에서 테스트된 후에만 신중하게 실행해야 합니다. 가능한 경우 --dry-run 옵션을 먼저 배포해야 합니다. Microsoft는 기본 데이터베이스 구성 및/또는 테이블을 변경하는 명령 실행 문제에 대해 SLA 또는 지원을 제공할 수 없습니다.

백업 및 복원

스냅샷 백업은 기본적으로 사용하도록 설정되며 24시간마다 수행됩니다. 백업은 내부 Azure Blob Storage 계정에 저장되며 최대 2일(48시간) 동안 유지됩니다. 초기 2개 백업에 대한 비용은 없습니다. 추가 백업에는 요금이 청구됩니다. 가격 책정을 참조하세요. 백업 간격이나 보존 기간을 변경하려면 포털에서 정책을 편집하면 됩니다.

Screenshot of backup schedule configuration page.

기존 백업에서 복원하려면 Azure Portal에서 지원 요청을 제출합니다. 지원 사례를 제출할 때 다음을 수행해야 합니다.

  1. 복원하려는 백업에 대해 포털에서 백업 ID를 제공합니다. 이는 포털에서 찾을 수 있습니다.

    Screenshot of backup schedule configuration page highlighting backup ID.

  2. 전체 클러스터의 복원이 필요하지 않은 경우 복원해야 하는 키스페이스와 테이블(해당하는 경우)을 제공합니다.

  3. 기존 클러스터에서 백업을 복원할지, 아니면 새 클러스터에서 복원할지 여부를 조언합니다.

  4. 새 클러스터로 복원하려면 먼저 새 클러스터를 만들어야 합니다. 대상 클러스터가 데이터 센터 수 측면에서 원본 클러스터와 일치하고 해당 데이터 센터에 노드 수가 동일한지 확인합니다. 또한 새 대상 클러스터에 자격 증명(사용자 이름/암호)을 유지할지 아니면 원래 만들어진 사용자 이름/암호를 복원하여 재정의하도록 허용할지 결정할 수도 있습니다.

  5. 또한 새 대상 클러스터에 system_auth 키스페이스를 유지할지 아니면 복원 시 백업의 데이터로 덮어쓰도록 허용할지 결정할 수도 있습니다. Cassandra의 system_auth 키스페이스에는 역할, 역할 권한, 암호를 포함한 권한 부여 및 내부 인증 데이터가 포함되어 있습니다. 기본 복원 프로세스는 system_auth 키스페이스를 덮어씁니다.

참고 항목

백업에서 복원하라는 요청에 응답하는 데 걸리는 시간은 제기하는 지원 사례의 심각도(및 응답 시간에 대한 해당 SLA)와 복원할 데이터의 양에 따라 달라집니다. 그러나 복원을 완료하는 데 걸리는 시간에 대한 SLA는 제공하지 않습니다. 이는 복원되는 데이터의 양에 따라 크게 달라지기 때문입니다.

Warning

백업은 실수로 삭제되는 시나리오를 위한 것이며 지역 중복이 아닙니다. 따라서 전체 지역 가동 중단 시 DR(재해 복구) 전략으로 사용하지 않는 것이 좋습니다. 지역 전체 중단으로부터 보호하려면 다중 지역 배포를 권장합니다. 다중 지역 배포에 대한 빠른 시작을 살펴보세요.

보안

Azure Managed Instance for Apache Cassandra는 다음과 같이 다양하고 명시적인 기본 제공 보안 제어 및 기능을 제공합니다.

  • 제어되는 공급망을 사용하여 강화된 Linux 가상 머신 이미지
  • 운영 체제 수준에서 일반적인 취약성 및 노출(CVE) 모니터링
  • 관리형 가상 머신에서 호스팅되는 Apache Cassandra 및 Prometheus 소프트웨어 모두에 대한 인증서 전환
  • 적극적인 취약성 검색
  • 적극적인 바이러스 검색
  • 보안 코딩 방법

보안 기능에 대한 자세한 내용은 여기에서 문서를 참조하세요.

하이브리드 지원

하이브리드 클러스터가 구성되면 서비스에서 실행되는 자동화된 reaper 작업이 전체 클러스터에 도움이 됩니다. 여기에는 서비스에서 프로비전되지 않는 데이터 센터가 포함됩니다. 이외에도 온-프레미스 또는 외부적으로 호스트된 데이터 센터를 유지 관리하는 것은 사용자의 책임입니다.

다음 단계

다음 빠른 시작을 진행하세요.