Azure VMware Solution 워크로드에 대한 모니터링 고려 사항

이 문서에서는 Azure VMware Solution 워크로드의 모니터링 디자인 영역에 대해 설명합니다. 이 영역은 가시성 모범 사례에 중점을 둡니다. 지침은 운영 팀을 위한 것입니다. Microsoft, VMware 및 타사에서는 인프라 및 애플리케이션을 모니터링하는 데 사용할 수 있는 다양한 도구를 제공합니다. 이 문서에서는 이러한 옵션을 나열합니다.

각 옵션은 다양한 수준의 라이선스 비용, 통합 옵션, 모니터링 scope 및 지원을 제공하는 모니터링 솔루션을 제공합니다. 도구를 사용하기 전에 해당 사용 약관을 신중하게 검토합니다.

인프라 데이터 수집

영향: 운영 우수성

워크로드를 모니터링하려면 Azure VMware Solution 인프라 및 다양한 VMware 솔루션 구성 요소에서 데이터를 수집해야 합니다. Azure VMware Solution VMware Aria와 같은 여러 VMware 솔루션 네이티브 구성 요소를 실행하는 VMware SDDC(소프트웨어 정의 데이터 센터)와 통합됩니다. VMware Aria Operations를 비롯한 이 도구 모음을 사용하여 인프라의 다양한 측면을 관리할 수 있습니다.  

사용 가능한 또 다른 도구는 Azure VMware Solution VMware vSphere 상태입니다. 이 도구를 사용하면 Azure VMware Solution 환경에서 자동 관리 문제 검색 및 수정이 지속적으로 수행되도록 할 수 있습니다. 특히 이 도구는 VMware vSphere 인프라에서 잘못된 구성을 찾아 성능 병목 상태를 검색합니다. 또한 리소스 사용률 및 전반적인 환경 건강 성능에 대한 인사이트를 제공합니다.

VMware Aria Operations for Networks는 포괄적인 네트워크 가시성을 달성하고, 문제 해결 프로세스를 간소화하고, 네트워크 성능을 최적화하는 데 도움이 됩니다.

권장 사항
  • VMware vSphere 상태 구성을 통해 Azure VMware Solution 프라이빗 클라우드 상태 상태 개략적으로 볼 수 있습니다.
  • VMware Aria Suite와 같은 타사 도구를 사용하여 Azure VMware Solution 프라이빗 클라우드 네트워크 인프라의 향상된 가시성 및 분석을 제공합니다.
  • 다음과 같은 Azure 네이티브 모니터링 도구를 사용합니다.
    • Azure Monitor.
    • 운영 모니터링을 위한 VMware Aria 작업.
    • 규정 준수 모니터링을 위한 Azure Policy 및 관련 dashboard.
    • 보안 모니터링을 위한 클라우드 및 Microsoft Sentinel용 Microsoft Defender.

로그 및 보관 관리

영향: 운영 우수성

VMware 솔루션 구성 요소에서 상태 데이터를 얻으려면 VMware syslog 서비스에서 수집하는 로그에 액세스해야 합니다. 솔루션 구성 요소의 예로는 VMware ESXi, VMware vSAN, VMware NSX-T 데이터 센터 및 VMware vCenter Server가 있습니다. 이러한 구성 요소의 로그는 Azure VMware Solution 인프라를 통해 사용할 수 있습니다. Log Analytics 에이전트 또는 확장은 VM(가상 머신) 수준에서 Log Analytics로 게스트 로그를 보냅니다. Azure VMware Solution 내에서 Azure VMware Solution 로그를 Azure 네이티브 스토리지 Blob으로 보낼 수 있습니다. 스토리지 Blob에 로그를 보내려면 중앙 집중식 syslog 서버에서 전달자를 설정하거나 Azure Monitor에서 Blob을 대상으로 구성할 수 있습니다. Azure Logic Apps 또는 Azure Functions 같은 Azure 네이티브 도구를 사용하여 로그를 전달할 수도 있습니다. 이러한 도구를 사용하여 Azure VMware Solution 들어오는 로그에 대한 수신기를 만들고 스토리지 Blob에 로그를 보낼 수 있습니다.

보관 로그는 스토리지 비용을 낮추기 위한 전략입니다. Azure Storage Blob 및 Log Analytics는 장기 보관을 위해 로그를 전송할 수 있습니다. 스토리지 Blob을 사용하는 것은 비용이 적게 드는 옵션입니다. 그러나 Log Analytics에는 기계 학습 기반 인사이트를 경고, 시각화, 쿼리 및 얻기 위한 고급 통합이 있습니다. 솔루션을 선택할 때 예산, 기능적 사용 사례 및 장기 사용 사례를 고려합니다.

권장 사항
  • VMware syslog 서비스에서 로그를 수집하여 VMware ESXi, VMware vSAN, VMware NSX-T 데이터 센터 및 VMware vCenter Server와 같은 VMware 솔루션 구성 요소에서 상태 데이터를 가져옵니다.
  • 로깅을 위한 VMware Aria 작업과 같은 도구를 구성하여 쿼리, 분석 및 보고 기능을 위한 다양한 로그를 수집합니다.
  • 쿼리 시간을 줄이고 스토리지 비용을 절약하기 위해 로그를 장기 스토리지로 보내기 위한 보존 기간을 구성합니다.

게스트 운영 체제 모니터링

영향: 운영 우수성

게스트 운영 체제 내에서 메트릭은 디스크 사용, 애플리케이션 성능, 시스템 리소스 사용률 및 사용자 작업에 사용할 수 있습니다. Azure Arc for Azure VMware Solution(미리 보기)를 사용하여 Azure에서 VMware 인프라 리소스를 관리하는 것이 좋습니다. 자세한 내용은 Azure VMware Solution Azure Arc 배포를 참조하세요.

권장 사항
  • 서버용 Azure Arc 또는 azure Arc for Azure VMware Solution(미리 보기)에서 프라이빗 클라우드를 사용하도록 설정한 후 게스트 관리를 사용하도록 설정하고 Azure 확장을 설치합니다.
  • 추가 에이전트를 설치하여 데이터를 수집하여 Azure VMware Solution 게스트 VM에서 게스트 관리 및 모니터링을 사용하도록 설정합니다.  

보안 모니터링 구현

영향: 보안, 운영 우수성

보안 모니터링은 비정상적인 활동을 감지하고 대응하는 데 중요합니다. Azure VMware Solution 프라이빗 클라우드에서 실행되는 워크로드에는 네트워크, Azure 리소스 및 Azure VMware Solution 프라이빗 클라우드 자체에 걸쳐 있는 포괄적인 보안 모니터링이 필요합니다. Microsoft Sentinel 작업 영역을 배포하여 보안 이벤트를 중앙 집중화할 수 있습니다. 운영 팀은 이 통합을 사용하여 광범위한 조직 위협 환경의 컨텍스트에서 보안 인시던트 보기, 분석 및 검색할 수 있습니다.

권장 사항
  • Azure VMware Solution 프라이빗 클라우드를 배포하는 데 사용하는 Azure 구독에서 클라우드용 Defender를 사용하도록 설정합니다. 클라우드용 Defender 계획에서 CWP(클라우드 워크로드 보호) 설정에 서버의 ON 값이 있는지 확인합니다.
  • 권한 있는 사용자가 Azure VMware Solution 프라이빗 클라우드에서 수행하는 작업을 감사합니다. 자세한 내용은 권한 있는 ID 관리의 그룹 할당에 대한 감사 활동 기록을 참조하세요.
  • 클라우드용 Defender와 Microsoft Sentinel을 통합합니다. 보안 이벤트에 데이터 수집기를 사용하도록 설정하고 클라우드용 Defender와 연결합니다.
  • Azure VMware Solution 유효성이 검사된 파트너의 보안 모니터링 솔루션을 사용합니다.

네트워크 모니터링 및 분석

영향: 보안, 운영 우수성

네트워크 모니터링 프로세스는 Azure VMware Solution 프라이빗 클라우드로 들어오고 나가는 모든 트래픽을 검사합니다. Azure VMware Solution 네트워크 보안은 네트워크 및 호스트 계층에서 작동합니다.

권장 사항
  • Azure VMware Solution 프라이빗 클라우드에 배포된 네트워크 방화벽 로그를 캡처하고 모니터링합니다. 또한 애플리케이션이 Azure Firewall 또는 Azure Application Gateway 같은 Azure 네이티브 디바이스로 확장될 때 Azure에 배포되는 로그를 모니터링합니다. 자세한 내용은 Azure VMware Solution의 방화벽 통합을 참조하세요.
  • Azure Firewall 통합 문서 또는 유사한 도구를 사용하여 방화벽 디바이스와 관련된 일반적인 메트릭 및 로그를 모니터링합니다.
  • ID, 네트워킹 및 인프라 벡터와 같은 여러 보안 벡터의 로그 상관 관계를 지정합니다.

경고 구성 및 간소화

영향: 운영 우수성, 비용 최적화

Azure VMware Solution 프라이빗 클라우드에서 워크로드를 실행하는 경우 워크로드 성능을 효과적으로 모니터링해야 합니다. 예를 들어 애플리케이션 및 인프라 계층에 대한 로그, 메트릭 및 추적 요청을 캡처해야 합니다.

경고는 성능 기준의 변경 내용에 응답하는 데 도움이 될 수 있습니다. 경고를 사용하여 필요한 유지 관리 또는 구성 변경에 대한 정보를 제공할 수도 있습니다. instance 경우 키가 만료되거나, 연결이 끊어지거나, 리소스 용량을 초과할 위험이 있는 경우 알림을 받을 수 있습니다.

경고를 효과적으로 만들려면 특정 조건이 충족될 때 책임 있는 팀에 알리도록 구성합니다. 또한 경고를 통합하여 전송되는 개별 알림 수를 줄이는 것이 좋습니다.

  • 공간이 부족한 모든 컴퓨터에 대해 경고를 실행하는 대신 호스트, 리소스 그룹 또는 클러스터별로 경고를 통합하는 것이 좋습니다.
  • 호스트 문제, CPU 및 스토리지 급증과 함께 이 방법도 사용합니다.
  • 시간 창에 대한 기본 경고입니다. 예를 들어 호스트가 짧은 시간 동안 경고를 발행하는 경우 정의된 시간 임계값에 따라 경고를 표시하지 않을 수 있습니다. instance 경우 5분이 지난 후에만 경고를 보낼 수 있습니다.
권장 사항
  • 성능 데이터를 기반으로 하는 기준을 논의하고 설정합니다.
  • 임계값, 심각도 수준 또는 특정 조건과 같은 관련 경고 조건을 정의합니다.
  • VMware vSphere 이벤트 및 경보 하위 시스템을 사용하여 VMware vSphere를 모니터링하고 트리거를 설정합니다.
  • 이벤트에 실시간으로 응답하도록 Azure VMware Solution Azure 경고를 구성합니다.
  • VMware vSAN 데이터 저장소 여유 공간이 SLA(서비스 수준 계약)가 요구하는 수준에서 유지 관리되도록 경고가 구성되어 있는지 확인합니다.
  • 리소스 상태 경고를 구성하여 Azure VMware Solution 프라이빗 클라우드의 실시간 상태 상태 가져옵니다.
  • APM(애플리케이션 성능 모니터링) 도구를 사용하여 애플리케이션 코드 수준에서 성능 인사이트를 얻습니다.
  • 가상 트랜잭션, 하트비트 모니터링 및 엔드포인트 모니터링과 같은 모니터링 기술의 조합을 사용합니다.
  • 운영에 미치는 영향 또는 영향을 받는 시스템의 중요도에 따라 경고의 우선 순위를 지정합니다. 의미 있는 이벤트만 트리거하도록 경고를 미세 조정합니다.
  • 노이즈를 줄이고 경고를 효과적으로 관리하려면 발행되는 개별 알림 수를 줄이는 방법을 사용합니다.
  • 경고 피로를 최소화하려면 주요 관련자에게 중요한 이벤트만 알리는 메커니즘을 사용합니다.
  • SMS, 이메일, 푸시 알림 및 Microsoft Teams와 같은 공동 작업 플랫폼과 같은 알림 채널을 사용하여 경고가 효과적으로 전달되도록 합니다.

비용 관리

영향: 비용 최적화, 운영 우수성

비용 모니터링은 Azure VMware Solution 프라이빗 클라우드와 연결된 비용을 추적하는 기능을 의미합니다.

권장 사항
  • VMware vSphere 이벤트 및 경보 하위 시스템을 사용하여 VMware vSphere를 모니터링하고 트리거를 설정합니다.
  • Azure VMware Solution 대한 Log Analytics 쿼리를 기반으로 하는 Azure 경고를 구성합니다. 이러한 경고는 운영 팀이 예상 및 예기치 않은 이벤트에 실시간으로 응답하는 데 도움이 됩니다.

문제 해결 및 디버깅 도구 사용

영향: 비용 최적화, 운영 우수성

애플리케이션을 효율적으로 디버그하고 문제를 해결하려면 로그, 메트릭 및 관련 정보가 필요합니다. 이 정보에는 이벤트 간의 연결을 식별, 분석 및 설정할 수 있도록 이벤트 활동이 포함됩니다.

권장 사항
  • Azure VMware Solution syslog 서비스에서 Log Analytics로 로그를 전달하도록 시스템을 구성합니다. 모든 관련 로그, 메트릭 및 진단 정보를 전달합니다.
  • Azure VMware Solution 프라이빗 클라우드 내에서 실행되는 게스트 VM에서 Azure Arc에서 사용하도록 설정된 서버 에이전트를 구성합니다.

대시보드 사용

영향: 운영 우수성

애플리케이션 대시보드를 사용하면 애플리케이션의 성능, 상태 및 기타 메트릭을 시각화하고 모니터링할 수 있습니다.

  • 대시보드에서 보고서를 모니터링하면 근본 원인 분석 및 문제 해결을 신속하게 수행할 수 있습니다. 운영 팀은 이러한 대시보드를 사용하여 단일 창에서 Azure VMware Solution 구성하는 모든 주요 리소스를 볼 수 있습니다.
  • 대시보드 메트릭은 코드 및 인프라 변경이 애플리케이션 동작에 미치는 영향에 대한 인사이트를 제공합니다.
  • 시각적 개체는 고객 지원 팀이 애플리케이션에 대한 변경, 성능 및 가용성 문제의 영향을 이해하는 데 도움이 됩니다.
  • 성과 지표는 경영진 리더십 및 비즈니스 이해 관계자에게 도움이 됩니다. 이러한 도구는 애플리케이션의 성능을 비즈니스 목표에 맞게 조정하는 결정을 알려줍니다. 예를 들어 임원은 서비스 가용성, 인시던트 해결 시간 및 평균 응답 시간과 같은 메트릭을 검토하여 고객에 대한 약정을 모니터링할 수 있습니다. 이러한 메트릭은 organization SLA에 따라 서비스를 제공하는 데 도움이 됩니다.

대시보드는 인사이트를 제공하는 것 외에도 적절한 관련자에게 애플리케이션 대시보드에 대한 액세스 권한을 부여할 때 instance 투명성을 높이고 협업을 장려할 수 있습니다. 이 작업은 애플리케이션의 성능에 대한 공유 이해도를 키워줍니다. 또한 이 사례를 통해 organization 정보에 입각한 결정을 내릴 수 있습니다. 따라서 이해 관계자는 비즈니스를 발전시키는 중요한 이니셔티브를 추구하는 데 집중할 수 있습니다.

권장 사항
  • Application Insights 또는 Grafana를 사용하여 애플리케이션 dashboard 빌드합니다. dashboard Azure VMware Solution 환경에서 메트릭을 저장하는 관련 데이터 원본에 연결합니다.
  • 일반적으로 실행되는 쿼리, 메트릭 및 대화형 보고서를 위한 중앙 리포지토리로 Azure 통합 문서를 만듭니다.
  • 데이터 원본이 보안 및 규정 준수 요구 사항에 부합하는지 확인합니다.
  • 사용자 인증 및 역할 기반 액세스 제어와 같은 액세스 제어 및 권한을 정의합니다. 각 관련자의 역할에 따라 적절한 액세스 권한이 있는지 확인합니다.
  • 사용자 액세스가 최신 상태이고 현재 역할 및 책임과 일치하는지 검사 주기적인 액세스 검토를 수행합니다.

다음 단계

이제 Azure VMware Solution 가시성 모범 사례를 살펴보았으므로 SDDC에서 워크로드를 더욱 보호하는 데 사용할 수 있는 메커니즘, 도구 및 경계를 살펴보세요.

평가 도구를 사용하여 디자인 선택을 평가합니다.