Azure Monitor SCOM Managed Instance 문제 해결

이 문서에서는 Azure Monitor SCOM Managed Instance 배포하거나 사용할 때 발생할 수 있는 오류와 resolve 방법에 대해 설명합니다.

시나리오: SCOM Managed Instance 만들기/배포

일반적인 문제 해결

  1. 모든 필수 구성 요소가 충족되는지 확인합니다. 잘못되거나 불완전한 필수 구성 요소로 인해 생성 문제가 발생할 수 있습니다.
  2. 오류 메시지를 주의 깊게 읽고 검사. 오류 메시지는 생성 시 문제/오류를 캡처합니다.
  3. 오류 메시지에 제공된 SCOM 설치 로그 링크를 확인합니다. 링크를 선택하여 System Center Operations Manager 설치 로그를 다운로드합니다. 로그를 분석하여 오류/오류를 식별하고 resolve.
  4. 위의 단계에서 문제를 식별할 수 없는 경우 Virtual Machine Scale Sets instance 로그인하고 C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\1.0.66에서 로그를 검사 문제를 식별하는 데 도움이 됩니다.
  5. 문제가 지속되면 모든 관련 세부 정보가 포함된 지원 티켓을 제기합니다.[correlation-id, subscription-id등]

문제: 리소스 그룹은 %ResourceGroupName% 다른 Azure 리소스에서 관리됩니다.

원인: 리소스 그룹에 대해 ManagedBy 속성을 설정할 때 발생합니다.

해결 방법: ManagedBy 속성이 비어 있는 다른 리소스 그룹을 제공합니다.

문제: 선택한 서브넷 %SubnetName% 이 다른 서비스 전용입니다.

원인: 서브넷에 위임이 있을 때 발생합니다.

해결 방법: 다른 서비스에 위임되지 않은 서브넷을 제공합니다.

문제: SCOM Managed Instance SQL Managed Instance 연결할 수 없는 경우 오류 발생 %instance%

원인: 이 오류는 다음과 같은 이유로 인해 발생할 수 있습니다.

  • SCOM Managed Instance VNet에서 SQL Managed Instance 엔드포인트로의 가시선 표시 유형이 누락되었습니다.
  • SQL Managed Instance 퍼블릭 엔드포인트를 통해 트래픽을 허용하는 올바른 수준의 NSG 규칙이 누락되었습니다.
  • MSI는 Active Directory 관리자로 추가되지 않습니다.
  • SCOM Managed Instance SQL Managed Instance 대한 읽기 권한이 없을 수 있습니다.
  • VNet/지역에 문제가 있을 수 있습니다.

해결 방법:

  • SQL Managed Instance 읽기 권한을 제공합니다.
  • MSI는 SQL Managed Instance Active Directory 관리자로 추가되어야 합니다.
  • SCOM Managed Instance 네트워크와 SQL Managed Instance 네트워크 간의 연결을 확인합니다. 자세한 내용은 SQL Managed Instance 만들기 및 구성을 참조하세요.

문제: 지정된 지역에서 만들 %instance% 코어가 충분하지 않음

원인: 지정된 지역에 instance 만들기에 충분한 코어가 없을 때 발생합니다.

해결 방법: Azure Portal 할당량 섹션을 확인하고 필요한 경우 지역에 표준 Ds3v2 유형의 코어를 더 할당합니다.

문제: 동일한 이름의 비밀 키가 키 자격 증명 모음에 이미 있습니다.

원인: 동일한 이름의 다른 비밀 키가 Key Vault에 이미 있는 경우에 발생합니다.

해결 방법: instance 이름을 변경합니다.

문제: VM이 도메인에 가입하기 위해 확장 프로그램을 joindomain 처리할 때 실패를 보고했습니다. %DomainName%

원인: 다음과 같은 이유로 발생합니다.

  1. SCOM Managed Instance Server에서 도메인 컨트롤러로의 가시선 표시 유형입니다.
  2. 도메인 사용자 자격 증명이 제공되거나 올바르지 않습니다.
  3. AD 도메인에 대한 OU 경로가 제공되지 않습니다.

해결 방법: 원인을 확인하고 그에 따라 문제를 resolve.

문제: 이미 사용 중인 고정 IP

원인: 다른 instance 고정 IP를 사용하는 경우 발생합니다.

해결 방법: 다른 고정 IP를 사용합니다.

문제: 잘못된 ID 유형 %identityType%

원인: 잘못된 관리 ID로 인해 발생합니다.

해결 방법: 가능한 ID 유형((없음), (SystemAssigned, UserAssigned) 중 하나를 제공하고 다시 시도합니다.

문제: 개인 고정 IP 주소 %LbIpAddr% 가 서브넷 범위에 속하지 않음 %subnet%

원인: IP 주소가 서브넷 범위에 없으면 발생합니다.

해결 방법: 서브넷 범위에서 사용 가능한 IP를 제공하고 작업을 다시 시도합니다.

시나리오: Power BI에 보고서 배포

문제: SQL Managed Instance 연결할 수 없음

원인: 퍼블릭 엔드포인트를 사용하도록 설정하지 않은 경우 발생합니다. Power BI는 SQL Managed Instance 연결할 수 없습니다.

해결 방법: SQL Managed Instance 대한 사용자 권한을 확인하고 필요한 권한을 제공합니다.

문제: 데이터 세트 자격 증명을 새로 고칠 수 없음

원인: 사용자에게 SQL Managed Instance 대한 적절한 권한이 없는 경우 발생합니다.

해결 방법: SQL Managed Instance 대한 사용자 권한을 확인하고 필요한 권한을 제공합니다.

문제: 보고서를 새로 고칠 수 없음

원인: 큰 데이터 크기로 인해 발생합니다. 보고서가 새로 고쳐지지 않을 수 있습니다.

해결 방법: Power BI 작업 영역이 pro 계층에 있는 경우 프리미엄 계층으로 변경하거나 작업 영역의 용량을 변경합니다.

시나리오: 수동 스케일 업/다운

문제: 인터넷 연결 테스트에 실패했습니다. 필요한 엔드포인트는 VNet에서 연결할 수 없습니다.

원인: 네트워크 문제.

해결 방법: SCOM Managed Instance 아웃바운드 인터넷 액세스 권한이 있고 방화벽 요구 사항에 설명된 대로 필요한 엔드포인트에 대한 액세스를 허용하도록 NSG/방화벽이 올바르게 구성되어 있는지 확인합니다.

문제: 할당량 초과

원인: 크기 조정에 사용할 수 있는 코어가 없는 경우 발생합니다.

해결 방법: 구독의 코어 수를 늘입니다.

Azure Portal 할당량 섹션을 확인하고 필요한 경우 지역에 표준 Ds3v2 유형의 코어를 더 할당합니다.

문제: 확장 프로비저닝 오류

원인: 이 오류는 System Center Operations Manager 확장 또는 System Center Operations Manager 설치를 프로비전하는 동안 발생할 수 있습니다.

해결 방법: 일반적인 문제 해결을 확인하고, 문제를 식별하고, 그에 따라 resolve.

문제: 충돌

원인: 패치 또는 크기 조정이 진행 중인 경우에 발생합니다. 새 작업을 트리거할 수 없습니다.

해결 방법: 진행 중인 프로세스가 완료되기를 기다렸다가 다시 시도합니다.

시나리오: 패치

문제: 인터넷 연결 테스트에 실패했습니다. 필요한 엔드포인트는 VNet에서 연결할 수 없습니다.

원인: 네트워크 문제.

해결 방법: SCOM Managed Instance 아웃바운드 인터넷 액세스 권한이 있고 방화벽 요구 사항에 설명된 대로 필요한 엔드포인트에 대한 액세스를 허용하도록 NSG/방화벽이 올바르게 구성되어 있는지 확인합니다.

문제: 업데이트 작업이 완료된 경우에도 업데이트를 페치할 때 알림이 멈춤

원인: 네트워크 문제/개발 문제.

해결 방법: 업데이트를 새로 고쳐 보세요. 해결되지 않으면 Microsoft 지원에 문의하세요.

문제: 업데이트 상태가 카드 올바르게 반영되지 않음

원인: 네트워크 문제/개발 문제.

해결 방법: 업데이트를 새로 고쳐 보세요. 해결되지 않으면 Microsoft 지원에 문의하세요.

문제: 카드 내 컨트롤의 불일치

원인: 일관성 문제. 예를 들어 SCOM을 읽는 카드 제목이 최신 상태인 경우에도 업데이트 단추가 활성화됩니다.

해결 방법: 새로 고침을 시도합니다. 해결되지 않으면 Microsoft 지원에 문의하세요.

문제: 업데이트에 대한 경고 메시지가 나타납니다.

원인: 다음과 같은 이유로 인해 발생합니다.

  1. 새 업데이트를 사용할 수 있으며 사용자가 업데이트 instance 트리거하지 않았습니다. 또는
  2. 마지막 업데이트가 실패했고 사용자가 다른 업데이트 instance 트리거하지 않았습니다.

해결 방법: 업데이트 instance 트리거합니다.

문제: 여러 횟수 재시도 후 업데이트 실패

해결 방법: resolve Microsoft 지원에 문의하세요.

문제: 업데이트가 실패하고 롤백이 Virtual Machine Scale Sets instance VM 수가 수정된 일관되지 않은 상태를 벗어나지 못함

해결 방법: System Center Operations Manager 콘솔로 이동하여 일관되지 않은 노드를 제거합니다.

문제: 업데이트가 실패하지만 데이터베이스 업데이트가 성공했습니다.

원인: 데이터베이스 업데이트가 성공한 후 업데이트 실패로 인해 발생합니다.

해결 방법: 잠시 후 다시 시도합니다.

문제: 업데이트가 성공하면 System Center Operations Manager 콘솔이 instance 제대로 작동하지 않습니다.

원인: System Center Operations Manager가 제대로 설치되지 않았거나 일부 프로세스가 중단될 수 있는 경우에 발생합니다.

해결 방법: instance 다시 시작합니다. 문제가 지속되면 Microsoft 지원에 문의하세요.

문제: 업데이트가 3시간 이상 걸리고 결국 실패함

원인: 업데이트가 3시간 이상 걸릴 때 발생합니다.

해결 방법: Microsoft 지원에 문의하세요.

문제: 업데이트 중 일시적인 문제

원인: 서비스 패브릭 또는 RP가 충돌하거나 다시 시작될 때 발생합니다.

해결 방법: 업데이트를 다시 시작합니다.

문제: 크기 조정 및 패치가 동시에 트리거된 다음 실패

원인: 크기 조정 및 패치 요청을 동시에 보내고 수락하는 경우에 발생합니다.

해결 방법: 크기 조정 작업을 트리거한 경우 작업을 업데이트하기 전에 작업이 완료될 때까지 기다립니다.

문제: 확장은 업데이트하는 데 더 많은 시간이 걸리고 실패합니다.

원인: 확장이 업데이트하는 데 더 많은 시간이 걸리고 결국 실패하기 때문에 SQL Managed Instance 및 SCOM Managed Instance 다른 지역에 있는 경우 발생합니다.

해결 방법: 동일한 지역에 SQL Managed Instance 및 SCOM Managed Instance.

문제: 패치 후 데이터베이스의 사용자 데이터가 변경되거나 제대로 유지되지 않음

원인: 업데이트가 제대로 수행되지 않은 경우 발생합니다.

해결 방법: 업데이트를 다시 시작합니다.

문제: 패치 요청 실패

원인: 포털 또는 ARM 문제로 인해 발생합니다.

해결 방법: 잠시 기다렸다가 다시 시도합니다. 포털/ARM 문제를 수정한 후에도 문제가 있는 경우 Microsoft 지원에 문의하세요.

문제: 패치 또는 크기 조정 작업이 이미 진행 중입니다. 잠시 후 다시 시도하세요.

원인: 패치 또는 크기 조정 작업이 이미 진행 중인 경우에 발생합니다.

해결 방법: 기존 작업이 완료되기를 기다렸다가 잠시 후에 시도합니다.

문제: 콘솔에 표시되는 부실 관리 서버

원인: 패치 또는 크기 조정 작업이 완료된 후 일관되지 않은 상태를 남긴 경우 발생합니다.

해결 방법: Microsoft Azure Virtual Machine Scale Sets SCOM Managed Instance에 대한 관리 서버를 프로비전하는 데 사용됩니다. 시스템에서 부실 관리 서버를 제거하려면 다음 단계를 수행합니다.

  1. Azure Virtual Machine Scale Sets 액세스하고 SCOM Managed Instance 대한 관리 서버 중 하나에 로그인합니다.

  2. 관리 모드에서 PowerShell을 시작하고 다음 디렉터리로 이동합니다.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    참고

    버전을 찾으려면 으로 C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows 이동하여 사용 가능한 모든 버전을 검토한 다음, 최신 버전을 선택합니다.

  3. 다음 스크립트를 실행합니다.

    .\RemoveStaleManagementServers.ps1 
    

    스크립트는 대화형이며 부실 서버의 FQDN을 묻는 메시지를 표시합니다.

  4. 제거하려는 부실 관리 서버의 정확한 FQDN을 제공합니다.

    예를 들어 FQDN: SCOMMI2000001.contoso.com.