다음을 통해 공유


Azure Monitor SCOM 관리되는 인스턴스 문제 해결

이 문서에서는 Azure Monitor SCOM 관리되는 인스턴스를 배포하거나 사용할 때 발생할 수 있는 오류와 이를 해결하는 방법을 설명합니다.

시나리오: SCOM 관리되는 인스턴스 만들기/배포

일반적인 문제 해결

  1. 모든 필수 조건이 충족되었는지 확인하세요. 잘못되거나 불완전한 필수 구성 요소로 인해 생성 문제가 발생할 수 있습니다.
  2. 오류 메시지를 주의 깊게 읽거나 확인해야 합니다. 오류 메시지는 생성 시 문제/오류를 캡처합니다.
  3. 오류 메시지에 제공된 SCOM 설정 로그 링크를 확인합니다. 링크를 선택하여 System Center Operations Manager 설치 로그를 다운로드합니다. 로그를 분석하여 오류/장애를 식별하고 해결합니다.
  4. 위의 단계에서 문제를 식별할 수 없는 경우 Virtual Machine Scale Sets 인스턴스에 로그인하여 C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows<version>에서 로그를 확인하면 문제를 식별하는 데 도움이 됩니다.
  5. 문제가 지속되면 모든 관련 세부 정보 [correlation-id, subscription-id, 등]가 포함된 지원 티켓을 올립니다.

문제: 리소스 그룹 %ResourceGroupName%은 다른 Azure 리소스에서 관리됩니다.

원인: 리소스 그룹에 대해 ManagedBy 속성을 설정할 때 발생합니다.

해결 방법: ManagedBy 속성이 비어 있는 다른 리소스 그룹을 제공합니다.

문제: 선택한 서브넷 %SubnetName%이 다른 서비스에 전용입니다.

원인: 서브넷에 위임이 있을 때 발생합니다.

해결 방법: 다른 서비스에 위임되지 않은 서브넷을 제공합니다.

문제: SCOM 관리되는 인스턴스가 SQL Managed Instance %instance%에 연결할 수 없는 경우 오류 발생

원인: 이 오류는 다음과 같은 경우에 발생할 수 있습니다.

  • SCOM 관리되는 인스턴스 VNet에서 SQL Managed Instance 엔드포인트로의 시선 가시성이 누락되었습니다.
  • SQL Managed Instance 퍼블릭 엔드포인트를 통해 트래픽을 허용하는 올바른 수준의 NSG 규칙이 누락되었습니다.
  • MSI는 Active Directory 관리자로 추가되지 않습니다.
  • SCOM 관리되는 인스턴스에 SQL Managed Instance에 대한 읽기 권한이 없을 수 있습니다.
  • VNet/지역에 문제가 있을 수 있습니다.

해결 방법:

  • SQL Managed Instance에 대한 읽기 권한을 제공합니다.
  • MSI는 SQL Managed Instance에서 Active Directory 관리자로 추가해야 합니다.
  • SCOM 관리되는 인스턴스와 SQL Managed Instance 네트워크 간의 연결을 확인합니다. 자세한 내용은 SQL Managed Instance 만들기 및 구성을 참조하세요.

문제: 지정된 지역에서 %instance%를 만들 코어가 부족합니다.

원인: 지정된 지역에 인스턴스를 만들기에 충분한 코어가 없을 때 발생합니다.

해결 방법: Azure Portal에서 할당량 섹션을 확인하고 필요한 경우 해당 지역에서 표준 Ds3v2 유형의 코어를 더 많이 할당합니다.

문제: 이름이 같은 비밀 키가 Key Vault에 이미 있습니다.

원인: 동일한 이름의 다른 비밀 키가 Key Vault에 이미 있는 경우 발생합니다.

해결 방법: 인스턴스의 이름을 변경합니다.

문제: %DomainName% 도메인에 가입하기 위해 joindomain 확장을 처리할 때 VM이 실패를 보고했습니다.

원인: 다음과 같은 이유로 인해 발생합니다.

  1. SCOM 관리되는 인스턴스 서버에서 도메인 컨트롤러로의 시선 가시성을 표시합니다.
  2. 도메인 사용자 자격 증명이 제공되지 않거나 올바르지 않습니다.
  3. AD 도메인에 대한 OU 경로가 제공되지 않습니다.

해결 방법: 원인을 확인하고 그에 따라 문제를 해결합니다.

문제: 이미 사용 중인 고정 IP

원인: 다른 인스턴스에서 고정 IP를 사용하는 경우 발생합니다.

해결 방법: 다른 고정 IP를 사용합니다.

문제: 잘못된 ID 유형 %identityType%

원인: 잘못된 관리 ID로 인해 발생합니다.

해결 방법: 가능한 ID 유형((없음), (SystemAssigned, UserAssigned)) 중 하나를 제공하고 다시 시도합니다.

문제: 프라이빗 고정 IP 주소%LbIpAddr%이 서브넷 %subnet% 범위에 속하지 않습니다.

원인: IP 주소가 서브넷 범위에 없으면 발생합니다.

해결 방법: 서브넷 범위에서 사용 가능한 IP를 제공하고 작업을 다시 시도합니다.

문제: ID는 SQL Managed Instance: '%instance'의 시스템 관리자가 아닙니다.

원인: 다음과 같은 이유로 인해 발생합니다.

  1. 사용자 관리 ID는 SQL MI의 SQL Admin이 아닙니다.
  2. 사용자 관리 ID는 SQL MI에서 SQL Admin으로 확인되며 이는 ARM, BICEP, Terraform 또는 기타 배포 솔루션을 사용하여 배포됩니다.

해결 방법: 사용자 관리 ID가 ObjectId가 아닌 AppId를 사용하여 배포되었는지 확인합니다. SQL MI, Microsoft Entra ID 관리 창으로 이동하여 적용 가능한지 확인할 수 있습니다. 사용자 관리 ID와 함께 나열된 GUID가 서비스 주체의 ObjectId 또는 AppId인지 확인합니다. ObjectId인 경우:

  • 포털을 사용하여 설정
  • AppId를 사용하여 원하는 솔루션으로 다시 배포합니다.

시나리오: Power BI에 보고서 배포

문제: SQL Managed Instance에 연결할 수 없습니다.

원인: 퍼블릭 엔드포인트를 사용하도록 설정하지 않은 경우 발생합니다. Power BI는 SQL Managed Instance에 연결할 수 없습니다.

해결 방법: SQL Managed Instance에 대한 사용자 권한을 확인하고 필요한 권한을 제공합니다.

문제: 데이터 세트 자격 증명을 새로 고칠 수 없음

원인: 사용자에게 SQL Managed Instance에 대한 적절한 권한이 없는 경우에 발생합니다.

해결 방법: SQL Managed Instance에 대한 사용자 권한을 확인하고 필요한 권한을 제공합니다.

문제: 보고서를 새로 고칠 수 없음

원인: 데이터 크기가 커서 발생합니다. 보고서가 새로 고쳐지지 않을 수 있습니다.

해결 방법: Power BI 작업 영역이 프로 티어에 있는 경우 프리미엄 티어로 변경하거나 작업 영역의 용량을 변경합니다.

시나리오: 수동 스케일링 업/다운

문제: 인터넷 연결 테스트에 실패합니다. 필요한 엔드포인트는 VNet에서 연결할 수 없습니다.

원인: 네트워크 문제입니다.

해결 방법: SCOM 관리되는 인스턴스에 아웃바운드 인터넷 액세스가 있고 방화벽 요구 사항에 설명된 대로 필요한 엔드포인트에 대한 액세스를 허용하도록 NSG/방화벽이 올바르게 구성되었는지 확인합니다.

문제: 할당량 초과

원인: 스케일링에 사용할 수 있는 코어가 없는 경우 발생합니다.

해결 방법: 구독의 코어 수를 늘립니다.

Azure Portal에서 할당량 섹션을 확인하고 필요한 경우 지역에 표준 Ds3v2 유형의 코어를 더 할당합니다.

문제: 확장 프로비전 오류

원인: System Center Operations Manager 확장 또는 System Center Operations Manager 설치를 프로비전하는 동안 이 오류가 발생할 수 있습니다.

해결 방법: 일반적인 문제 해결을 확인하고 문제를 식별하고 그에 따라 해결합니다.

문제: 충돌

원인: 패치 또는 스케일링이 진행 중인 경우에 발생합니다. 새 작업을 트리거할 수 없습니다.

해결 방법: 진행 중인 프로세스가 완료되기를 기다렸다가 다시 시도하세요.

시나리오: 패치

문제: 인터넷 연결 테스트에 실패합니다. 필요한 엔드포인트는 VNet에서 연결할 수 없습니다.

원인: 네트워크 문제입니다.

해결 방법: SCOM 관리되는 인스턴스에 아웃바운드 인터넷 액세스가 있고 방화벽 요구 사항에 설명된 대로 필요한 엔드포인트에 대한 액세스를 허용하도록 NSG/방화벽이 올바르게 구성되었는지 확인합니다.

문제: 업데이트 작업이 완료된 경우에도 업데이트를 페치할 때 알림이 중단됨

원인: 네트워크 문제/개발 문제입니다.

해결 방법: 업데이트를 새로 고쳐 보세요. 해결되지 않으면 Microsoft 지원에 문의하세요.

문제: 업데이트 상태가 카드에 올바르게 반영되지 않습니다.

원인: 네트워크 문제/개발 문제입니다.

해결 방법: 업데이트를 새로 고쳐 보세요. 해결되지 않으면 Microsoft 지원에 문의하세요.

문제: 카드 내 컨트롤의 불일치

원인: 일관성 문제입니다. 예를 들어 카드 제목에 SCOM이 최신이라고 표시되는 경우에도 업데이트 단추가 활성화됩니다.

해결 방법: 새로 고침을 시도합니다. 해결되지 않으면 Microsoft 지원에 문의하세요.

문제: 업데이트에 대한 경고 메시지가 표시됩니다.

원인: 다음과 같은 이유로 인해 발생합니다.

  1. 새 업데이트를 사용할 수 있으며 사용자가 업데이트 인스턴스를 트리거하지 않았습니다. 또는
  2. 마지막 업데이트가 실패했고 사용자가 다른 업데이트 인스턴스를 트리거하지 않았습니다.

해결 방법: 업데이트 인스턴스를 트리거합니다.

문제: 여러 번 다시 시도 후 업데이트에 실패합니다.

해결 방법: 해결하려면 Microsoft 지원에 문의하세요.

문제: 업데이트가 실패하고 롤백이 실패하여 Virtual Machine Scale Sets 인스턴스의 VM 수가 수정된 일관성 없는 상태를 유지합니다.

해결 방법: System Center Operations Manager 콘솔로 이동하여 일관성 없는 노드를 제거합니다.

문제: 업데이트는 실패하지만 데이터베이스 업데이트는 성공합니다.

원인: 데이터베이스 업데이트가 성공한 후 업데이트 실패로 인해 발생합니다.

해결 방법: 잠시 후 다시 시도하세요.

문제: 업데이트가 성공하면 System Center Operations Manager 콘솔이 인스턴스에서 제대로 작동하지 않습니다.

원인: System Center Operations Manager가 제대로 설치되지 않았거나 일부 프로세스가 중단될 수 있는 경우에 발생합니다.

해결 방법: 인스턴스를 다시 시작합니다. 문제가 지속되면 Microsoft 지원팀에 문의하십시오.

문제: 업데이트에 3시간 이상 걸리고 결국 실패합니다.

원인: 업데이트가 3시간 이상 걸릴 때 발생합니다.

해결 방법: Microsoft 지원에 문의하세요.

문제: 업데이트 중 일부 간헐적 문제

원인: 서비스 패브릭 또는 RP가 충돌하거나 다시 시작할 때 발생합니다.

해결 방법: 업데이트를 다시 시작합니다.

문제: 스케일링 및 패치가 동시에 트리거된 다음, 실패합니다.

원인: 스케일링 및 패치 요청을 동시에 보내고 수락하는 경우에 발생합니다.

해결 방법: 스케일링 작업을 트리거한 경우 작업이 완료될 때까지 기다렸다가 업데이트 작업을 시도합니다.

문제: 확장은 업데이트하는 데 시간이 더 많이 걸리고 실패합니다.

원인: SQL Managed Instance 및 SCOM 관리되는 인스턴스가 다른 지역에 있는 경우 확장이 업데이트하는 데 시간이 더 많이 걸리고 결국 실패하는 경우에 발생합니다.

해결 방법: SQL Managed Instance 및 SCOM 관리되는 인스턴스가 동일한 지역에 있습니다.

문제: 패치 후 데이터베이스의 사용자 데이터가 변경되거나 제대로 유지되지 않습니다.

원인: 업데이트가 제대로 수행되지 않은 경우 발생합니다.

해결 방법: 업데이트를 다시 시작합니다.

문제: 패치 요청 실패

원인: 포털 또는 ARM 문제로 인해 발생합니다.

해결 방법: 잠시 기다렸다가 다시 시도하세요. 포털/ARM 문제를 수정한 후에도 문제가 있는 경우 Microsoft 지원에 문의하세요.

문제: 패치 또는 스케일링 작업이 이미 진행 중입니다. 잠시 후 다시 시도하세요.

원인: 패치 또는 스케일링 작업이 이미 진행 중인 경우에 발생합니다.

해결 방법: 기존 작업이 완료되기를 기다렸다가 잠시 후에 시도해 보세요.

문제: 콘솔에 표시되는 부실 관리 서버

원인: 패치 또는 스케일링 작업이 완료된 후 일관성 없는 상태를 남긴 경우 발생합니다.

해결 방법: Microsoft Azure Virtual Machine Scale Sets는 SCOM 관리되는 인스턴스에 대한 관리 서버를 프로비전하는 데 사용됩니다. 시스템에서 부실 관리 서버를 제거하려면 다음 단계를 수행합니다.

  1. Azure Virtual Machine Scale Sets에 액세스하고 SCOM 관리되는 인스턴스에 대한 관리 서버 중 하나에 로그인합니다.

  2. 관리 모드에서 PowerShell을 시작하고 다음 디렉터리로 이동합니다.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    참고 항목

    버전을 찾으려면 C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows로 이동하여 사용 가능한 모든 버전을 검토한 다음, 최신 버전을 선택합니다.

  3. 다음 스크립트를 실행합니다.

    .\RemoveStaleManagementServers.ps1 
    

    스크립트는 대화형이며 부실 서버의 FQDN을 입력하라는 메시지를 표시합니다.

  4. 제거하려는 부실 관리 서버의 정확한 FQDN을 제공합니다.

    예를 들어 FQDN: SCOMMI2000001.contoso.com입니다.