다음을 통해 공유


Azure Arc 리소스 브리지 문제 해결

이 문서에서는 Azure Arc 리소스 브리지를 배포, 사용 또는 제거하려고 할 때 발생할 수 있는 문제를 해결하는 방법을 설명합니다. 리소스 브리지는 관리 Kubernetes 클러스터를 호스트하는 패키지 가상 머신입니다. 일반적인 정보는 Azure Arc 리소스 브리지 개요를 참조하세요.

일반적인 문제

로그 컬렉션

Azure Arc 리소스 브리지에서 문제가 발생한 경우 Azure CLI az arcappliance logs 명령을 사용하여 추가 조사를 위한 로그를 수집할 수 있습니다. 이 명령은 Arc 리소스 브리지를 배포하는 데 사용되는 관리 컴퓨터에서 실행해야 합니다. 다른 컴퓨터를 사용하는 경우 해당 컴퓨터는 관리 컴퓨터 요구 사항을 충족해야 합니다.

로그 수집에 문제가 있는 경우 관리 머신에서 어플라이언스 VM에 도달하지 못할 가능성이 높습니다. 관리 머신에서 TCP 포트 22의 어플라이언스 VM으로의 SSH 통신을 허용하려면 네트워크 관리자에 문의합니다.

로그 명령에서 어플라이언스 VM IP 또는 kubeconfig를 전달하여 Arc 리소스 브리지 로그를 수집할 수 있습니다.

어플라이언스 VM IP 주소를 사용하여 VMware에서 Arc 리소스 브리지 로그를 수집하려면 다음을 수행합니다.

az arcappliance logs vmware --ip <appliance VM IP> --username <vSphere username> --password <vSphere password> --address <vCenter address> --out-dir <path to output directory>

어플라이언스 VM IP 주소를 사용하여 Azure Stack HCI에서 Arc 리소스 브리지 로그를 수집하려면 다음을 수행합니다.

az arcappliance logs hci --ip <appliance VM IP> --cloudagent <cloud agent service IP/FQDN> --loginconfigfile <file path of kvatoken.tok> 

어플라이언스 VM IP가 확실하지 않은 경우 kubeconfig를 사용하는 옵션도 있습니다. get-credentials 명령을 실행하여 kubeconfig를 검색한 다음, 로그 명령을 실행할 수 있습니다.

kubeconfig 및 로그 키를 검색한 다음, Arc 지원 VMware용 Arc 리소스 브리지를 배포하는 데 사용되는 머신과는 다른 머신에서 Arc 지원 VMware에 대한 로그를 수집하려면 다음을 수행합니다.

az account set -s <subscription id>
az arcappliance get-credentials -n <Arc resource bridge name> -g <resource group name> 
az arcappliance logs vmware --kubeconfig kubeconfig --out-dir <path to specified output directory>

다운로드/업로드 연결에 실패함

네트워크 속도가 느린 경우 Arc 리소스 브리지 VM 이미지를 성공적으로 다운로드하지 못하고 다음 오류가 발생할 수 있습니다. ErrorCode: ValidateKvaError, Error: Pre-deployment validation of your download/upload connectivity was not successful. Timeout error occurred during download and preparation of appliance image to the on-premises fabric storage. Common causes of this timeout error are slow network download/upload speeds, a proxy limiting the network speed or slow storage performance.

업로드에 영향을 미치는 느린 네트워크 속도로 인해 오류가 발생하는 경우 온-프레미스 프라이빗 클라우드에서 직접 VM을 만든 다음 해당 VM에서 Arc 리소스 브리지 배포 스크립트를 실행하여 해결할 수 있습니다. 이 해결 방법을 사용하면 데이터 저장소에 이미지를 더 빠르게 업로드할 수 있습니다.

ApplyingKvaImageOperator 단계에서 컨텍스트 시간이 초과됨

Arc 리소스 브리지를 배포하는 동안 다음 오류가 나타날 수 있습니다. Deployment of the Arc resource bridge appliance VM timed out. Please collect logs with _az arcappliance logs_ and create a support ticket for help. To troubleshoot the error, refer to aka.ms/arc-rb-error { _errorCode_: _ContextError_, _errorResponse_: _{\n\_message\_: \_Context timed out during phase _ApplyingKvaImageOperator_\_\n}_ }

이 오류는 일반적으로 연결이 느리거나 일시적으로 발생하는 네트워크를 통해 KVAIO 이미지(압축 400MB)를 다운로드하려고 할 때 발생합니다. KVAIO 컨트롤러 관리자가 이미지 다운로드가 완료되고 시간 초과될 때까지 기다리고 있습니다. Arc 리소스 브리지 VM과 Microsoft Container Registry(mcr.microsoft.com) 간의 네트워크 속도가 안정적이고 최소 2Mbps인지 확인할 수 있습니다. 네트워크 연결 및 속도가 안정적인데도 이 오류가 계속 발생하는 경우 Microsoft Container Registry가 많은 양의 트래픽을 수신할 수 있으므로 다시 시도하기 전에 최소 30분 정도 기다립니다.

WaitingForAPIServer 단계에서 컨텍스트 시간이 초과됨

Arc 리소스 브리지를 배포할 때 다음 오류가 나타날 수 있습니다. Deployment of the Arc resource bridge appliance VM timed out. Please collect logs with _az arcappliance logs_ and create a support ticket for help. To troubleshoot the error, refer to aka.ms/arc-rb-error { _errorCode_: _ContextError_, _errorResponse_: _{\n\_message\_: \_Context timed out during phase _WaitingForAPIServer

이 오류는 배포 컴퓨터가 시간 제한 내에 Arc 리소스 브리지용 컨트롤 플레인 IP에 연결할 수 없음을 나타냅니다. 이 오류의 일반적인 원인은 배포 컴퓨터와 프록시를 통해 라우팅되는 컨트롤 플레인 IP 간의 통신과 같은 네트워킹과 관련된 경우가 많습니다. 배포 컴퓨터에서 컨트롤 플레인 및 어플라이언스 VM IP로의 트래픽은 프록시를 통과해서는 안 됩니다. 트래픽이 프록시되는 경우 배포 컴퓨터와 컨트롤 플레인 IP 및 어플라이언스 VM IP 사이의 트래픽을 프록시하지 않도록 네트워크 또는 배포 컴퓨터의 프록시 설정을 구성합니다. 이 오류는 방화벽이 배포 컴퓨터와 컨트롤 플레인 IP 또는 배포 컴퓨터와 어플라이언스 VM IP 사이의 포트 6443 및 포트 22에 대한 액세스를 닫고 있는 경우에도 발생합니다.

UploadError 403 사용할 수 없음 또는 404 사이트를 찾을 수 없음

Arc 리소스 브리지를 배포할 때 다음 오류가 나타날 수 있습니다. { _errorCode_: _UploadError_, _errorResponse_: _{\n\_message\_: \_Pre-deployment validation of your download/upload connectivity was not successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_403 Forbidden 또는 { _errorCode_: _UploadError_, _errorResponse_: _{\n\_message\_: \_Pre-deployment validation of your download/upload connectivity was not successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_404 Site Not Found

이 오류는 이미지를 Microsoft 레지스트리에서 배포 컴퓨터로 다운로드해야 하고 다운로드가 프록시 또는 방화벽에 의해 차단되는 경우 배포 프로세스에서 발생합니다. 네트워크 요구 사항을 검토하고 모든 필수 URL에 연결할 수 있는지 확인합니다. 배포 컴퓨터에서 Microsoft 필수 URL로의 트래픽이 프록시를 통과하지 않도록 프록시 없음 설정을 업데이트해야 할 수도 있습니다.

SSH 폴더 액세스가 거부됨

CLI에는 폴더 내의 파일에 액세스하는 작업이나 배포 중에 SSH 폴더에 액세스할 수 있는 권한이 필요합니다. 이 폴더에는 어플라이언스 VM에 대한 kubeconfig 및 로그 키와 같은 필수 파일이 포함되어 있습니다. 예를 들어, CLI는 어플라이언스 VM에서 로그를 수집하려면 SSH 폴더에 저장된 로그 키에 액세스해야 합니다.

Access to the file in the SSH folder was denied. This may occur if the CLI doesn't have permission to the SSH folder or if another CLI instance is using the file이라는 오류가 발생하는 경우 이 문제의 일반적인 원인은 두 가지입니다.

  1. 권한 부족: CLI에 SSH 폴더에 액세스하는 데 필요한 권한이 부족합니다. CLI를 실행하는 사용자 계정에 SSH 폴더에 액세스할 수 있는 적절한 권한이 있는지 확인합니다.

  2. 동시 파일 액세스: CLI의 다른 인스턴스가 SSH 폴더의 파일을 사용 중일 수 있습니다. 이는 공유 프로필이 있는 워크스테이션에서 자주 발생합니다. 계속하기 전에 다른 CLI 인스턴스가 해당 작업을 완료하거나 종료하는지 확인합니다.

Arc 리소스 브리지가 오프라인 상태입니다.

리소스 브리지가 오프라인 상태인 경우 이는 일반적으로 어플라이언스 VM이 상대 Azure 리소스와 통신할 수 없게 하는 인프라, 환경 또는 클러스터의 네트워킹 변경 때문입니다. 변경된 내용을 확인할 수 없는 경우 어플라이언스 VM을 다시 부팅하고, 로그를 수집하고, 추가 조사를 위해 지원 티켓을 제출할 수 있습니다.

원격 PowerShell은 지원되지 않음

원격 PowerShell을 통해 Arc 리소스 브리지에 대해 az arcappliance CLI 명령을 실행하면 다양한 문제가 발생할 수 있습니다. 예를 들어 Azure Stack HCI 클러스터에 리소스 브리지를 설치하려고 할 때 인증 핸드셰이크 실패 오류 또는 다른 유형의 오류가 발생할 수 있습니다. 원격 PowerShell에서 az arcappliance 명령을 사용하는 것은 현재 지원되지 않습니다. 대신 RDP(원격 데스크톱 프로토콜)를 통해 노드에 로그인하거나 콘솔 세션을 사용하세요.

리소스 브리지 구성을 업데이트할 수 없습니다.

이 릴리스에서 모든 매개 변수는 만들어질 때 지정됩니다. Azure Arc 리소스 브리지를 업데이트하려면 삭제하고 다시 배포해야 합니다. 예를 들어 배포 중에 잘못된 위치 또는 구독을 지정한 경우 나중에 리소스 만들기가 실패합니다. 리소스 브리지 VM을 다시 배포하지 않고 리소스를 다시 만들려고 하면 상태가 WaitForHeartBeat에서 변하지 않습니다. 이 문제를 해결하려면 어플라이언스를 삭제하고 어플라이언스 YAML 파일을 업데이트합니다. 그 후 리소스 브리지를 다시 배포하고 만듭니다.

어플라이언스 네트워크를 사용할 수 없음

Arc 리소스 브리지에 네트워크 문제가 발생하면 "어플라이언스 네트워크를 사용할 수 없음" 오류가 표시될 수 있습니다. 일반적으로 어플라이언스 VM에 대한 네트워크 또는 인프라 연결 문제로 인해 이 오류가 발생할 수 있습니다. 이 오류는 "tcp xx.xx.xxx.xx:55000 다이얼링 중 오류 발생: 연결: 호스트에 대한 경로 없음"으로 표시될 수 있습니다. 문제는 네트워크 관리자의 도움을 받아 호스트에서 Arc 리소스 브리지 VM으로의 통신을 TCP 포트 22를 통해 열어야 하는 것일 수 있습니다. 일시적인 네트워크 문제로 인해 호스트가 Arc 리소스 브리지 VM에 연결하지 못할 수 있습니다. 네트워크 문제가 해결되면 작업을 다시 시도할 수 있습니다. Arc 리소스 브리지용 어플라이언스 VM이 중지되거나 오프라인이 아닌지 확인해야 할 수도 있습니다. Azure Stack HCI의 경우 호스트 스토리지가 가득 차 있을 수 있으며 스토리지를 해결해야 합니다.

토큰 새로 고침 오류

Azure CLI 명령을 실행하면 다음 오류가 반환될 수 있습니다. 조건부 액세스의 로그인 빈도 확인으로 인해 새로 고침 토큰이 만료되었거나 잘못되었습니다. 이 오류는 Azure에 로그인할 때 토큰의 최대 수명이 있기 때문에 발생합니다. 이 수명을 초과하면 az login 명령을 사용하여 Azure에 다시 로그인해야 합니다.

배포에 기본 호스트 리소스 풀을 사용할 수 없음

az arcappliance createconfig 또는 az arcappliance run 명령을 사용할 때 가상 어플라이언스를 배포하기 위해 선택할 수 있는 VMware 엔터티 목록을 표시하는 상호 작용 환경이 있습니다. 이 목록에는 사용자가 만든 모든 리소스 풀이 표시됩니다. 기본 클러스터 리소스 풀과 함께 표시되지만 기본 호스트 리소스 풀은 나열되지 않습니다. 어플라이언스가 호스트 리소스 풀에 배포되는 경우 호스트 하드웨어 오류가 발생할 때 고가용성이 보장되지 않습니다. 호스트 리소스 풀에 어플라이언스를 배포하지 않는 것이 좋습니다.

"Offline" 리소스 브리지 상태 및 "Failed" provisioningState

az arcappliance deploy 또는 az arcappliance create를 실행할 때 오류가 발생하지 않았으므로 Arc 리소스 브리지를 배포할 때 브리지가 성공적으로 배포된 것처럼 보일 수도 있습니다. 그러나 Azure Portal에서 브리지를 볼 때 상태가 Offline으로 표시되고 az arcappliance show에서 provisioningStateFailed로 표시될 수도 있습니다. 이는 브리지가 배포되기 전에 필요한 공급자가 등록되지 않은 경우에 발생합니다.

이 문제를 해결하려면 리소스 브리지를 삭제하고, 공급자를 등록한 다음, 리소스 브리지를 다시 배포합니다.

  1. 리소스 브리지를 삭제합니다.

    az arcappliance delete <fabric> --config-file <path to appliance.yaml>
    
  2. 공급자를 등록합니다.

    az provider register --namespace Microsoft.ExtendedLocation –-wait
    az provider register --namespace Microsoft.ResourceConnector –-wait
    
  3. 리소스 브리지를 다시 배포합니다.

참고 항목

파트너 제품(예: Arc 지원 VMware vSphere)에는 등록하는 데 필요한 자체 공급자가 있을 수도 있습니다. 등록해야 하는 추가 공급자를 확인하려면 제품 설명서를 참조하세요.

어플라이언스 VM에서 만료된 자격 증명

Arc 리소스 브리지는 온-프레미스 인프라에 배포되는 어플라이언스 VM으로 구성됩니다. 어플라이언스 VM은 로컬로 저장된 자격 증명을 사용하여 온-프레미스 인프라의 관리 엔드포인트에 대한 연결을 유지 관리합니다. 이러한 자격 증명이 업데이트되지 않으면 리소스 브리지에서 더 이상 관리 엔드포인트와 통신할 수 없습니다. 이로 인해 리소스 브리지를 업그레이드하거나 Azure를 통해 VM을 관리하려고 할 때 문제가 발생할 수 있습니다. 이 문제를 해결하려면 어플라이언스 VM의 자격 증명을 업데이트해야 합니다. 자세한 내용은 어플라이언스 VM의 자격 증명 업데이트를 참조하세요.

Arc 리소스 브리지는 프라이빗 링크를 지원하지 않습니다. 어플라이언스 VM에서 들어오는 모든 호출은 프라이빗 링크 설정을 거치면 안됩니다. Private Link IP는 리소스 브리지에서 구성할 수 없는 어플라이언스 IP 풀 범위와 충돌할 수 있습니다. Arc 리소스 브리지는 프라이빗 링크 연결을 통과해서는 안 되는 필수 URL에 도달합니다. 프라이빗 링크 설정과 관련이 없는 별도의 네트워크 세그먼트에 Arc 리소스 브리지를 배포해야 합니다.

네트워킹 문제

이미지 끌어오기 백오프 오류

Arc 리소스 브리지를 배포하려고 할 때 back-off pulling image \\\"url"\\\: FailFastPodCondition이 포함된 오류가 표시될 수 있습니다. 이 오류는 어플라이언스 VM에서 오류에 지정된 URL에 연결할 수 없는 경우에 발생합니다. 이 문제를 해결하려면 어플라이언스 VM이 필수 허용 목록 URL에 대한 인터넷 액세스 연결을 포함하여 시스템 요구 사항을 충족하는지 확인합니다.

URL에 연결할 수 없음

Not able to connect to https://example.url.com이 포함된 오류를 수신하는 경우 네트워크 관리자에게 문의하여 Arc 리소스 브리지를 배포하는 데 필요한 모든 방화벽 및 프록시 URL을 네트워크에서 허용하는지 확인합니다. 자세한 내용은 Azure Arc 리소스 브리지 네트워크 요구 사항을 참조하세요.

Http2 서버가 GOAWAY를 전송했습니다.

Arc 리소스 브리지를 배포하려고 하면 다음과 유사한 오류 메시지가 표시될 수 있습니다.

"errorResponse": "{\n\"message\": \"Post \\\"https://region.dp.kubernetesconfiguration.azure.com/azure-arc-appliance-k8sagents/GetLatestHelmPackagePath?api-version=2019-11-01-preview\\u0026releaseTrain=stable\\\": http2: server sent GOAWAY and closed the connection; LastStreamID=1, ErrCode=NO_ERROR, debug=\\\"\\\"\"\n}"

이는 방화벽 또는 프록시가 SSL/TLS 검사를 사용하도록 설정하고 리소스 브리지를 배포하는 데 사용되는 머신에서 http2 호출을 차단하는 경우에 발생합니다. 이것이 문제인지 확인하려면 다음 PowerShell cmdlet을 실행하여 http2(PowerShell 버전 7 이상 필요)로 웹 요청을 호출하고 URL 및 api-version(예: 2019-11-01)의 지역을 오류의 값으로 바꿉니다.

Invoke-WebRequest -HttpVersion 2.0 -UseBasicParsing -Uri https://region.dp.kubernetesconfiguration.azure.com/azure-arc-appliance-k8sagents/GetLatestHelmPackagePath?api-version=2019-11-01-preview"&"releaseTrain=stable -Method Post -Verbose

결과가 The response ended prematurely while waiting for the next frame from the server인 경우 http2 호출이 차단되고 있으므로 허용되어야 합니다. 네트워크 관리자와 협력하여 SSL/TLS 검사를 사용하지 않도록 설정하여 브리지를 배포하는 데 사용되는 머신에서 http2 호출을 허용합니다.

이러한 호스트 없음 - .local 지원되지 않음

Arc 리소스 브리지에 대한 구성을 설정하려고 하면 다음과 유사한 오류 메시지가 표시될 수 있습니다.

"message": "Post \"https://esx.lab.local/52c-acac707ce02c/disk-0.vmdk\": dial tcp: lookup esx.lab.local: no such host"

이는 프록시, DNS, 데이터 저장소 또는 관리 엔드포인트(예: vCenter)와 같은 구성 설정에 대해 .local 경로가 제공될 때 발생합니다. Arc 리소스 브리지 어플라이언스 VM은 기본적으로 .local을 지원하지 않는 Azure Linux OS를 사용합니다. 해결 방법은 해당하는 경우 IP 주소를 제공하는 것입니다.

Azure Arc 리소스 브리지에 연결할 수 없음

Azure Arc 리소스 브리지는 Kubernetes 클러스터를 실행하며, 해당 컨트롤 플레인에는 고정 IP 주소가 필요합니다. IP 주소는 infra.yaml 파일에서 지정합니다. IP 주소가 DHCP 서버에서 할당된 경우 예약되지 않으면 주소가 변경될 수 있습니다. Azure Arc 리소스 브리지 또는 VM을 다시 부팅하면 IP 주소 변경이 트리거되어 서비스가 실패할 수 있습니다.

Arc 리소스 브리지에서 예약된 IP 구성이 일시적으로 손실될 수 있습니다. 이러한 손실은 systemd-networkd 다시 시작 시 VIP 손실에 설명된 동작으로 인해 발생합니다. IP 주소가 Azure Arc 리소스 브리지 VM에 할당되지 않으면 리소스 브리지 API 서버에 대한 호출이 실패합니다. 새 리소스 만들기, Azure에서 프라이빗 클라우드에 연결, 사용자 지정 위치 만들기 등의 Core 작업이 예상대로 작동하지 않습니다. 이 문제를 해결하려면 리소스 브리지 VM을 다시 부팅해야 합니다. 그러면 IP 주소가 복구됩니다. 주소가 DHCP 서버에서 할당된 경우 리소스 브리지와 연결된 IP 주소를 예약합니다.

디스크 액세스가 느리기 때문에 Arc 리소스 브리지에 도달하지 못할 수도 있습니다. Azure Arc 리소스 브리지는 10ms 이하의 대기 시간이 필요한 Kubernetes ETCD(확장 구성 트리)를 사용합니다. 기본 디스크의 성능이 낮으면 작업이 영향을 받고 오류가 발생할 수 있습니다.

SSL 프록시 구성 문제

관리 컴퓨터의 프록시 서버에서 SSL 프록시에 대한 SSL 인증서와 Microsoft 다운로드 서버의 SSL 인증서를 모두 신뢰하는지 확인합니다. 자세한 내용은 SSL 프록시 구성을 참조하세요.

해당 호스트가 없음 - dp.kubernetesconfiguration.azure.com

Arc 리소스 브리지를 배포하는 동안 dial tcp: lookup westeurope.dp.kubernetesconfiguration.azure.com: no such host가 포함된 오류는 현재 지정된 지역에서 구성 데이터플레인을 사용할 수 없음을 의미합니다. 서비스가 일시적으로 중단될 수 있습니다. 서비스를 사용할 수 있을 때까지 기다린 후 배포를 다시 시도하세요.

프록시 연결 tcp - Arc 리소스 브리지 필수 URL에 대한 호스트가 없음

proxyconnect tcp: dial tcp: lookup http: no such host 메시지와 함께 Arc 리소스 브리지 필수 URL이 포함된 오류는 DNS가 URL을 확인할 수 없음을 나타냅니다. 이 오류는 필수 URL이 https://msk8s.api.cdp.microsoft.com인 아래 예와 유사할 수 있습니다.

Error: { _errorCode_: _InvalidEntityError_, _errorResponse_: _{\n\_message\_: \_Post \\\_https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/arc-appliance-stable-catalogs-ext/versions/latest?action=select\\\_: POST https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/arc-appliance-stable-catalogs-ext/versions/latest?action=select giving up after 6 attempt(s): Post \\\_https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/arc-appliance-stable-catalogs-ext/versions/latest?action=select\\\_: proxyconnect tcp: dial tcp: lookup http: no such host\_\n}_ }

이 오류는 배포 중에 제공된 DNS 설정이 올바르지 않거나 DNS 서버에 문제가 있는 경우 발생할 수 있습니다. 관리 컴퓨터이나 DNS 서버에 액세스할 수 있는 컴퓨터에서 다음 명령을 실행하여 DNS 서버가 URL을 확인할 수 있는지 확인할 수 있습니다.

nslookup
> set debug
> <hostname> <DNS server IP>

오류를 해결하려면 모든 Arc 리소스 브리지 필수 URL을 확인하도록 DNS 서버를 구성해야 하며 Arc 리소스 브리지 배포 중에 DNS 서버가 올바르게 제공되어야 합니다.

KVA 시간 초과 오류

KVA 시간 제한 오류는 관리 컴퓨터, 어플라이언스 VM 또는 컨트롤 플레인 IP가 서로 통신하지 않거나 인터넷 또는 필요한 URL과 통신하지 않는 것과 관련된 다양한 잘못된 네트워크 구성으로 인해 발생할 수 있는 일반적인 오류입니다. 이 통신 오류는 DNS 확인, 프록시 설정, 네트워크 구성 또는 인터넷 액세스와 관련된 문제로 인해 발생하는 경우가 많습니다.

명확히 설명하면 관리 컴퓨터는 배포 CLI 명령이 실행되는 컴퓨터입니다. 어플라이언스 VM은 Arc 리소스 브리지를 호스트하는 VM입니다. 컨트롤 플레인 IP는 어플라이언스 VM의 Kubernetes 관리 클러스터에 대한 컨트롤 플레인의 IP입니다.

KVA 시간 제한 오류의 주요 원인

  • 관리 컴퓨터에서 컨트롤 플레인 IP 및 어플라이언스 VM IP와 통신할 수 없습니다.
  • 어플라이언스 VM에서 관리 컴퓨터, vCenter 엔드포인트(VMware의 경우) 또는 MOC 클라우드 에이전트 엔드포인트(Azure Stack HCI의 경우)와 통신할 수 없습니다. 
  • 어플라이언스 VM이 인터넷에 액세스할 수 없습니다.
  • 어플라이언스 VM이 인터넷에 액세스할 수 있지만, 프록시 또는 방화벽으로 인해 하나 이상의 필수 URL에 대한 연결이 차단되고 있습니다.
  • 어플라이언스 VM이 vSphere용 vCenter 엔드포인트 또는 Azure Stack HCI용 클라우드 에이전트 엔드포인트와 같은 내부 이름을 확인할 수 있는 DNS 서버에 연결할 수 없습니다. 또한 DNS 서버는 Azure 서비스 주소 및 컨테이너 레지스트리 이름과 같은 외부 주소를 확인할 수 있어야 합니다. 
  • 관리 컴퓨터 또는 Arc 리소스 브리지 구성 파일의 프록시 서버 구성이 잘못되었습니다. 이는 관리 컴퓨터와 어플라이언스 VM 모두에 영향을 줄 수 있습니다. az arcappliance prepare 명령이 실행될 때 호스트 프록시가 올바르게 구성되지 않은 경우 관리 컴퓨터에서 OS 이미지를 연결하고 다운로드할 수 없습니다. 잘못되었거나 누락된 프록시 구성으로 인해 어플라이언스 VM에서 인터넷에 액세스할 수 없게 될 수 있으며, 이는 컨테이너 이미지를 끌어오는 VM의 기능에 영향을 줍니다. 

KVA 시간 제한 오류 문제 해결

이 오류를 해결하려면 하나 이상의 네트워크 구성 오류를 해결해야 할 수도 있습니다. 아래 단계에 따라 이 오류의 가장 일반적인 원인을 해결하세요.

  1. 배포에 문제가 있는 경우 첫 번째 단계는 어플라이언스 VM IP로 로그를 수집하는 것입니다. kubeconfig를 사용하지 않는 이유는 배포 명령이 완료되지 않은 경우 kubeconfig가 비어 있을 수 있기 때문입니다. 로그 수집 문제는 대부분 관리 컴퓨터에서 어플라이언스 VM에 연결할 수 없기 때문에 발생합니다.

    로그가 수집되면 폴더를 추출하고 kva.log를 엽니다. kva.log를 검토하여 KVA 시간 제한 오류의 원인을 파악하는 데 도움이 되는 오류 정보를 획득합니다.

  2. 관리 컴퓨터에서 어플라이언스 VM IP 및 컨트롤 플레인 IP와 통신할 수 있어야 합니다. 관리 컴퓨터에서 컨트롤 플레인 IP 및 어플라이언스 VM IP를 ping하고 두 IP 모두에서 응답하는지 확인합니다.

    요청 시간이 초과되면 관리 컴퓨터에서 IP와 통신할 수 없습니다. 포트가 닫혔거나, 네트워크 구성이 잘못되었거나, 방화벽에서 차단하는 것이 원인입니다. 네트워크 관리자와 협력하여 관리 컴퓨터와 컨트롤 플레인 IP 및 어플라이언스 VM IP 간의 통신을 허용합니다.

  3. 어플라이언스 VM IP 및 컨트롤 플레인 IP에서 관리 컴퓨터 및 vCenter 엔드포인트(VMware의 경우) 또는 MOC 클라우드 에이전트 엔드포인트(HCI의 경우)와 통신할 수 있어야 합니다. 네트워크 관리자와 협력하여 이를 허용하도록 네트워크를 구성합니다. 이렇게 하려면 어플라이언스 VM IP 및 컨트롤 플레인 IP에서 vCenter로 포트 443을 여는 방화벽 규칙을 추가하거나 Azure Stack HCI MOC 클라우드 에이전트의 경우 포트 65000 및 55000을 추가해야 할 수 있습니다. Azure Stack HCI 네트워크 요구 사항 및 Arc 리소스 브리지용 VMware를 검토하세요.

  4. 어플라이언스 VM IP 및 컨트롤 플레인 IP는 인터넷을 통해 이러한 필수 URL에 액세스할 수 있어야 합니다. Azure Stack HCI에는 추가 URL이 필요합니다. 네트워크 관리자와 협력하여 IP가 필요한 URL에 액세스할 수 있는지 확인하세요.

  5. 비 프록시 환경에서 관리 컴퓨터에는 외부 및 내부 DNS 확인이 있어야 합니다. 관리 컴퓨터에서 vSphere용 vCenter 엔드포인트 또는 Azure Stack HCI용 클라우드 에이전트 엔드포인트와 같은 내부 이름을 확인할 수 있는 DNS 서버에 연결할 수 있어야 합니다. 또한 DNS 서버가 Azure URL 및 OS 이미지 다운로드 URL과 같은 외부 주소를 확인할 수 있어야 합니다. 시스템 관리자와 협력하여 관리 컴퓨터에 내부 및 외부 DNS 확인이 있는지 확인합니다. 프록시 환경에서 프록시 서버의 DNS 확인은 내부 엔드포인트 및 필요한 외부 주소를 확인해야 합니다.

    비 프록시 시나리오에서 관리 컴퓨터의 내부 주소에 대한 DNS 확인을 테스트하려면 명령 프롬프트를 열고 nslookup <vCenter endpoint or HCI MOC cloud agent IP>를 실행합니다. 프록시가 아닌 시나리오에서 관리 컴퓨터에 내부 DNS 확인이 있는 경우 응답을 받아야 합니다. 

  6. 어플라이언스 VM이 vSphere용 vCenter 엔드포인트 또는 Azure Stack HCI용 클라우드 에이전트 엔드포인트와 같은 내부 이름을 확인할 수 있는 DNS 서버에 연결할 수 있어야 합니다. 또한 DNS 서버가 클라우드에서 Arc 리소스 브리지 컨테이너 이미지를 다운로드하려면 Azure 서비스 주소 및 컨테이너 레지스트리 이름과 같은 외부/내부 주소를 확인할 수 있어야 합니다.

    구성 파일을 만드는 데 사용되는 DNS 서버 IP에 내부 및 외부 주소 확인 기능이 있는지 확인합니다. 없으면 어플라이언스를 삭제하고 올바른 DNS 서버 설정을 사용하여 Arc 리소스 브리지 구성 파일을 다시 만든 다음, 새 구성 파일을 사용하여 Arc 리소스 브리지를 배포합니다.

Arc 리소스 브리지 위치 이동

Arc 리소스 브리지의 리소스 이동은 현재 지원되지 않습니다. Arc 리소스 브리지를 삭제한 다음, 원하는 위치에 다시 배포해야 합니다.

Azure Stack HCI의 Azure Arc-지원 VM 관련 문제

Azure Stack HCI의 Azure Arc-지원 VM과 관련된 문제에 대한 일반적인 도움말은 Azure Arc 지원 가상 머신의 문제 해결을 참조하세요.

인증 핸드셰이크 실패

az arcappliance 명령을 실행할 때 authentication handshake failed: x509: certificate signed by unknown authority 연결 오류가 표시 될 수 있습니다.

이 오류는 일반적으로 Azure Arc 리소스 브리지에서 지원되지 않는 원격 PowerShell에서 명령을 실행하려고 할 때 발생합니다.

Azure Stack HCI 클러스터에 Azure Arc 리소스 브리지를 설치하려면 클러스터의 노드에서 로컬로 az arcappliance 명령을 실행해야 합니다. RDP(원격 데스크톱 프로토콜)를 통해 노드에 로그인하거나 콘솔 세션을 사용하여 이 명령을 실행하세요.

Azure Arc 지원 VMware VCenter 관련 문제

errorResponse: vsphere sdk 클라이언트를 가져오는 동안 오류가 발생했습니다.

errorCode CreateConfigKvaCustomerError 및 errorResponse error getting the vsphere sdk client 오류의 경우 배포 컴퓨터가 vCenter 주소에 대한 TCP 연결을 설정하려고 시도했지만 문제가 발생한 경우 이러한 오류가 발생합니다. vCenter 주소가 올바르지 않거나(403 또는 404 오류) 이를 차단하는 네트워크/프록시/방화벽 구성이 있는 경우(연결 시도 실패), 이 errorCode 및 errorResponse를 받게 됩니다. 호스트 이름으로 vCenter 주소를 입력하고 no such host 오류가 수신되면 배포 컴퓨터가 클라이언트 DNS를 통해 vCenter 호스트 이름을 확인할 수 없습니다. 배포 컴퓨터가 vCenter 호스트 이름을 확인할 수 있지만 배포 컴퓨터가 DNS에서 받은 IP 주소에 연결할 수 없는 경우 오류가 발생할 수 있습니다. DNS에서 반환된 엔드포인트가 vCenter 주소가 아니거나 프록시가 트래픽을 가로채는 경우 오류가 발생할 수 있습니다. 마지막으로 배포 컴퓨터가 vCenter 주소와 통신할 수 있지만 사용자 이름이나 암호가 잘못된 경우 오류가 발생할 수 있습니다.

vSphere SDK 클라이언트 - 연결 시도가 실패함

배포 중에 errorCode_: _CreateConfigKvaCustomerError_, _errorResponse_: _error getting the vsphere sdk client: Post \_https://ip.address/sdk\_: dial tcp ip.address:443: connectex: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond._ }라는 오류가 표시되면 배포 컴퓨터가 vCenter Server와 통신할 수 없습니다. 배포 컴퓨터가 관리 컴퓨터 요구 사항을 충족하고 통신을 차단하는 방화벽이나 프록시가 없는지 확인합니다.

vSphere SDK 클라이언트 - 403 사용할 수 없음 또는 404를 찾을 수 없음

Arc 리소스 브리지를 배포하는 동안 errorCode_: _CreateConfigKvaCustomerError_, _errorResponse_: _error getting the vsphere sdk client: POST \_/sdk\_: 403 Forbidden 또는 404 not found가 포함된 오류가 수신되는 경우 이는 호스트 이름이나 IP 주소로 vCenter 주소를 입력하라는 메시지가 표시될 때 구성 파일 만드는 동안 잘못된 vCenter 주소가 제공되었기 때문일 가능성이 높습니다. vCenter 주소를 찾는 방법에는 여러 가지가 있습니다. 한 가지 옵션은 웹 인터페이스를 통해 vSphere 클라이언트에 액세스하는 것입니다. vCenter 호스트 이름 또는 IP 주소는 일반적으로 vSphere 클라이언트에 액세스하기 위해 브라우저에서 사용하는 주소입니다. 이미 로그인한 경우 브라우저의 주소 표시줄을 볼 수 있습니다. vSphere에 액세스하는 데 사용하는 URL은 vCenter Server의 호스트 이름 또는 IP 주소입니다. vCenter 주소를 확인한 후 배포를 다시 시도합니다.

vSphere SDK 클라이언트 - 해당 호스트 없음

배포 중에 { _errorCode_: _CreateConfigKvaCustomerError_, _errorResponse_: _error getting the vsphere sdk client: Post \_https://your.vcenter.hostname/sdk\_: dial tcp: lookup your.vcenter.hostname: no such host_ } 오류가 발생하면 배포 컴퓨터가 vCenter 호스트 이름을 IP 주소로 확인할 수 없습니다. 이 문제는 배포 프로세스가 배포 컴퓨터에서 vCenter 호스트 이름으로 TCP 연결을 설정하려고 시도했지만 DNS 확인 문제로 인해 실패하기 때문에 발생합니다. 이 문제를 해결하려면 배포 컴퓨터의 DNS 구성이 올바른지 확인하고, DNS 서버가 온라인인지 확인하고, vCenter 호스트 이름에 누락된 DNS 항목이 있는지 확인합니다. 배포 컴퓨터에서 nslookup your.vcenter.hostname 또는 ping your.vcenter.hostname을 실행하여 DNS 확인을 테스트할 수 있습니다. vCenter 주소를 호스트 이름으로 지정한 경우 대신 IP 주소를 직접 사용하는 것이 좋습니다.

배포 전 유효성 검사 오류

다음과 같은 다양한 pre-deployment validation of your download\upload connectivity wasn't successful 오류가 발생하는 경우:

Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: Service Unavailable

Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: dial tcp 172.16.60.10:443: connectex: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond.

Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: use of closed network connection.

Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: dial tcp: lookup hostname.domain: no such host

이러한 오류의 조합은 일반적으로 관리 컴퓨터와 데이터 저장소의 연결이 끊어졌거나 데이터 저장소에 연결할 수 없게 만드는 네트워킹 문제가 있음을 나타냅니다. vCenter에서 어플라이언스 VM을 빌드하는 데 사용되는 관리 컴퓨터에서 OVA를 업로드하려면 이 연결이 필요합니다. 관리 컴퓨터와 데이터 저장소 간의 연결을 다시 설정한 후 Arc 리소스 브리지 배포를 다시 시도해야 합니다.

x509 인증서가 만료되었거나 아직 유효하지 않음

Arc 리소스 브리지를 배포할 때 다음 오류가 발생할 수 있습니다.

Error: { _errorCode_: _PostOperationsError_, _errorResponse_: _{\n\_message\_: \_{\\n \\\_code\\\_: \\\_GuestInternetConnectivityError\\\_,\\n \\\_message\\\_: \\\_Not able to connect to https://msk8s.api.cdp.microsoft.com. Error returned: action failed after 3 attempts: Get \\\\\\\_https://msk8s.api.cdp.microsoft.com\\\\\\\_: x509: certificate has expired or isn't yet valid: current time 2022-01-18T11:35:56Z is before 2023-09-07T19:13:21Z. Arc Resource Bridge network and internet connectivity validation failed: http-connectivity-test-arc. 1. Please check your networking setup and ensure the URLs mentioned in : https://aka.ms/AAla73m are reachable from the Appliance VM. 2. Check firewall/proxy settings

이 오류는 ESXi 호스트와 Arc 리소스 브리지에 대한 배포 명령이 실행되는 관리 컴퓨터 간에 클록/시간 차이가 있을 때 발생합니다. 이 문제를 해결하려면 ESXi 호스트에서 NTP 시간 동기화를 켜고 관리 컴퓨터도 NTP와 동기화되었는지 확인한 후 배포를 다시 시도합니다.

Arc 리소스 브리지 상태의 연결이 끊김

초기 Arc 지원 VMware 온보딩 스크립트를 실행할 때 vSphere 계정을 제공하라는 메시지가 표시되었습니다. 이 계정은 암호화된 Kubernetes 비밀로 Arc 리소스 브리지 내에 로컬로 저장됩니다. 이 계정은 Arc 리소스 브리지가 vCenter와 상호 작용할 수 있도록 하는 데 사용됩니다. Arc 리소스 브리지 상태가 연결이 끊긴 경우 리소스 브리지 내에 로컬로 저장된 vSphere 계정이 만료되었기 때문일 수 있습니다. vSphere 계정 자격 증명 업데이트 지침에 따라 Arc 리소스 브리지 내 및 Arc 지원 VMware에 대한 자격 증명을 업데이트해야 합니다.

호스트 구성 중에 오류 발생

동일한 템플릿을 사용하여 Arc 리소스 브리지를 여러 번 배포하고 삭제한 경우 다음 오류가 발생할 수 있습니다.

Appliance cluster deployment failed with error: Error: An error occurred during host configuration

이 문제를 해결하려면 기존 템플릿을 수동으로 삭제합니다. 그런 다음, az arcappliance prepare를 실행하여 배포할 새 템플릿을 다운로드합니다.

폴더를 찾을 수 없음

VMware에 Arc 리소스 브리지를 배포할 때 템플릿과 VM이 만들어지는 폴더를 지정합니다. 선택한 폴더는 VM 및 템플릿 폴더 형식이어야 합니다. 스토리지 폴더, 네트워크 폴더 또는 호스트 및 클러스터 폴더와 같은 다른 유형의 폴더는 리소스 브리지 배포에 사용할 수 없습니다.

리소스를 검색할 수 없습니다.

Arc 리소스 브리지를 배포할 때 어플라이언스 VM을 배포할 위치를 지정합니다. 어플라이언스 VM은 해당 위치 경로에서 이동할 수 없습니다. 경로를 변경하려면 Arc 리소스 브리지를 삭제하고 다시 배포해야 합니다. Arc 리소스 브리지를 업그레이드할 때 어플라이언스 VM을 이동한 경우 다음과 유사한 오류가 발생할 수 있습니다.

{\n  \"code\": \"PreflightcheckError\",\n  \"message\": \"{\\n  \\\"code\\\": \\\"InvalidEntityError\\\",\\n  \\\"message\\\": \\\"Cannot retrieve <resource> 'resource-name': <resource> 'resource-name' not found\\\"\\n }\"\n }"

어플라이언스 VM을 원래 위치로 다시 이동하고 위치 변경에 대해 RBAC 자격 증명이 업데이트되었는지 확인하거나 Arc 리소스 브리지를 삭제하고 다시 배포할 수 있습니다.

권한 부족

VMware vCenter에 리소스 브리지를 배포할 때 권한이 부족하다는 오류 메시지가 표시될 수 있습니다. 이 문제를 해결하려면 리소스 브리지를 배포하는 데 사용되는 사용자 계정에 VMware vCenter에서 다음 권한이 모두 있는지 확인한 다음, 다시 시도합니다.

Datastore 

  • 공간 할당
  • 데이터 저장소 찾아보기
  • 하위 수준 파일 작업

폴더 

  • 폴더 만들기

vSphere 태그 지정

  • vSphere 태그 할당 또는 할당 해제

네트워크 

  • Assign network

리소스

  • Assign virtual machine to resource pool
  • 전원이 꺼진 가상 머신 마이그레이션
  • 전원이 켜진 가상 머신 마이그레이션

세션

  • 세션 유효성 검사

vApp

  • 리소스 풀 할당
  • 가져오기

가상 머신

  • 구성 변경
    • 디스크 임대 획득
    • 기존 디스크 추가
    • 새 디스크 추가
    • 디바이스 추가 또는 제거
    • 고급 구성
    • CPU 수 변경
    • 메모리 변경
    • 설정 변경
    • 리소스 변경
    • managedBy 구성
    • 연결 설정 표시
    • 가상 디스크 확장
    • 디바이스 설정 수정
    • 내결함성 호환성 쿼리
    • 소유하지 않은 파일 쿼리
    • 경로에서 다시 로드
    • 디스크 제거
    • 이름 바꾸기
    • 게스트 정보 다시 설정
    • 주석 설정
    • 디스크 변경 내용 추적 토글
    • 포크 부모 토글
    • 가상 머신 호환성 업그레이드
  • 인벤토리 편집
    • 기존에서 만들기
    • 새로 만들기
    • 등록
    • 제거
    • 등록 취소
  • 게스트 작업
    • 게스트 작업 별칭 수정
    • 게스트 작업 수정
    • 게스트 작업 프로그램 실행
    • 게스트 작업 쿼리
  • 상호 작용
    • 디바이스 연결
    • 상호 작용 콘솔
    • VIX API로 게스트 운영 체제 관리
    • VMware Tools 설치
    • 전원 끄기
    • 전원 켜기
    • Reset
    • 일시 중단
  • 프로비전
    • 디스크 액세스 허용
    • 파일 액세스 허용
    • Allow read-only disk access
    • 가상 머신 다운로드 허용
    • 가상 머신 파일 업로드 허용
    • 가상 머신 복제
    • 템플릿 배포
    • 템플릿으로 표시
    • 가상 머신으로 표시
    • 게스트 사용자 지정
  • 스냅샷 관리
    • 스냅샷 만들기
    • 스냅샷 제거
    • 스냅샷으로 되돌리기

다음 단계

Azure Arc 지원 VMware vSphere 재해 시나리오에서 리소스 브리지를 복구하는 작업 알아보기

여기에 문제가 표시되지 않거나 문제를 해결할 수 없는 경우 다음 채널 중 하나를 통해 지원을 받으세요.

  • Microsoft Q&A를 통해 Azure 전문가의 답변을 받습니다.
  • 고객 환경을 개선하기 위한 공식 Microsoft Azure 계정인 @AzureSupport와 연결합니다. Azure 지원은 Azure 커뮤니티를 답변, 지원 및 전문가에게 연결합니다.
  • Azure 지원 요청을 엽니다.