Azure HDInsight 클러스터에 적합한 VM 크기를 선택

이 문서에서는 HDInsight 클러스터의 다양한 노드에 적합한 VM 크기를 선택하는 방법을 설명합니다.

먼저 CPU 처리, RAM 크기 및 네트워크 대기 시간과 같은 가상 머신의 속성이 워크로드 처리에 미치는 영향을 이해합니다. 다음으로, 애플리케이션 및 애플리케이션이 다른 VM 제품군에 최적화된 항목과 어떻게 일치하는지 생각해 보세요. 사용하려는 VM 제품군이 배포하려는 클러스터 유형과 호환되는지 확인합니다. 각 클러스터 유형에 대해 지원되는 모든 권장 VM 크기 목록은 Azure HDInsight 지원 노드 구성을 참조하세요. 마지막으로 벤치마킹 프로세스를 사용하여 일부 샘플 워크로드를 테스트하고 해당 제품군 내의 SKU가 적합한지 확인할 수 있습니다.

스토리지 유형 또는 클러스터 크기 선택과 같은 클러스터의 다른 측면을 계획하는 데 대한 자세한 내용은 HDInsight 클러스터에 대한 용량 계획을 참조하세요.

VM 속성 및 빅 데이터 워크로드

VM 크기와 유형은 CPU 처리 성능, RAM 크기 및 네트워크 대기 시간에 따라 결정됩니다.

  • CPU: VM 크기는 코어 수를 나타냅니다. 코어 수가 많을수록 각 노드가 달성할 수 있는 병렬 계산 수준이 높아집니다. 또한 일부 VM 유형은 더 빠른 코어를 포함합니다.

  • RAM: VM 크기는 VM에서 사용할 수 있는 RAM의 양을 나타내기도 합니다. 데이터를 디스크에서 읽지 않고, 처리를 위해 데이터를 메모리에 저장하는 워크로드의 경우, 작업자 노드에 데이터에 맞는 충분한 메모리가 있는지 확인합니다.

  • 네트워크: 대부분의 클러스터 유형에서, 클러스터에 의해 처리된 데이터는 로컬 디스크에 저장되지 않고 Data Lake Storage 또는 Azure Storage와 같은 외부 스토리지 서비스에 저장됩니다. 노드 VM 및 스토리지 서비스 간의 네트워크 대역폭과 처리량을 고려합니다. VM에 사용할 수 있는 네트워크 대역폭은 일반적으로 더 크게 늘어납니다. 자세한 내용은 VM 크기 개요를 참조하세요.

VM 최적화 이해

Azure의 가상 머신 제품군은 다양한 사용 사례에 맞게 최적화되어 있습니다. 아래 표에서 가장 인기있는 사용 사례 중 일부와 일치하는 VM 제품군을 찾을 수 있습니다.

형식 크기 설명
항목 수준 Av2 개발과 테스트 등 항목별 작업에 가장 적합한 CPU 성능 및 메모리 구성을 갖추고 있습니다. 경제적이고 Azure를 시작하기 위한 저렴한 옵션을 제공합니다.
범용 D, DSv2, Dv2 CPU 대 메모리 비율이 적당합니다. 테스트 및 개발, 중소 규모 데이터베이스 및 트래픽이 적거나 중간 정도인 웹 서버에 적합합니다.
컴퓨팅 최적화 F CPU 대 메모리 비율이 높습니다. 트래픽이 중간 정도인 웹 서버, 네트워크 어플라이언스, 일괄 처리 프로세스 및 애플리케이션 서버에 적합합니다.
메모리에 최적화 Esv3, Ev3 메모리 대 CPU 비율이 높습니다. 관계형 데이터베이스 서버, 중대형 캐시 및 메모리 내 분석에 적합합니다.
  • HDInsight 지원 지역에서 사용 가능한 VM 인스턴스의 가격 책정에 대한 자세한 내용은 HDInsight 가격 책정을 참조하세요.

가벼운 워크로드에 대한 비용 절감 VM 유형

처리 요구 사항이 적은 경우 F 시리즈는 HDInsight를 시작하는데 적합합니다. 시간당 가격이 더 낮은 F 시리즈는 vCPU당 ACU(Azure 컴퓨팅 단위)를 기준으로 하는 Azure 포트폴리오에서 가격 대비 성능이 가장 좋습니다.

다음 표에서는 Fsv2 시리즈 VM을 사용하여 만들 수 있는 클러스터 유형 및 노드 유형을 설명합니다.

클러스터 유형 버전 작업자 노드 헤드 노드 Zookeeper 노드
Spark 모두 F4 이상 아니요 아니요
Hadoop은 모두 F4 이상 아니요 아니요
Kafka 모두 F4 이상 아니요 아니요
HBase 모두 F4 이상 아니요 아니요
LLAP disabled 아니요 아니요 아니요

각 F 시리즈 SKU의 사양을 보려면 F 시리즈 VM 크기를 참조하세요.

벤치마킹

벤치마킹은 다른 VM에서 시뮬레이션된 워크로드를 실행하여 프로덕션 워크로드에 얼마나 잘 수행되는지 측정하는 프로세스입니다.

VM SkU 및 클러스터 크기에 대한 벤치마킹에 대한 자세한 내용은 Azure HDInsight의 클러스터 용량 계획을 참조하세요.

다음 단계