¿Cuáles son las configuraciones de nodos predeterminadas y recomendadas para Azure HDInsight?

En este artículo se tratan las configuraciones de nodos predeterminadas y recomendadas para los clústeres de Azure HDInsight.

En las tablas siguientes se indican los tamaños de máquina virtual predeterminados y recomendados para clústeres de HDInsight. Esta información es necesaria para entender qué tamaños de VM se deben usar al crear scripts de PowerShell o la CLI de Azure para implementar clústeres de HDInsight.

Si necesita más de 32 nodos de trabajo en un clúster, seleccione un tamaño de nodo principal con al menos 8 núcleos y 14 GB de RAM.

Los únicos tipos de clúster que tienen discos de datos son los clústeres Kafka y HBase con la característica Escrituras aceleradas habilitada. HDInsight admite los tamaños de disco P30 y S30 en estos escenarios. Para el resto de los tipos de clúster, HDInsight proporciona espacio en disco administrado con el clúster. A partir del 11/07/2019, el tamaño del disco administrado de cada nodo del clúster recién creado es de 128 GB. Esto no se puede cambiar.

En la tabla siguiente se resumen las especificaciones de todos los tipos de máquina virtual mínimos recomendados que se usan en este documento.

Size vCPU Memoria: GiB GiB de almacenamiento temporal (SSD) Rendimiento máximo de almacenamiento temporal: IOPS / MBps de lectura / MBps de escritura Discos de datos máx. / rendimiento: E/S Nº máx. de NIC/ancho de banda de red esperado (Mbps)
Standard_D3_v2 4 14 200 12000 / 187 / 93 16 / 16x500 4 / 3000
Standard_D4_v2 8 28 400 24000 / 375 / 187 32 / 32x500 8 / 6000
Standard_D5_v2 16 56 800 48000 / 750 / 375 64 / 64x500 8 / 12 000
Standard_D12_v2 4 28 200 12000 / 187 / 93 16 / 16x500 4 / 3000
Standard_D13_v2 8 56 400 24000 / 375 / 187 32 / 32x500 8 / 6000
Standard_D14_v2 16 112 800 48000 / 750 / 375 64 / 64x500 8 / 12 000
Standard_A1_v2 1 2 10 1000 / 20 / 10 2 / 2x500 2 / 250
Standard_A2_v2 2 4 20 2000 / 40 / 20 4 / 4x500 2 / 500
Standard_A4_v2 4 8 40 4000 / 80 / 40 8 / 8x500 4 / 1000

Para ver más información sobre las especificaciones de cada tipo de máquina virtual, consulte los siguientes documentos:

Todas las regiones admitidas

Nota

Para obtener el identificador de SKU para su uso en PowerShell y otros scripts, agregue Standard_ al principio de todas las SKU de máquina virtual en las tablas siguientes. Por ejemplo, D12_v2 se convertiría en Standard_D12_v2.

Tipo de clúster Hadoop HBase Interactive Query Spark Kafka
Principal: tamaño de máquina virtual predeterminado E4_v3 E4_v3 D13_v2 E8_v3,
D13_v2*
E4_v3
Principal: tamaños mínimos de máquina virtual recomendados D5_v2 D3_v2 D13_v2 D12_v2,
D13_v2*
D3_v2
Trabajo: tamaño de máquina virtual predeterminado E8_v3 E4_v3 D14_v2 E8_v3 4 E4_v3 con 2 discos S30 por agente
Trabajo: tamaños mínimos de máquina virtual recomendados D5_v2 D3_v2 D13_v2 D12_v2 D3_v2
Zookeeper: tamaño de máquina virtual predeterminado A4_v2 A4_v2 A4_v2
ZooKeeper: tamaños mínimos de máquina virtual recomendados A4_v2 A4_v2 A4_v2

* = tamaños de máquina virtual para los clústeres de Enterprise Security Package (ESP) de Spark

Nota

  • El trabajo se conoce como Región para el tipo de clúster de HBase.

Pasos siguientes