¿Cuáles son las configuraciones de nodos predeterminadas y recomendadas para Azure HDInsight?
En este artículo se tratan las configuraciones de nodos predeterminadas y recomendadas para los clústeres de Azure HDInsight.
Configuración predeterminada y mínima recomendada de los nodos y tamaños de máquina virtual para clústeres
En las tablas siguientes se indican los tamaños de máquina virtual predeterminados y recomendados para clústeres de HDInsight. Esta información es necesaria para entender qué tamaños de VM se deben usar al crear scripts de PowerShell o la CLI de Azure para implementar clústeres de HDInsight.
Si necesita más de 32 nodos de trabajo en un clúster, seleccione un tamaño de nodo principal con al menos 8 núcleos y 14 GB de RAM.
Los únicos tipos de clúster que tienen discos de datos son los clústeres Kafka y HBase con la característica Escrituras aceleradas habilitada. HDInsight admite los tamaños de disco P30 y S30 en estos escenarios. Para el resto de los tipos de clúster, HDInsight proporciona espacio en disco administrado con el clúster. A partir del 07/11/2019, el tamaño del disco administrado de cada nodo del clúster recién creado es de 128 GB. Esto no se puede cambiar.
En la tabla siguiente se resumen las especificaciones de todos los tipos de máquina virtual mínimos recomendados que se usan en este documento.
Size | vCPU | Memoria: GiB | GiB de almacenamiento temporal (SSD) | Rendimiento máximo de almacenamiento temporal: IOPS / MBps de lectura / MBps de escritura | Discos de datos máx. / rendimiento: E/S | Nº máx. de NIC/ancho de banda de red esperado (Mbps) |
---|---|---|---|---|---|---|
Standard_D3_v2 | 4 | 14 | 200 | 12000 / 187 / 93 | 16 / 16x500 | 4 / 3000 |
Standard_D4_v2 | 8 | 28 | 400 | 24000 / 375 / 187 | 32 / 32x500 | 8 / 6000 |
Standard_D5_v2 | 16 | 56 | 800 | 48000 / 750 / 375 | 64 / 64x500 | 8 / 12 000 |
Standard_D12_v2 | 4 | 28 | 200 | 12000 / 187 / 93 | 16 / 16x500 | 4 / 3000 |
Standard_D13_v2 | 8 | 56 | 400 | 24000 / 375 / 187 | 32 / 32x500 | 8 / 6000 |
Standard_D14_v2 | 16 | 112 | 800 | 48000 / 750 / 375 | 64 / 64x500 | 8 / 12 000 |
Standard_A1_v2 | 1 | 2 | 10 | 1000 / 20 / 10 | 2 / 2x500 | 2 / 250 |
Standard_A2_v2 | 2 | 4 | 20 | 2000 / 40 / 20 | 4 / 4x500 | 2 / 500 |
Standard_A4_v2 | 4 | 8 | 40 | 4000 / 80 / 40 | 8 / 8x500 | 4 / 1000 |
Para ver más información sobre las especificaciones de cada tipo de máquina virtual, consulte los siguientes documentos:
- Tamaños de máquina virtual de uso general:
Dv2
series 1-5 - Tamaños de máquina virtual optimizada para memoria:
Dv2
series 11-15 - Tamaños de máquina virtual de uso general:
Av2
series 1-8
Todas las regiones admitidas
Nota
Para obtener el identificador de SKU para su uso en PowerShell y otros scripts, agregue Standard_
al principio de todas las SKU de máquina virtual en las tablas siguientes. Por ejemplo, D12_v2
se convertiría en Standard_D12_v2
.
Tipo de clúster | Hadoop | HBase | Interactive Query | Spark | Kafka |
---|---|---|---|---|---|
Principal: tamaño de máquina virtual predeterminado | E4_v3 | E4_v3 | D13_v2 | E8_v3, D13_v2* |
E4_v3 |
Principal: tamaños mínimos de máquina virtual recomendados | D5_v2 | D3_v2 | D13_v2 | D12_v2, D13_v2* |
D3_v2 |
Trabajo: tamaño de máquina virtual predeterminado | E8_v3 | E4_v3 | D14_v2 | E8_v3 | 4 E4_v3 con 2 discos S30 por agente |
Trabajo: tamaños mínimos de máquina virtual recomendados | D5_v2 | D3_v2 | D13_v2 | D12_v2 | D3_v2 |
Zookeeper: tamaño de máquina virtual predeterminado | A4_v2 | A4_v2 | A4_v2 | ||
ZooKeeper: tamaños mínimos de máquina virtual recomendados | A4_v2 | A4_v2 | A4_v2 |
* = tamaños de máquina virtual para los clústeres de Enterprise Security Package (ESP) de Spark
Nota
- El trabajo se conoce como Región para el tipo de clúster de HBase.