Introducción a las máquinas virtuales de la serie HBv4

Se aplica a: ✔️ Máquinas virtuales Linux ✔️ Máquinas virtuales Windows ✔️ Conjuntos de escalado flexibles ✔️ Conjuntos de escalado uniformes

Un servidor de la serie HBv4 consta de 2 CPU de 96 núcleos EPYC 9V33X para un total de 192 núcleos físicos "Zen4" con caché AMD 3D-V. El multithreading simultáneo (SMT) está deshabilitado en HBv4. Estos 192 núcleos se dividen en 24 secciones (12 por socket), cada sección que contiene ocho núcleos de procesador con acceso uniforme a una caché L3 de 96 MB. Azure servidores HBv4 también usan la siguiente configuración de BIOS:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

Como resultado, el servidor se inicia con cuatro dominios NUMA (2 por socket), cada uno de 48 núcleos. Cada NUMA tiene acceso directo a seis canales de DRAM físico.

Para dejar margen suficiente para que el hipervisor de Azure funcione sin interferir con la máquina virtual, se reservan 16 núcleos físicos por servidor.

Topología de las VM

En el siguiente diagrama se muestra la topología del servidor. Nos reservamos estos 16 núcleos de host de hipervisor (en amarillo) simétricamente entre ambos sockets de CPU, tomando los primeros dos núcleos de matrices de complejos de núcleos (CCD) específicas en cada dominio NUMA, con el resto de los núcleos de VM de la serie HBv4 (en verde).

Captura de pantalla de la topología del servidor de la serie HBv4

El límite CCD es diferente de un límite NUMA. En HBv4, se configura un grupo de seis (6) CCD consecutivos como dominio NUMA, tanto en el nivel de servidor host como en una VM invitada. Por lo tanto, todos los tamaños de máquina virtual HBv4 exponen cuatro dominios NUMA uniformes que aparecen en un sistema operativo y una aplicación, como se muestra a continuación, cada uno con un número diferente de núcleos en función del tamaño de máquina virtual HBv4 específico.

Captura de pantalla de la topología de máquina virtual de la serie HBv4

Cada tamaño de VM de HBv4 tiene un diseño físico, características y rendimiento similares de una CPU diferente de la serie AMD EPYC 9V33X, como se indica a continuación:

Tamaño de VM HBv4 Dominios NUMA Núcleos por dominio NUMA Similitud con AMD EPYC
Standard_HB176rs_v4 4 44 EPYC de doble zócalo 9684X
Standard_HB176-144rs_v4 4 36 EPYC de doble zócalo 9684X
Standard_HB176-96rs_v4 4 24 EPYC de doble zócalo 9684X
Standard_HB176-48rs_v4 4 12 EPYC de doble zócalo 9384X
Standard_HB176-24rs_v4 4 6 EPYC 9184X de dos sockets

Nota:

  • Los tamaños de VM de núcleos restringidos solo reducen el número de núcleos físicos expuestos a la VM. Todos los recursos compartidos globales (RAM, ancho de banda de memoria, cachés, conectividad GMI/xGMI, InfiniBand, Azure red Ethernet, SSD local) permanecen constantes. Esto permite a un cliente elegir un tamaño de máquina virtual adaptado mejor a las necesidades de licencias de software o cargas de trabajo.

La asignación de NUMA virtual de cada tamaño de VM HBv4 se asigna a la topología NUMA física subyacente. No hay ninguna abstracción engañosa potencial de la topología de hardware.

La topología exacta para los distintos tamaños de VM HBv4 se muestra a continuación con la salida de lstopo:

lstopo-no-graphics --no-io --no-legend --of txt

Seleccionar para ver la salida de lstopo para Standard_HB176rs_v4

Salida de lstopo para la VM HBv4-176

Seleccione esta opción para ver la salida de lstopo para Standard_HB176-144rs_v4

Salida de lstopo para la VM HBv4-144

Seleccionar para ver la salida de lstopo para Standard_HB176-96rs_v4

Salida de lstopo para la VM HBv4-64

Seleccione esta opción para ver la salida de lstopo para Standard_HB176-48rs_v4

Salida de lstopo para la VM HBv4-32

Seleccionar para ver la salida de lstopo para Standard_HB176-24rs_v4

Salida de lstopo para la VM HBv4-24

Redes InfiniBand

Las máquinas virtuales HBv4 también incluyen adaptadores de red InfiniBand de NVIDIA NDR (ConnectX-7) que funcionan con hasta 400 Gigabits/s. La NIC se pasa a la máquina virtual a través de SRIOV, lo que permite que el tráfico de red omita el hipervisor. Como resultado, los clientes cargan los controladores OFED de Mellanox estándar en máquinas virtuales HBv4 como si fueran un entorno sin sistema operativo.

Las máquinas virtuales HBv4 admiten el enrutamiento adaptable, el transporte de conexión dinámica (DCT, además de los transportes estándar de RC y UD) y la descarga basada en hardware de colectivos MPI en el procesador incorporado del adaptador ConnectX-7. Estas características mejoran el rendimiento, la escalabilidad y la coherencia de las aplicaciones, y se recomienda su uso.

Almacenamiento temporal

Las máquinas virtuales HBv4 cuentan con tres dispositivos SSD locales físicamente. Un dispositivo tiene el formato previo para servir como un archivo de página y aparece dentro de la máquina virtual como un dispositivo "SSD" genérico.

Otros dos SSD adicionales, más grandes, se proporcionan como dispositivos NVMe de bloques no formateados. A medida que el dispositivo NVMe de bloque omite el hipervisor, tiene mayor ancho de banda e IOPS.

Cuando se emparejan en una matriz seccionada, los SSD NVMe proporcionan anchos de banda de hasta 12 GB/s (lecturas) y 7 GB/s (escrituras) de ancho de banda e IOPS de hasta 186 000 (lecturas) y 201 000 (escrituras).

Especificaciones del hardware

Especificaciones del hardware Máquinas virtuales de la serie HBv4
Núcleos 176, 144, 96, 48 o 24 (SMT deshabilitado)
Unidad Central de Procesamiento (CPU) AMD EPYC 9V33X
Frecuencia de CPU (no AVX) 2,55 GHz (base), 3,7 GHz (turbo)
Memoria 768 GB (la RAM por núcleo depende del tamaño de la máquina virtual)
Disco local 2 NVMe de 1,8 TB (bloque), SSD de 480 GB (archivo de paginación)
InfiniBand 400 Gb/s NVIDIA ConnectX-7 NDR InfiniBand
Red de Azure 100 Gb/s (80 Gb/s Azure Redes aceleradas)

Especificaciones de software

Especificaciones de software Máquinas virtuales de la serie HBv4
Tamaño de trabajo de MPI máximo 52 800 núcleos (300 máquinas virtuales en un solo conjunto de escalado de máquinas virtuales con singlePlacementGroup=true)
Compatibilidad con MPI HPC-X, OpenMPI, MVAPICH2, MPICH
Otros marcos UCX, libfabric, PGAS
Soporte técnico para Azure Storage Discos Estándar y Premium (máximo 32 discos), Azure NetApp Files, Azure Files, sistema de archivos Azure Managed Lustre
Sistema operativo con soporte y validado RHEL 8.6+, AlmaLinux 8.10+, Ubuntu 22.04+ LTS, SLES 15 SP7+, Windows Server 2022+
SO recomendado para el rendimiento AlmaLinux HPC 9.7, Ubuntu HPC 24.04, Windows Server 2025
Compatibilidad con Orchestrator Azure CycleCloud, Azure Batch, Azure Kubernetes Service

Pasos siguientes