Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Se aplica a: ✔️ Máquinas virtuales Linux ✔️ Máquinas virtuales Windows ✔️ Conjuntos de escalado flexibles ✔️ Conjuntos de escalado uniformes
Un servidor de la serie HBv4 consta de 2 CPU de 96 núcleos EPYC 9V33X para un total de 192 núcleos físicos "Zen4" con caché AMD 3D-V. El multithreading simultáneo (SMT) está deshabilitado en HBv4. Estos 192 núcleos se dividen en 24 secciones (12 por socket), cada sección que contiene ocho núcleos de procesador con acceso uniforme a una caché L3 de 96 MB. Azure servidores HBv4 también usan la siguiente configuración de BIOS:
Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled
Como resultado, el servidor se inicia con cuatro dominios NUMA (2 por socket), cada uno de 48 núcleos. Cada NUMA tiene acceso directo a seis canales de DRAM físico.
Para dejar margen suficiente para que el hipervisor de Azure funcione sin interferir con la máquina virtual, se reservan 16 núcleos físicos por servidor.
Topología de las VM
En el siguiente diagrama se muestra la topología del servidor. Nos reservamos estos 16 núcleos de host de hipervisor (en amarillo) simétricamente entre ambos sockets de CPU, tomando los primeros dos núcleos de matrices de complejos de núcleos (CCD) específicas en cada dominio NUMA, con el resto de los núcleos de VM de la serie HBv4 (en verde).
El límite CCD es diferente de un límite NUMA. En HBv4, se configura un grupo de seis (6) CCD consecutivos como dominio NUMA, tanto en el nivel de servidor host como en una VM invitada. Por lo tanto, todos los tamaños de máquina virtual HBv4 exponen cuatro dominios NUMA uniformes que aparecen en un sistema operativo y una aplicación, como se muestra a continuación, cada uno con un número diferente de núcleos en función del tamaño de máquina virtual HBv4 específico.
Cada tamaño de VM de HBv4 tiene un diseño físico, características y rendimiento similares de una CPU diferente de la serie AMD EPYC 9V33X, como se indica a continuación:
| Tamaño de VM HBv4 | Dominios NUMA | Núcleos por dominio NUMA | Similitud con AMD EPYC |
|---|---|---|---|
| Standard_HB176rs_v4 | 4 | 44 | EPYC de doble zócalo 9684X |
| Standard_HB176-144rs_v4 | 4 | 36 | EPYC de doble zócalo 9684X |
| Standard_HB176-96rs_v4 | 4 | 24 | EPYC de doble zócalo 9684X |
| Standard_HB176-48rs_v4 | 4 | 12 | EPYC de doble zócalo 9384X |
| Standard_HB176-24rs_v4 | 4 | 6 | EPYC 9184X de dos sockets |
Nota:
- Los tamaños de VM de núcleos restringidos solo reducen el número de núcleos físicos expuestos a la VM. Todos los recursos compartidos globales (RAM, ancho de banda de memoria, cachés, conectividad GMI/xGMI, InfiniBand, Azure red Ethernet, SSD local) permanecen constantes. Esto permite a un cliente elegir un tamaño de máquina virtual adaptado mejor a las necesidades de licencias de software o cargas de trabajo.
La asignación de NUMA virtual de cada tamaño de VM HBv4 se asigna a la topología NUMA física subyacente. No hay ninguna abstracción engañosa potencial de la topología de hardware.
La topología exacta para los distintos tamaños de VM HBv4 se muestra a continuación con la salida de lstopo:
lstopo-no-graphics --no-io --no-legend --of txt
Seleccionar para ver la salida de lstopo para Standard_HB176rs_v4
Seleccione esta opción para ver la salida de lstopo para Standard_HB176-144rs_v4
Seleccionar para ver la salida de lstopo para Standard_HB176-96rs_v4
Seleccione esta opción para ver la salida de lstopo para Standard_HB176-48rs_v4
Seleccionar para ver la salida de lstopo para Standard_HB176-24rs_v4
Redes InfiniBand
Las máquinas virtuales HBv4 también incluyen adaptadores de red InfiniBand de NVIDIA NDR (ConnectX-7) que funcionan con hasta 400 Gigabits/s. La NIC se pasa a la máquina virtual a través de SRIOV, lo que permite que el tráfico de red omita el hipervisor. Como resultado, los clientes cargan los controladores OFED de Mellanox estándar en máquinas virtuales HBv4 como si fueran un entorno sin sistema operativo.
Las máquinas virtuales HBv4 admiten el enrutamiento adaptable, el transporte de conexión dinámica (DCT, además de los transportes estándar de RC y UD) y la descarga basada en hardware de colectivos MPI en el procesador incorporado del adaptador ConnectX-7. Estas características mejoran el rendimiento, la escalabilidad y la coherencia de las aplicaciones, y se recomienda su uso.
Almacenamiento temporal
Las máquinas virtuales HBv4 cuentan con tres dispositivos SSD locales físicamente. Un dispositivo tiene el formato previo para servir como un archivo de página y aparece dentro de la máquina virtual como un dispositivo "SSD" genérico.
Otros dos SSD adicionales, más grandes, se proporcionan como dispositivos NVMe de bloques no formateados. A medida que el dispositivo NVMe de bloque omite el hipervisor, tiene mayor ancho de banda e IOPS.
Cuando se emparejan en una matriz seccionada, los SSD NVMe proporcionan anchos de banda de hasta 12 GB/s (lecturas) y 7 GB/s (escrituras) de ancho de banda e IOPS de hasta 186 000 (lecturas) y 201 000 (escrituras).
Especificaciones del hardware
| Especificaciones del hardware | Máquinas virtuales de la serie HBv4 |
|---|---|
| Núcleos | 176, 144, 96, 48 o 24 (SMT deshabilitado) |
| Unidad Central de Procesamiento (CPU) | AMD EPYC 9V33X |
| Frecuencia de CPU (no AVX) | 2,55 GHz (base), 3,7 GHz (turbo) |
| Memoria | 768 GB (la RAM por núcleo depende del tamaño de la máquina virtual) |
| Disco local | 2 NVMe de 1,8 TB (bloque), SSD de 480 GB (archivo de paginación) |
| InfiniBand | 400 Gb/s NVIDIA ConnectX-7 NDR InfiniBand |
| Red de Azure | 100 Gb/s (80 Gb/s Azure Redes aceleradas) |
Especificaciones de software
| Especificaciones de software | Máquinas virtuales de la serie HBv4 |
|---|---|
| Tamaño de trabajo de MPI máximo | 52 800 núcleos (300 máquinas virtuales en un solo conjunto de escalado de máquinas virtuales con singlePlacementGroup=true) |
| Compatibilidad con MPI | HPC-X, OpenMPI, MVAPICH2, MPICH |
| Otros marcos | UCX, libfabric, PGAS |
| Soporte técnico para Azure Storage | Discos Estándar y Premium (máximo 32 discos), Azure NetApp Files, Azure Files, sistema de archivos Azure Managed Lustre |
| Sistema operativo con soporte y validado | RHEL 8.6+, AlmaLinux 8.10+, Ubuntu 22.04+ LTS, SLES 15 SP7+, Windows Server 2022+ |
| SO recomendado para el rendimiento | AlmaLinux HPC 9.7, Ubuntu HPC 24.04, Windows Server 2025 |
| Compatibilidad con Orchestrator | Azure CycleCloud, Azure Batch, Azure Kubernetes Service |
Pasos siguientes
- En el Blog de la Comunidad Técnica de Azure Compute, lea sobre los anuncios más recientes, ejemplos de cargas de trabajo HPC y resultados de rendimiento.
- Si desea una visión general de la arquitectura de la ejecución de cargas de trabajo de HPC, consulte Informática de alto rendimiento (HPC) en Azure.