Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se analizan Azure, las máquinas y el almacenamiento, las redes y otros requisitos para Agentic Retrieval.
Importante
Recuperación de agentes en Foundry local está actualmente en VERSIÓN PRELIMINAR. Consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure para conocer los términos legales que se aplican a las características de Azure que se encuentran en la versión beta, en versión preliminar o que todavía no se han publicado para que estén disponibles con carácter general.
Requisitos de recursos
Para empezar a usar Recuperación agéntica, necesitas los siguientes recursos de Azure y en el entorno local.
Recursos de Azure
Antes de implementar la recuperación agente, asegúrese de que tiene los siguientes recursos y permisos Azure implementados:
| Resource | Descripción |
|---|---|
| Suscripción a Azure | Una suscripción de Azure. |
| Permisos de Microsoft Entra ID | - Permisos para crear una aplicación de Microsoft Enterprise Entra. - Capacidad de agregar usuarios y grupos nuevos o existentes de Microsoft Entra a la aplicación. Como parte de las tareas de requisitos previos, configura la autenticación para Agentic Retrieval. |
| Permisos para AKS habilitados por Azure Arc | Permisos para implementar clústeres de Kubernetes de AKS Arc, crear grupos de nodos e instalar extensiones. Como parte de las tareas de requisitos previos, consulte Verificar el rol de colaborador para Agentic Retrieval |
| Certificado de terminación de seguridad de la capa de transporte (TLS) | Un certificado firmado por una entidad de certificación (CA) específica de la empresa o una entidad de certificación pública conocida para implementaciones seguras. Si no proporciona uno, Agentic Retrieval genera un certificado autofirmado. No use un certificado autofirmado para entornos de producción. |
| punto de conexión del modelo de lenguaje | Un punto de conexión de finalizaciones de chat compatibles con OpenAI para el modelo de lenguaje. El modelo recomendado es GPT-OSS-20B a través de Foundry Local en Azure Local que requiere su propia GPU. Consulte requisitos de hardware. También se admite: Microsoft Foundry para modelos hospedados en la nube. Consulte Creación de un punto de conexión. |
Recursos locales
La implementación de Agentic Retrieval es compatible con los siguientes recursos on-premises en su entorno:
| Resource | Descripción |
|---|---|
| Infraestructura local de Azure* | Una instancia de la infraestructura local de Azure , versión mínima 2504. |
| Clúster de AKS Arc en Azure Local* | Un clúster de AKS Arc que se ejecuta en la instancia local de Azure. Use GPU para mejorar el rendimiento. Incluya al menos dos máquinas virtuales habilitadas para GPU en el grupo de nodos: una para la inserción de texto y otra para el procesamiento de imágenes. Docling (analizador de documentos) se ejecuta en la CPU. LlM se ejecuta externamente a través del punto de conexión. Como parte de las tareas de requisitos previos, prepare el clúster de AKS en Azure Local para Recuperación de agentes. |
| Dirección IP estática enrutable | Una dirección IP estática enrutable para el equilibrador de carga MetalLB . Si MetalLB ya está configurado con una dirección IP enrutable, puede omitir este requisito. La dirección IP debe ser accesible desde máquinas cliente. Como parte de las tareas de requisitos previos, la configuración de MetalLB se incluye en los siguientes artículos: - Instala componentes de red y observabilidad para Agentic Retrieval - Configurar DNS para Recuperación de agentes. |
| Sistema de archivos de red (NFS) | Un NFS v3.0 o v4.1 que contenga sus documentos o imágenes locales. La autenticación AUTH_SYS es compatible con todas las implementaciones. Para las implementaciones locales desconectadas, la autenticación Kerberos (krb5p) y SharePoint Server con la autenticación de servidor a servidor (S2S) de High-Trust también se admite como orígenes de datos. Requiere ruta de recurso compartido, Id. de usuario de NFS e Id. de grupo (para AUTH_SYS) o la entidad de servicio de Kerberos (para krb5p). Solo es necesario para los modos combinado y de conocimiento. No es necesario para el modo de agente. Consulte las guías de configuración de Windows Server y Linux. Para la configuración de Kerberos, consulte NFS con autenticación Kerberos. Para obtener SharePoint, consulte SharePoint Server-to-Server authentication. |
| Máquina Windows (opcional) | Facilitar la administración del clúster de Kubernetes habilitado para Azure Arc en Azure Local mediante la configuración de un equipo de controladores o un host de administración local. Como parte de las tareas de requisitos previos, instale herramientas como CLI de Azure, kubectl y Helm para preparar la máquina del controlador. Para obtener más información, consulte: - Prepare el clúster de AKS en Azure Local para Agentic Retrieval - Configure la máquina para administrar el clúster de Azure Arc-Enabled Kubernetes. |
* Agentic Retrieval está validado en Azure Local.
Requisitos mínimos de hardware de máquina virtual
En la tabla siguiente se enumeran los requisitos mínimos de hardware para las máquinas virtuales.
| Mode | Especificaciones de máquina virtual y tamaños mínimos sugeridos |
|---|---|
| GPU | 2 máquinas virtuales habilitadas para GPU (una para la inserción de texto, otra para el procesamiento de imágenes). Tamaños recomendados: Standard_NC8_A2 o Standard_NC8_A16. 3 x máquinas virtuales de CPU: especificación mínima: 8 vCPU, 32 GB- Tamaño recomendado: Standard_D8s_v3. Docling (analizador de documentos) se ejecuta en la CPU: no se requiere ninguna GPU dedicada. |
Capacidad mínima del nodo de clúster
Recuperación de agentes implementa más de 60 pods en modo combined (conocimiento + agente). En la tabla siguiente se muestra la capacidad mínima del nodo de trabajo por modo:
| Modo | Trabajo de CPU | Trabajo de GPU | Total de vCPU | RAM total |
|---|---|---|---|---|
Solo knowledge |
2 x Standard_D8s_v3 | 0-1 | 16 | 64 GB |
combined (conocimiento + agente) |
3x Standard_D8s_v3 | 1 | 24+ | Más de 96 GB |
Note
En Azure Local (HaaS), escale grupos de nodos con az aksarc nodepool scale --name <pool> --node-count <N>.
Para obtener más información, consulte Límites de recursos, tamaños de máquina virtual y regiones para AKS en Windows Server.
Requisito del modelo de lenguaje
La recuperación agente no agrupa modelos de lenguaje. Debe proporcionar un punto de conexión de modelo de lenguaje que exponga una API de finalizaciones de chat compatible con OpenAI. El LLM se ejecuta fuera de la implementación de Recuperación de agentes. LlM dentro del clúster no consume ninguna GPU.
Las dos GPU del clúster se usan para insertar modelos. Docling se ejecuta en CPU:
| Resource | Propósito |
|---|---|
| GPU 1 | Modelo de inserción de texto (BGE-M3) |
| GPU 2 | Modelo de inserción de imágenes (CLIP ViT-L/14) |
| Unidad Central de Procesamiento (CPU) | Analizador de documentos (Docling): no se requiere GPU |
Modelo recomendado: GPT-OSS-20B mediante Foundry Local en Azure Local. También se admite: Microsoft Foundry para modelos hospedados en la nube. Consulte Creación de un punto de conexión.
Para obtener la mejor experiencia, implemente tanto la extensión Local de Foundry como la extensión Agentic Recovery en el mismo clúster de Kubernetes habilitado para Arc. Foundry local en Azure Local ofrece el punto de conexión de modelo de lenguaje recomendado, mientras que Recuperación de agentes proporciona la plataforma de RAG de agentes. Instale primero la extensión Foundry Local y, a continuación, use la URL del punto de conexión del modelo al implementar Agentic Retrieval. Para obtener más información, consulte ¿Qué es Foundry Local en Azure Local?.
Requisitos de hardware (GPT-OSS-20B a través de Foundry Local)
El extremo del modelo de lenguaje funciona de forma independiente de Agentic Retrieval. Si usa GPT-OSS-20B con Foundry Local en Azure Local, el host del modelo requiere su propia GPU:
| Resource | Mínimo | Recomendado (producción) |
|---|---|---|
| GPU | 1 × GPU NVIDIA, ≥ VRAM de 24 GB | 1 × GPU NVIDIA, ≥ VRAM de 48 GB |
| CPU | 8 o más vCPU | +16 vCPU |
| RAM | 32 GB | 64 GB |
| Almacenamiento | ≥ 50 GB | ≥ de 50 a 100 GB por réplica |
La configuración mínima es adecuada para escenarios de desarrollo y de baja concurrencia. Para cargas de trabajo de producción, ventanas de contexto más grandes o una simultaneidad superior, use la configuración recomendada.
Foundry Local valida la compatibilidad con GPU en el momento de la implementación y produce un error claro si los recursos no son suficientes. Pruebe primero en un entorno que no sea de producción.
Requisitos por modo de implementación
| Requisito | Combinado | Agente | Información |
|---|---|---|---|
| Máquinas virtuales habilitadas para GPU (inserción) | 2 | 0 | 2 |
| Máquinas virtuales con CPU | 3+ | 3+ | 3+ |
| GPU del modelo de lenguaje (por ejemplo, GPT-OSS-20B) | 1+ (independiente del clúster) | 1+ (independiente del clúster) | 1+ (independiente del clúster) |
| Origen de datos NFS | Obligatorio | No es necesario | Obligatorio |
| Punto de conexión del modelo de lenguaje | Obligatorio | Obligatorio | Obligatorio |
| registro de aplicaciones de Entra ID | Obligatorio | Obligatorio | Obligatorio |
Si planea usar una configuración de solo CPU, revise las limitaciones de tamaño de archivo y fragmentación. Consulte:
Requisitos mínimos de software
En la tabla siguiente se enumeran los requisitos mínimos de software admitidos para Agentic Retrieval.
| Componente | Requisitos mínimos |
|---|---|
| Sistema operativo de máquina virtual | Linux |
| Versión local de Azure* | Versión de Azure Local 2504 |
| CLI de Azure | Tal como se entrega con Azure Local. No actualice a la versión más reciente de la CLI de Azure y use la que se envió originalmente con Azure Local. |
* Agentic Retrieval está validado en Azure Local.
Requisitos de red
Todos los requisitos actuales de Azure Local y AKS en Azure Local .
Formatos y tamaños de documento admitidos
La recuperación agente admite las siguientes funcionalidades y formatos de archivo relacionados:
| Capacidad | Formato de archivo admitido |
|---|---|
| Extracción de texto | PDF, DOCX, TXT, MHTML, MHT, MD |
| Ingesta de imágenes | JPG, JPEG, PNG |
Con una configuración de GPU, cada archivo individual puede tener hasta 30 MB. Si usa una configuración de solo CPU, cada archivo individual puede tener hasta 5 MB.
No se admiten actualmente los tipos de archivo de audio y vídeo, al igual que aquellos que no están en la lista, como los archivos de documento o imagen.
Orígenes de datos compatibles
La recuperación agente admite los siguientes orígenes de datos:
- NFS v3.0 y v4.1 con autenticación AUTH_SYS (todas las implementaciones).
-
NFS v4.1 con autenticación Kerberos () (
krb5psolo implementaciones locales desconectadas). Consulte NFS con autenticación Kerberos. - SharePoint Server Edición de suscripción con autenticación de servidor a servidor (S2S) de High-Trust (solo implementaciones locales desconectadas). Consulte SharePoint Server-to-Server authentication.
Regiones soportadas
Si tiene previsto usar el inicio rápido con fines de evaluación o desarrollo, implemente recursos de Azure para Recuperación de agentes en cualquier región admitida por Kubernetes habilitado para Azure Arc. En el caso de las implementaciones de producción, implemente la recuperación agente y los recursos necesarios en cualquier región compatible con Azure Local.
Para obtener la lista más up-to-date de las regiones admitidas por servicio, consulte la tabla Productos de Azure por región.