Preguntas más frecuentes sobre Foundry IQ

Encuentre respuestas a preguntas comunes sobre Foundry IQ.

General

¿Qué es Foundry IQ?

Foundry IQ permite a los agentes acceder, procesar y actuar sobre el conocimiento desde cualquier lugar.

Con Foundry IQ, se crea una base de conocimiento que se conecta a uno o varios orígenes de conocimiento. El motor de recuperación agéntica procesa consultas, y un modelo de lenguaje grande opcional (LLM) de Azure OpenAI en Foundry Models agrega planificación de consultas y razonamiento. Los agentes construidos en Foundry Agent Service llaman a la base de conocimiento para recuperar el contenido pertinente.

¿Cuál es la diferencia entre Foundry IQ y la recuperación agéntica?

Foundry IQ consta de bases de conocimiento, orígenes de conocimiento e integraciones nativas con Azure OpenAI en Foundry Models y Foundry Agent Service. El portal de Microsoft Foundry ofrece una experiencia de configuración simplificada y de un extremo a otro, pero también puede crear los componentes foundry IQ mediante programación.

La recuperación de agentes es el motor de recuperación de varias consultas que hace funcionar las bases de conocimiento de Foundry IQ. En el caso de las soluciones personalizadas, puede usar la recuperación agente directamente a través de las API de Búsqueda de Azure AI.

¿Cómo difiere Foundry IQ de los patrones RAG existentes o Azure OpenAI aplicado a sus datos?

Una base de conocimiento de Foundry IQ proporciona acceso a varios orígenes, lo que elimina la necesidad de conectar cada agente a cada origen individualmente.

El motor de recuperación agente planea qué orígenes consultar y realiza una búsqueda iterativa si los resultados iniciales no cumplen los estándares de relevancia. La indexación y la sincronización de datos se desencadenan automáticamente. La búsqueda iterativa depende de especificar un esfuerzo de razonamiento de recuperación medio en la base de conocimiento o por solicitud.

Componentes y requisitos

¿Se requiere Búsqueda de Azure AI para Foundry IQ?

Sí. Foundry IQ se basa en las capacidades de recuperación agenticas de Búsqueda de Azure AI. Debe crear una base de conocimiento en Búsqueda de Azure AI para usar Foundry IQ.

¿Se requiere el servicio de Agente Foundry para Foundry IQ?

No. Puede llamar a las bases de conocimiento desde Foundry Agent Service, Microsoft Agent Framework o cualquier aplicación que admita las APIs de la base de conocimiento, desde Búsqueda de Azure AI. Sin embargo, Foundry Agent Service proporciona una plataforma de hospedaje de agentes llave en mano con compatibilidad integrada con las bases de conocimiento de Foundry IQ.

¿Foundry IQ y la recuperación de agentes tienen una dependencia fuerte en los modelos de lenguaje grandes (LLM)?

El uso de LLM para el planeamiento de consultas es opcional, pero se recomienda. Sin un LLM, puede usar lógicas mínimas de razonamiento de recuperación en la recuperación de agentes para combinar los resultados de varias consultas entre fuentes de conocimiento.

Para beneficiarse del procesamiento paralelo de varias subconsultas, se requiere el planeamiento de consultas de LLM. El motor de recuperación de agentes usa la planificación de consultas de LLM mediante lógicas de razonamiento de recuperación de nivel bajo y medio para una recuperación más exhaustiva.

¿Qué modelos LLM se admiten para el planeamiento de consultas?

Solo se admiten modelos gpt-4o, gpt-4.1 y gpt-5 de Azure OpenAI en Foundry Models para el planeamiento de consultas. Para obtener la lista completa, consulte Modelos admitidos. Especifique la implementación del modelo al crear la base de conocimiento.

Bases de conocimiento y orígenes de conocimiento

¿Qué es una base de conocimiento?

Una base de conocimiento es un objeto de nivel superior que agrupa uno o varios orígenes de conocimiento en un único punto de conexión. Su configuración controla cómo se seleccionan los orígenes (mediante instrucciones de recuperación y esfuerzo de razonamiento) y cómo se devuelven los resultados (mediante el modo de salida y las instrucciones de respuesta). Una conexión LLM permite la planificación de consultas y la síntesis de respuestas.

En el momento de la consulta, el motor de recuperación agente usa esta configuración para procesar las solicitudes. Los controles de acceso de nivel de usuario solo se aplican cuando el origen de conocimiento admite permisos de nivel de documento y cuando esos permisos se han configurado explícitamente para la sincronización. A menos que se indique expresamente la compatibilidad con permisos de usuario predeterminados en la documentación de la fuente de conocimientos, los controles de acceso de documento no se aceptan automáticamente.

¿Qué orígenes de conocimiento se admiten?

Hay dos tipos de orígenes de conocimiento:

  • Los orígenes de conocimiento indexados ingieren datos en un índice de búsqueda y controlan automáticamente la fragmentación, la vectorización, la extracción de metadatos y la sincronización de la lista de control de acceso (ACL). Los orígenes indexados admitidos incluyen Azure Blob Storage, OneLake, SharePoint y índices de búsqueda existentes.

  • Los orígenes de conocimiento remotos no ingieren ni almacenan datos. En su lugar, emiten consultas bajo demanda al sistema externo durante el tiempo de recuperación de datos. Los orígenes remotos admitidos incluyen SharePoint (utilizando la API de recuperación de Copilot) y fuentes web remotas (utilizando Grounding con Bing).

¿Con qué frecuencia se actualizan los datos indexados?

Los orígenes de conocimiento indexados usan indizadores Búsqueda de Azure AI para la ingesta de datos. Puede programar ejecuciones periódicas del indexador para la actualización incremental de datos. La frecuencia depende de la configuración de programación del indexador.

Los orígenes de conocimiento remotos consultan sistemas externos a petición, por lo que los datos siempre están actualizados.

Recuperación de agente

¿Qué es la recuperación autónoma?

La recuperación de agentes es el motor de recuperación que procesa las solicitudes en una base de conocimiento.

Selecciona los orígenes de conocimiento que se van a consultar, enrutar las solicitudes de forma adecuada y puede iterar automáticamente cuando los resultados iniciales están incompletos. Cuando la base de conocimiento incluye un LLM, la recuperación de agentes también realiza la planificación de consultas y el razonamiento lógico de nivel superior para afinar el proceso de búsqueda. Puede controlar el costo y la latencia del proceso de búsqueda estableciendo el esfuerzo de razonamiento de recuperación en la base de conocimiento.

Las pruebas comparativas demuestran que la recuperación de agentes generan aproximadamente respuestas con una calidad del 36 % mayor que el RAG tradicional de un solo flujo.

¿Qué es la planificación de consultas en la recuperación de agentes?

El planeamiento de consultas es el proceso por el que un LLM divide una consulta compleja en subconsultas más pequeñas y centradas para una mayor cobertura del corpus de búsqueda. También incluye la lógica para seleccionar un origen de conocimiento sobre otro.

Puede influir en la selección del origen de conocimiento agregando descripciones a orígenes de conocimiento indexados e instrucciones de recuperación a la base de conocimiento. Por ejemplo, podría especificar "utilice el índice-del-manual-del-empleado para preguntas sobre el tiempo libre" y "utilice el índice-del-seguro-de-salud para preguntas sobre la cobertura médica".

¿Cómo se invoca la planificación de consultas?

El planeamiento de consultas se invoca cuando se especifica el esfuerzo de razonamiento de recuperación bajo o medio en una base de conocimiento.

¿En qué consiste la lógica de razonamiento en la recuperación?

La lógica de razonamiento de recuperación determina hasta qué punto se usa la planificación controlada por el LLM durante la recuperación de agentes. Los niveles varían de mínimo a medio, lo que influye en la profundidad en que el sistema interpreta la consulta, selecciona los orígenes y decide si se necesitan más pasos de recuperación.

¿Cuáles son los límites de cada nivel de esfuerzo de razonamiento de recuperación?

Los límites varían según el nivel de esfuerzo de razonamiento:

  • Mínimo: hasta 10 orígenes de conocimiento. Sin procesamiento de LLM, sin planificación de consultas y sin síntesis de respuestas.

  • Bajo: hasta tres fuentes de conocimiento y tres subconsultas. Admite la síntesis de respuestas con un presupuesto de 5000 tokens.

  • Medio: hasta cinco fuentes de conocimiento y cinco subconsultas. Admite la búsqueda iterativa y la síntesis de respuestas con un presupuesto de 10 000 tokens.

Para obtener más información, consulte Límites de recuperación de agentes.

¿Qué es la síntesis de respuestas? ¿Debo usarlo para una base de conocimiento de Foundry IQ?

La síntesis de respuestas usa un LLM para generar una respuesta completa en lenguaje natural basada en el contenido recuperado. La síntesis de respuestas es necesaria para los orígenes de conocimiento web.

Para la mayoría de los escenarios de Foundry IQ, use datos extractivos en lugar de síntesis de respuesta. Los datos extractivos devuelven contenido sin procesar que los agentes pueden razonar e incorporar en sus respuestas. Recurra a la síntesis de respuestas en aplicaciones independientes en las que el resultado de la recuperación les llega directamente a los usuarios sin procesamiento del agente.

Disponibilidad y precios

¿Dónde está Foundry IQ disponible? ¿Cómo se factura?

Foundry IQ está sujeto a la disponibilidad regional y facturación de sus servicios subyacentes: Búsqueda de Azure AI y, si procede, Azure OpenAI en Foundry Models.

¿Foundry IQ es libre de usar?

Búsqueda de Azure AI ofrece un plan de tarifa gratuito y una asignación de tokens gratis para la recuperación de agentes. Foundry Agent Service no realiza cargos por las instancias de agentes.

Después de agotar la asignación gratuita, la recuperación mediante agentes se factura en función del consumo de tokens en Búsqueda de Azure AI. El uso de LLM para la planificación de consultas y la síntesis de respuestas incurre en cargos independientes de Azure OpenAI en Foundry Models.

Seguridad y gobernanza

¿Cómo controla Foundry IQ los permisos?

La aplicación de permisos varía según la fuente de conocimiento. En función del origen de datos, las fuentes de conocimiento indexadas pueden admitir la seguridad a nivel de documento mediante listas de control de acceso (ACL), control de acceso basado en roles o ambos. En el momento de la consulta, los resultados se filtran en función de la identidad del usuario.

Las fuentes de conocimiento remotas de SharePoint aplican permisos directamente a través de la API de recuperación de Copilot, con compatibilidad nativa para ACL y etiquetas de confidencialidad de Microsoft Purview.

¿Qué métodos de autenticación se admiten?

Para las conexiones entre Búsqueda de Azure AI y otros servicios de Azure (como Azure OpenAI o Azure Blob Storage), use identidades administradas con Microsoft Entra ID (recomendado) o claves de API.

Los orígenes de conocimiento remotos SharePoint requieren que los usuarios finales tengan una licencia de Microsoft 365 Copilot válida.

Solución de problemas

¿Por qué mi agente no devuelve resultados de mi base de conocimiento?

Entre las causas comunes se incluyen las siguientes:

  • Falta la invocación de herramientas en las instrucciones del agente.
  • Problemas de permisos entre el agente y la base de conocimiento.
  • Configuración incorrecta de la conexión del proyecto.
  • Orígenes de conocimiento vacíos o mal configurados.

Para obtener ayuda para aislar el problema, consulte Solución de problemas.

¿Cómo se depuran las consultas de la recuperación de agentes?

Use la zona de prueba de chat en el portal de Azure, que muestra los planes de consulta, las subconsultas y los pasos de recuperación de la base de conocimiento. Habilite el registro de diagnóstico para obtener datos detallados de solicitud/respuesta.

Productos relacionados

¿Cómo se relaciona Foundry IQ con Fabric IQ y Work IQ?

Microsoft proporciona tres cargas de trabajo de IQ para sistemas nativos del agente: Fabric IQ para el análisis empresarial, Work IQ para la colaboración de Microsoft 365 y Foundry IQ para conocimientos empresariales.

Cada carga de trabajo de IQ es independiente, pero ellas pueden trabajar conjuntamente para responder prácticamente a cualquier pregunta específica planteada por un agente de la organización.

¿Cuál es la diferencia entre los orígenes de conocimiento de Copilot y los orígenes de conocimiento de Foundry IQ?

El concepto es el mismo: conectar agentes a datos empresariales. Sin embargo, los orígenes de datos admitidos difieren en función de la plataforma y no son interoperables. En otras palabras, no puede usar fuentes de conocimiento de Foundry IQ en Copilot, y no puede usar fuentes de conocimiento de Copilot en Foundry IQ.