¿Qué es un origen de conocimiento?

Nota

Algunas características de recuperación agente están disponibles con carácter general en la API REST 2026-04-01 a través del acceso mediante programación. El portal de Azure y el portal de Microsoft Foundry continúan proporcionando acceso solo para vista previa a todas las funcionalidades de recuperación basada en agentes. Para obtener instrucciones de migración, incluido un desglose de lo que está disponible con carácter general y lo que permanece en versión preliminar, consulte Migración del código de recuperación agente a la versión más reciente.

Si decide usar una API REST en versión preliminar, puede acceder a las funcionalidades de recuperación agente que aún no están disponibles con carácter general. Las características en versión preliminar se proporcionan sin un contrato de nivel de servicio y no se recomiendan para cargas de trabajo de producción. Para más información, consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure.

Important

Estas características y funcionalidades forman parte de la API REST 2026-05-01-preview. La versión preliminar 2026-05-01-preview se le concede bajo licencia como parte de su suscripción de Azure y está sujeta a los términos aplicables a las "Versiones preliminares" establecidos en los Microsoft Product Terms, el Microsoft Products and Services Data Protection Addendum ("DPA") y los Términos de uso complementarios para las versiones preliminares de Microsoft Azure.

La 2026-05-01-preview admite conexiones a otros servicios de Microsoft y a servicios de terceros. El uso de estos servicios está sujeto a sus respectivos términos y podría dar lugar a procesamiento o almacenamiento de datos fuera del límite de cumplimiento de Azure, así como a los datos que fluyen a los límites de cumplimiento de Azure.

Es su responsabilidad gestionar si sus datos saldrán fuera de los límites geográficos y de cumplimiento normativo de su organización, así como cualquier implicación relacionada, y garantizar que se hayan establecido los permisos, límites y aprobaciones adecuados.

Es responsable de revisar y probar cuidadosamente las aplicaciones que compile en el contexto de sus casos de uso específicos y de tomar todas las decisiones y personalizaciones adecuadas. Esto incluye implementar sus propias mitigaciones de IA responsables, como metaprompts, filtros de contenido u otros sistemas de seguridad, y garantizar que las aplicaciones cumplan los estándares de calidad, confiabilidad, seguridad y confiabilidad adecuados. Para obtener más información, consulte la nota de transparencia Búsqueda de Azure AI.

Un origen de conocimiento es un recurso de nivel superior en el servicio de Búsqueda de Azure AI que define el contenido usado en una canalización de recuperación agente. Cada fuente de conocimiento está indexada o es remota, lo que determina cómo se ingiere, procesa y consulta el contenido. Los orígenes de conocimiento son componentes necesarios de una base de conocimiento.

Puede hacer referencia a varios orígenes de conocimiento en una sola base de conocimiento. El motor de recuperación basado en agentes consulta a todos ellos en una sola petición. Las subconsultas se generan para cada origen de conocimiento y los resultados principales se devuelven en la respuesta de recuperación.

Fuentes de conocimiento aceptadas

Búsqueda de Azure AI admite los siguientes orígenes de conocimiento para cargas de trabajo de recuperación agente.

Tipo Description Indizado o remoto
Índice de búsqueda Encapsula un índice existente. Indexado
Blob de Azure Genera un proceso de indexación a partir de un contenedor de blobs. Indexado
Azure SQL (versión preliminar) Genera una canalización de indexador a partir de una tabla o vista de Azure SQL. Indexado
Archivo (versión preliminar) Carga archivos directamente en Búsqueda de Azure AI. Indexado
OneLake Genera una canalización de indexador desde una instancia de LakeHouse. Indexado
SharePoint indexado (versión preliminar) Genera una canalización de indexador desde un sitio de SharePoint. Indexado
SharePoint remota (versión preliminar) Recupera contenido de SharePoint. Remoto
agente de datos de Fabric (versión preliminar) Recupera respuestas y recursos incrustados de un agente de datos de Microsoft Fabric. Remoto
Ontología de Fabric (versión preliminar) Recupera respuestas basadas en entidades y relaciones de una ontología de Microsoft Fabric. Remoto
Servidor MCP (versión preliminar) Recupera los resultados activos y respaldados por herramientas de un servidor MCP externo. Remoto
Work IQ (versión preliminar) Obtiene inteligencia organizativa de Work IQ. Remoto
Web Recupera datos de puesta en tierra en tiempo real de Microsoft Bing. Remoto

Orígenes de conocimiento indexados

Un origen de conocimiento indexado señala un índice de búsqueda que cumple los criterios para la recuperación agéntica. El contenido se ingiere en el índice antes del tiempo de consulta a través de una de las tres rutas de acceso:

  • Traiga su propio índice: Use un origen de conocimiento de índice de búsqueda para encapsular un índice existente en el servicio de búsqueda.

  • Carga directa de archivos: Use un origen de conocimiento de archivos para cargar archivos directamente en Búsqueda de Azure AI. El servicio procesa los archivos y almacena el contenido extraído en un índice de búsqueda generado, sin que se requiera ninguna canalización de indexador o almacenamiento externo.

  • Canalización del indexador generado automáticamente: Para todos los demás orígenes de conocimiento indexados, Búsqueda de Azure AI crea automáticamente una canalización completa del indexador desde el origen de datos externo. Esto incluye un origen de datos, un conjunto de aptitudes, un indexador y un índice que se rellenan y se fragmentan.

Las consultas se ejecutan localmente en el servicio de búsqueda mediante la palabra clave (texto completo), el vector o las consultas híbridas.

Orígenes de conocimiento remotos

Un origen de conocimiento remoto se conecta directamente a una plataforma externa. El contenido nunca se incorpora a Búsqueda de Azure AI. En su lugar, se recupera en el momento de la consulta a través de las API nativas de cada plataforma. El motor de recuperación agente realiza la llamada API y expone los resultados junto con cualquier origen de conocimiento indexado en la misma respuesta.

Dependiendo de la plataforma, las conexiones remotas llegan al contenido a través de la red pública de Internet (como Bing) o dentro del inquilino de Microsoft (como SharePoint y Fabric).

Clasificación unificada

Para los orígenes de conocimiento indexados y remotos, todo el contenido recuperado fluye a través de la misma canalización de clasificación. Los resultados se clasifican según su relevancia, se fusionan entre las distintas consultas y se reclasifican antes de devolverse en la respuesta de recuperación.

Trabajar con orígenes de conocimiento

Los orígenes de conocimiento son objetos independientes que se crean y administran independientemente de las bases de conocimiento. Tenga en cuenta lo siguiente:

  • Cree un origen de conocimiento antes de crear una base de conocimiento. Las bases de conocimiento hacen referencia a orígenes de conocimiento por identificador, por lo que el origen de conocimiento debe existir primero.

  • Para eliminar un origen de conocimiento, actualice primero o elimine las bases de conocimiento que hagan referencia a él. A continuación, puede eliminar el origen de conocimiento.

  • Un origen de conocimiento y su base de conocimiento deben existir en el mismo servicio de búsqueda.

Creación de orígenes de conocimiento

Para crear un origen de conocimiento, necesita permisos de colaborador del servicio de búsqueda en el servicio de búsqueda. Si la fuente de conocimiento genera una canalización del indexador, también necesitará permisos de Search Index Data Contributor para cargar un índice. Puede usar una clave de API de administrador como alternativa a las asignaciones de roles.

La compatibilidad con la creación en el portal de Azure, el portal de Microsoft Foundry, la API REST y la SDK de Azure varían según el tipo de origen de conocimiento. Para obtener instrucciones por tipo, consulte los vínculos de Orígenes de conocimiento admitidos.

Ingesta de etiquetas de confidencialidad (versión preliminar)

Para las fuentes de conocimiento de Blob, de OneLake indexadas y de SharePoint indexadas, puede incorporar etiquetas de confidencialidad de Microsoft Purview estableciendo ingestionPermissionOptions para incluir sensitivityLabel. Siga todos los requisitos previos antes de establecer este valor. Una vez sincronizados con el índice, las etiquetas se muestran en las respuestas recuperadas y se usan para aplicar el acceso de nivel de documento en el momento de la consulta. Para obtener más información, consulte Aplicar permisos en tiempo de consulta (versión preliminar).

Si la fuente de conocimientos indexada usa un índice fragmentado, por ejemplo, con vectorización integrada o una aptitud personalizada de División de texto, también debe asignar la etiqueta de confidencialidad a la fila de cada fragmento mediante proyecciones de índice en el conjunto de aptitudes. De lo contrario, las referencias a nivel de fragmento en las respuestas de recuperación no se devolverán si tienen etiquetas en el documento de origen.

Mostrar imágenes incrustadas en documentos (versión preliminar)

En los orígenes de conocimiento de blob, OneLake indexado y SharePoint indexado, puede configurar un elemento assetStore en el ingestionParameters del origen de conocimiento para conservar las imágenes incrustadas en los documentos de origen. Cuando también habilita servicio de imágenes en la base de conocimiento, la acción de recuperación inserta esas imágenes en la indicación de síntesis de respuestas para que el LLM pueda razonar con diagramas, gráficos y contenido extraído de las imágenes. Para obtener más información, consulte Mostrar imágenes incrustadas en documentos en recuperación de agentes (versión preliminar).

Uso de orígenes de conocimiento

Después de crear un origen de conocimiento, haga referencia a él en una base de conocimiento. La base de conocimiento determina qué orígenes de conocimiento se van a consultar. En las secciones siguientes se describen las opciones para controlar qué orígenes se incluyen y cómo selecciona el motor entre ellos.

Consultar siempre un origen de conocimiento

Establezca alwaysQuery en true en una definición de fuente de conocimiento para incluirla en cada consulta, independientemente del esfuerzo de razonamiento de recuperación.

Uso del esfuerzo de razonamiento de recuperación para controlar el uso de LLM (versión preliminar)

El esfuerzo de razonamiento de recuperación controla la cantidad de procesamiento de LLM que se aplica a cada consulta. No todas las soluciones se benefician del planeamiento de consultas LLM. Si la simplicidad y la velocidad son la prioridad, use minimal el esfuerzo para omitir el procesamiento de LLM. En low y medium esfuerzo, el LLM planea y selecciona qué orígenes de conocimiento se van a consultar, con medium la adición de un paso iterativo para obtener resultados más profundos. Para obtener más información sobre cada nivel, consulte Establecimiento del esfuerzo de razonamiento de recuperación (versión preliminar).

Los siguientes factores influyen en la selección en low y medium esfuerzo:

  • El name de la fuente de conocimientos.

  • El description de un índice (para fuentes de conocimiento indexadas).

  • El retrievalInstructions especificado en la definición de la base de conocimiento o la acción de recuperación. Las instrucciones de recuperación guían al LLM sobre qué fuentes de conocimiento seleccionar u omitir. Funcionan como un aviso: puede especificar brevedad, tono y formato.