Cómo funciona el chat en Agentic Retrieval en Foundry Local

En este artículo, chat es la interfaz de chat integrada para el usuario en Agentic Retrieval.

El chat ayuda a los usuarios a formular preguntas sobre su contenido y obtener respuestas fundamentadas con citas.

En este artículo se explica el chat en implementaciones combinadas y de agentes de la extensión Recuperación de agentes en Foundry local. Aprenderá qué pueden hacer los usuarios en el chat, cómo acceden los usuarios al chat y cómo funcionan el control de acceso y el flujo en tiempo de ejecución.

Qué pueden hacer los usuarios en el chat

Cuando los usuarios abren chat, pueden:

  • Empiece con una pantalla de bienvenida con un campo de entrada e indicaciones iniciales opcionales.
  • Use una barra lateral con el historial de conversaciones que admita el cambio de nombre y la eliminación.
  • Obtenga respuestas en streaming con Markdown, bloques de código y citas.
  • Inicie sesión con una cuenta de trabajo (Microsoft Entra ID) en implementaciones conectadas.
  • Usa el chat en implementaciones desconectadas o aisladas de la red, en las que se omite el inicio de sesión.

Chat en implementaciones combinadas y basadas en agentes

Si implementa Agentic Retrieval en implementaciones combinadas o agénticas, los usuarios finales acceden al chat desde la URL registrada de su aplicación Agentic Retrieval utilizando la ruta /chat.

El chat proporciona:

  • Conversaciones multiturno con agentes de inteligencia artificial.
  • Historial de hilos que se conserva para cada usuario.
  • Transmisión en tiempo real de respuestas mediante Eventos enviados por el servidor (SSE).
  • Visibilidad del paso de ejecución para que los usuarios puedan ver las herramientas y los orígenes de conocimiento que usó el agente.

Chat enruta las solicitudes a través de agentes, que pueden llamar a las bases de conocimiento y las herramientas de MCP antes de generar una respuesta.

Dirección URL de chat para los usuarios finales

Utilice la URL registrada para su aplicación Agentic Retrieval con /chat añadido al final. Por ejemplo: https://arcrag.contoso.com/chat.

Acceso a la colección y RBAC para chat

El control de acceso basado en roles de Azure (Azure RBAC) controla qué colecciones puede consultar cada usuario en el chat.

  • Los usuarios necesitan el EdgeRAGEndUser rol para iniciar sesión y usar chat.
  • Los usuarios también necesitan un rol de aplicación que coincida con cada nombre de colección al que deben tener acceso. La colección predeterminada es edgeragapp, por lo que los usuarios que consultan la colección predeterminada necesitan el edgeragapp rol de aplicación. Por ejemplo, el rol finance-docs de aplicación concede acceso a la colección finance-docs.
  • Los usuarios con EdgeRAGDeveloper pueden acceder a todas las colecciones.

Si un usuario tiene EdgeRAGEndUser pero no un rol de recopilación coincidente, las solicitudes de chat pueden devolver 403 Forbidden.

Para conocer los pasos de configuración, consulte Creación de roles de aplicación para el acceso a la recopilación.

Cómo encaja el chat en Recuperación de agentes

Chat es el punto de entrada orientado al usuario. Los usuarios escriben preguntas en el chat y, a continuación, los servicios de ejecución del backend recuperan contenido y generan respuestas fundamentadas.

Esta separación mantiene el chat sencillo mientras los servicios back-end controlan la orquestación, las comprobaciones de directivas y las reglas de acceso a datos.

Arquitectura y flujo del chat en tiempo de ejecución

En este diagrama se muestra la relación de alto nivel entre el usuario, el chat, los servicios en tiempo de ejecución y los orígenes de conocimiento.

Diagrama que muestra el flujo del chat del usuario al chat, servicios de tiempo de ejecución, agente y fuentes de conocimiento, con las respuestas devueltas al chat.

En la secuencia siguiente se muestra cómo una solicitud de usuario se mueve a través de servicios en tiempo de ejecución y se transmite de vuelta al chat.

Diagrama de secuencia del flujo integral de chat desde el usuario hasta el chat, pasando por los servicios de ejecución y las herramientas del agente, con respuestas en streaming devueltas al chat.

Ruta de identidad conectada

En las implementaciones conectadas, el explorador obtiene un token de usuario a través de Entra ID y lo envía a los servicios en tiempo de ejecución para validación y ámbito del usuario.

En implementaciones desconectadas o aisladas, el chat funciona sin iniciar sesión en Entra y el perímetro de red se convierte en el perímetro de confianza.