Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo, chat es la interfaz de chat integrada para el usuario en Agentic Retrieval.
El chat ayuda a los usuarios a formular preguntas sobre su contenido y obtener respuestas fundamentadas con citas.
En este artículo se explica el chat en implementaciones combinadas y de agentes de la extensión Recuperación de agentes en Foundry local. Aprenderá qué pueden hacer los usuarios en el chat, cómo acceden los usuarios al chat y cómo funcionan el control de acceso y el flujo en tiempo de ejecución.
Qué pueden hacer los usuarios en el chat
Cuando los usuarios abren chat, pueden:
- Empiece con una pantalla de bienvenida con un campo de entrada e indicaciones iniciales opcionales.
- Use una barra lateral con el historial de conversaciones que admita el cambio de nombre y la eliminación.
- Obtenga respuestas en streaming con Markdown, bloques de código y citas.
- Inicie sesión con una cuenta de trabajo (Microsoft Entra ID) en implementaciones conectadas.
- Usa el chat en implementaciones desconectadas o aisladas de la red, en las que se omite el inicio de sesión.
Chat en implementaciones combinadas y basadas en agentes
Si implementa Agentic Retrieval en implementaciones combinadas o agénticas, los usuarios finales acceden al chat desde la URL registrada de su aplicación Agentic Retrieval utilizando la ruta /chat.
El chat proporciona:
- Conversaciones multiturno con agentes de inteligencia artificial.
- Historial de hilos que se conserva para cada usuario.
- Transmisión en tiempo real de respuestas mediante Eventos enviados por el servidor (SSE).
- Visibilidad del paso de ejecución para que los usuarios puedan ver las herramientas y los orígenes de conocimiento que usó el agente.
Chat enruta las solicitudes a través de agentes, que pueden llamar a las bases de conocimiento y las herramientas de MCP antes de generar una respuesta.
Dirección URL de chat para los usuarios finales
Utilice la URL registrada para su aplicación Agentic Retrieval con /chat añadido al final. Por ejemplo: https://arcrag.contoso.com/chat.
Acceso a la colección y RBAC para chat
El control de acceso basado en roles de Azure (Azure RBAC) controla qué colecciones puede consultar cada usuario en el chat.
- Los usuarios necesitan el
EdgeRAGEndUserrol para iniciar sesión y usar chat. - Los usuarios también necesitan un rol de aplicación que coincida con cada nombre de colección al que deben tener acceso. La colección predeterminada es
edgeragapp, por lo que los usuarios que consultan la colección predeterminada necesitan eledgeragapprol de aplicación. Por ejemplo, el rolfinance-docsde aplicación concede acceso a la colecciónfinance-docs. - Los usuarios con
EdgeRAGDeveloperpueden acceder a todas las colecciones.
Si un usuario tiene EdgeRAGEndUser pero no un rol de recopilación coincidente, las solicitudes de chat pueden devolver 403 Forbidden.
Para conocer los pasos de configuración, consulte Creación de roles de aplicación para el acceso a la recopilación.
Cómo encaja el chat en Recuperación de agentes
Chat es el punto de entrada orientado al usuario. Los usuarios escriben preguntas en el chat y, a continuación, los servicios de ejecución del backend recuperan contenido y generan respuestas fundamentadas.
Esta separación mantiene el chat sencillo mientras los servicios back-end controlan la orquestación, las comprobaciones de directivas y las reglas de acceso a datos.
Arquitectura y flujo del chat en tiempo de ejecución
En este diagrama se muestra la relación de alto nivel entre el usuario, el chat, los servicios en tiempo de ejecución y los orígenes de conocimiento.
En la secuencia siguiente se muestra cómo una solicitud de usuario se mueve a través de servicios en tiempo de ejecución y se transmite de vuelta al chat.
Ruta de identidad conectada
En las implementaciones conectadas, el explorador obtiene un token de usuario a través de Entra ID y lo envía a los servicios en tiempo de ejecución para validación y ámbito del usuario.
En implementaciones desconectadas o aisladas, el chat funciona sin iniciar sesión en Entra y el perímetro de red se convierte en el perímetro de confianza.