Azure OpenAI Assistants API (vista previa) (clásico)

Solo se aplica a:Portal de Foundry (clásico). Este artículo no está disponible para el nuevo portal de Foundry. Obtenga más información sobre el nuevo portal.

Nota

Los vínculos de este artículo pueden abrir contenido en la nueva documentación de Microsoft Foundry en lugar de la documentación de Foundry (clásico) que está viendo ahora.

Nota

La API de Asistentes está obsoleta y será retirada el 26 de agosto de 2026. Utiliza el servicio Microsoft Foundry Agents generalmente disponible. Sigue la guía de migración para actualizar tus cargas de trabajo. Más información.

Los asistentes, una característica de Azure OpenAI en Microsoft Foundry Models, están diseñados para facilitar a los desarrolladores la creación de aplicaciones con experiencias sofisticadas similares a copilot que pueden examinar datos, sugerir soluciones y automatizar tareas.

  • Los asistentes pueden llamar a los modelos de Azure OpenAI con instrucciones específicas para ajustar sus parámetros de personalidad y capacidades.
  • Los asistentes pueden acceder a varias herramientas en paralelo. Estas pueden ser herramientas hospedadas en Azure OpenAI, como el intérprete de código y la búsqueda de archivos, o herramientas que construyes, hospedas y accedes a través de llamadas de función.
  • Los asistentes pueden acceder a subprocesos persistentes. Los hilos simplifican el desarrollo de aplicaciones de IA al almacenar el historial de mensajes y truncarlo cuando la conversación supera la longitud del contexto del modelo. Cree un hilo una vez y anexe mensajes cuando los usuarios respondan.
  • Los asistentes pueden acceder a archivos en varios formatos. Ya sea como parte de su creación o como parte de subprocesos entre asistentes y usuarios. Al usar herramientas, los asistentes también pueden crear archivos (como imágenes o hojas de cálculo) y citar archivos a los que hacen referencia en los mensajes que crean.

Información general

Anteriormente, la creación de asistentes de IA personalizados necesitaba trabajo pesado incluso para desarrolladores experimentados. Aunque la API de finalizaciones de chat es ligera y eficaz, es intrínsecamente sin estado, lo que significa que los desarrolladores tenían que administrar el estado de la conversación y los subprocesos de chat, las integraciones de herramientas, los documentos e índices de recuperación y ejecutar código manualmente.

La API de asistentes, como evolución de la API de finalización de chat, proporciona una solución para estos desafíos. La API Assistants soporta subprocesos persistentes administrados automáticamente. Esto significa que, como desarrollador, ya no es necesario desarrollar sistemas de administración de estado de conversación y solucionar las restricciones de ventana de contexto de un modelo. La API assistants controlará automáticamente las optimizaciones para mantener el subproceso por debajo de la ventana de contexto máxima del modelo elegido. Una vez que creas un hilo, puedes agregar nuevos mensajes a medida que los usuarios responden. Los asistentes también pueden acceder a varias herramientas en paralelo, si es necesario. Estas herramientas incluyen:

Sugerencia

No hay ningún precio adicional ni cuota para usar asistentes a menos que use el intérprete de código o las herramientas de búsqueda de archivos .

La API assistants se basa en las mismas funcionalidades que potencian el producto GPT de OpenAI. Algunos casos de uso posibles van desde el recomendador de productos con tecnología de inteligencia artificial, la aplicación de analistas de ventas, el asistente de codificación, el bot de chat de preguntas y respuestas de los empleados, etc. Empiece a compilar en el área de juegos de asistentes sin código en el Portal de Foundry o empiece a compilar con la API.

Importante

La recuperación de datos no confiables mediante llamado a funciones, intérprete de código o búsqueda de archivos con entrada de archivos, y los subprocesos del Asistente podrían poner en peligro la seguridad de su Asistente o la aplicación que use el Asistente. Obtenga información sobre los enfoques de mitigación aquí.

Uso de asistentes

Para obtener información sobre el uso de asistentes, consulte la siguiente documentación de referencia.

Modelos disponibles

Para ver una lista de Azure modelos de OpenAI que puede usar con asistentes, consulte el artículo Models.

Área de juegos de asistentes

Antes de usar asistentes, necesita lo siguiente:

Componentes de asistentes

Diagrama que muestra los componentes de un asistente.

Componente Descripción
Asistente Inteligencia artificial personalizada que usa Azure modelos openAI junto con herramientas.
Subproceso Una sesión de conversación entre un Asistente y un usuario. Los hilos almacenan mensajes y manejan automáticamente el truncamiento para ajustarse al contenido en el contexto de un modelo.
Mensaje Mensaje creado por un Asistente o un usuario. Los mensajes pueden incluir texto, imágenes y otros archivos. Los mensajes se almacenan como una lista en el hilo.
Ejecutar Activación de un asistente para empezar a ejecutarse en función del contenido del subproceso. El Asistente usa su configuración y los mensajes del subproceso para realizar tareas llamando a modelos y herramientas. Como parte de una instancia de ejecución, el Asistente anexa mensajes al hilo.
Paso de ejecución Una lista detallada de los pasos que tomó el Asistente como parte de una ejecución. Un Asistente puede llamar a herramientas o crear mensajes durante su ejecución. Examinar los pasos de ejecución le permite comprender cómo el Asistente obtiene sus resultados finales.

Acceso a datos de asistentes

Actualmente, los asistentes, los subprocesos, los mensajes y los archivos creados para los asistentes se limitan al nivel de recursos de OpenAI Azure. Por lo tanto, cualquier persona con acceso al recurso de OpenAI o al acceso a la clave de API de Azure puede leer y escribir asistentes, subprocesos, mensajes y archivos.

Se recomienda encarecidamente los siguientes controles de acceso a datos:

  • Implemente la autorización. Antes de realizar lecturas o escrituras en asistentes, subprocesos, mensajes y archivos, asegúrese de que el usuario final esté autorizado para hacerlo.
  • Restrinja Azure acceso a recursos y claves de API de OpenAI. Considere detenidamente quién tiene acceso a Azure recursos de OpenAI donde se usan los asistentes y las claves de API asociadas.
  • Audite periódicamente qué cuentas o individuos tienen acceso al recurso de OpenAI de Azure. Las claves de API y el acceso a nivel de recurso permiten una amplia gama de operaciones, incluida la lectura y modificación de mensajes y archivos.
  • Habilite configuración de diagnóstico para permitir el seguimiento a largo plazo de determinados aspectos del registro de actividad del recurso openAI de Azure.

Parámetros

La API assistants admite varios parámetros que permiten personalizar la salida de los asistentes. El tool_choice parámetro permite forzar al Asistente a usar una herramienta especificada. También puede crear mensajes con el rol assistant para crear historiales de conversaciones personalizados en los subprocesos. temperature, top_p, response_format le permite ajustar aún más las respuestas. Para obtener más información, consulte la documentación de referencia .

Administración de ventanas de contexto

Los asistentes truncan automáticamente el texto para asegurarse de que permanece dentro de la longitud máxima del contexto del modelo. Puede personalizar este comportamiento especificando el número máximo de tokens que le gustaría utilizar y/o el número máximo de mensajes recientes que le gustaría incluir en un proceso.

Número máximo de tokens de finalización y de tokens de solicitud

Para controlar el uso del token en una sola ejecución, establezca max_prompt_tokens y max_completion_tokens al crear la ejecución. Estos límites se aplican al número total de tokens usados en todas las finalizaciones a lo largo del ciclo de vida de la ejecución.

Por ejemplo, iniciar una ejecución con max_prompt_tokens establecido en 500 y max_completion_tokens establecido en 1000 significa que la primera ejecución truncará el hilo a 500 tokens y limitará la salida a 1000 tokens. Si solo se usan 200 tokens de solicitud y 300 tokens de finalización en la primera finalización, la segunda finalización tendrá límites disponibles de 300 tokens de solicitud y 700 tokens de finalización.

Si una finalización alcanza el límite max_completion_tokens, la ejecución finalizará con un estado incompleto y se proporcionarán detalles en el campo incomplete_details del objeto Run.

Al usar la herramienta Búsqueda de archivos, se recomienda configurar el max_prompt_tokens a no menos de 20,000. Para conversaciones más largas o varias interacciones con la búsqueda de archivos, considere la posibilidad de aumentar este límite a 50 000, o lo ideal es quitar los max_prompt_tokens límites por completo para obtener los resultados de mayor calidad.

Estrategia de truncamiento

También puede especificar una estrategia de truncamiento para controlar cómo se debe representar el subproceso en la ventana de contexto del modelo. El uso de una estrategia de truncamiento de tipo auto usará la estrategia de truncamiento predeterminada de OpenAI. El uso de una estrategia de truncamiento de tipo last_messages le permitirá especificar el número de mensajes más recientes que se van a incluir en la ventana de contexto.

Consulte también