Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La API de OpenAI GPT en tiempo real de Azure ahora está generalmente disponible (GA). Esta guía de migración le ayuda a actualizar las aplicaciones existentes para usar el protocolo ga. La versión de disponibilidad general presenta cambios en el uso del SDK, las direcciones URL del punto de conexión, los nombres de eventos y la configuración de sesión.
Qué cambia: paquetes de SDK, formato de dirección URL de punto de conexión, nombres de eventos y estructura de configuración de sesión.
Lo que no cambia: funcionalidad básica, compatibilidad con formato de audio y funcionalidades del modelo.
Tiempo de migración: la mayoría de las migraciones tardan entre 30 y 60 minutos.
Importante
La versión preliminar de la API está en desuso a partir del 30 de abril de 2026. Migre a la versión de disponibilidad general antes de esta fecha para evitar interrupciones del servicio.
Nota
Si va a compilar una nueva aplicación, consulte el inicio rápido de la API en tiempo real en su lugar. Esta guía solo sirve para migrar aplicaciones de versión preliminar existentes a disponibilidad general.
Requisitos previos
Antes de comenzar la migración, compruebe que tiene:
- Un recurso existente de Azure OpenAI con una implementación de API Realtime que usa el protocolo Preview (Beta)
- Acceso al portal de Azure con permisos para administrar recursos de Azure OpenAI
- Capacidad de actualizar las dependencias del SDK en el entorno de desarrollo
- Un entorno de prueba en el que puede validar los cambios antes de realizar la implementación en producción
- Descripción de la implementación actual (WebSocket o WebRTC)
Compatibilidad con SDK
Para el protocolo de API GA en tiempo real, debe usar un SDK compatible y la versión correcta de la API.
Precaución
El protocolo de API de disponibilidad general en tiempo real y el formato de mensaje solo se admiten en los SDKs proporcionados por OpenAI. Los SDK de versión preliminar en tiempo real publicados anteriormente por Microsoft no admiten el protocolo de API de disponibilidad general.
Lista de SDK:
- TypeScript/JavaScript: https://github.com/openai/openai-node
- Python: https://github.com/openai/openai-python
- Java (solo formato de mensaje): https://github.com/openai/openai-java
- Go (solo formato de mensaje): https://github.com/openai/openai-go
- .NET: https://github.com/openai/openai-dotnet
Importante
Debe usar OpenAI .NET v.2.9.0 o posterior. El protocolo de API de Google Analytics en tiempo real no se admite en versiones anteriores.
Versión de API / URL base.
Utiliza el formato de URL del punto de conexión de disponibilidad general en tus aplicaciones. Esta dirección URL debe contener /openai/v1 y no debe contener ninguna versión de API como 2025-04-01-preview.
Ejemplo de formato de punto de conexión de disponibilidad general:
https://<your-resource>.openai.azure.com/openai/v1/
Consulte información detallada sobre el formato del punto de conexión en este artículo. Vea un ejemplo de uso de formato de punto de conexión de GA en Inicio rápido en la API de GPT Realtime API para voz y audio.
Actualización de puntos de conexión de WebRTC
Si usa WebRTC para audio en tiempo real basado en explorador, debe actualizar dos puntos de conexión a las versiones de disponibilidad general.
Ahora se crean claves efímeras para solicitudes WebRTC con una solicitud POST /openai/v1/realtime/client_secrets en el punto de conexión de OpenAI de Azure (consulte los detalles de Guía paso a paso).
La dirección URL para inicializar la conexión WebRTC en el explorador es ahora /openai/v1/realtime/calls (consulte los detalles de la guía paso a paso).
Cambios de protocolo para clientes personalizados
Si implementa el protocolo de API en tiempo real en su propio cliente en lugar de usar los SDK oficiales, revise estos cambios detallados del protocolo.
OpenAI-Beta encabezado
No incluya el OpenAI-Beta: encabezado en ninguna de las solicitudes.
Eventos modificados
Las sesiones de conversión de voz a voz y transcripción en tiempo real ahora usan el mismo session.update evento. Este evento tiene un nuevo type campo con los siguientes valores posibles:
-
realtimepara conversión de voz a voz -
transcriptionpara la transcripción de audio en tiempo real
Consulte el siguiente ejemplo de fragmento de código:
ws.on("open", function open() {
ws.send(
JSON.stringify({
type: "session.update",
session: {
type: "realtime",
model: "gpt-realtime",
// ... additional configuration
El evento session.update cambió de formato, y algunas propiedades ahora están en diferentes ubicaciones. Consulte la referencia de API para obtener más información.
Se cambiaron los siguientes nombres de evento:
- De
response.text.deltaaresponse.output_text.delta - De
response.audio.deltaaresponse.output_audio.delta - De
response.audio_transcript.deltaaresponse.output_audio_transcript.delta
Ahora todos los eventos de elemento de conversación tienen el campo object=realtime.item.
Se puede agregar un campo de estado al elemento de salida de la llamada de función. Este campo no tiene ningún efecto en la conversación.
Los tipos del contenido del mensaje para las respuestas del asistente cambiaron de la siguiente manera:
- De
type=textatype=output_text - De
type=audioatype=output_audio
Nuevos eventos
Los eventos conversation.item.added y conversation.item.done se agregaron para controlar mejor las operaciones de larga duración, como el listado de herramientas MCP.
Solución de problemas
En esta sección se tratan los problemas comunes detectados durante la migración y sus soluciones.
La conexión de WebSocket devuelve 401 No autorizado
Síntoma: La conexión falla con un error de autenticación tras la actualización al endpoint de disponibilidad general.
Causa: el api-version parámetro de consulta ya no se admite en las direcciones URL del punto de conexión de GA.
Solución: Elimine api-version de la dirección URL del punto de conexión. Cambiar de:
wss://<resource>.openai.azure.com/openai/realtime?api-version=2025-04-01-preview
Para:
wss://<resource>.openai.azure.com/openai/v1/realtime
Controladores de eventos no se activan
Síntoma: las respuestas de audio o texto no se procesan después de la migración.
Causa: Los nombres de evento cambiaron entre versiones preliminares y de disponibilidad general.
Solución: actualice los nombres del controlador de eventos según los nuevos nombres de evento. Asegúrese de actualizar todas las ocurrencias, incluidos los controladores de errores.
Configuración de sesión rechazada
Síntoma: el servidor devuelve un error al enviar el session.update evento.
Causa: falta el campo obligatorio type en la configuración de sesión.
Solución: agregue el type campo a la configuración de sesión con el valor "realtime" de voz a voz o "transcription" para la transcripción de audio.
No se puede establecer la conexión WebRTC
Síntoma: la conexión WebRTC basada en explorador no se establece después de la migración.
Causa: Los puntos de conexión de WebRTC cambiaron en la versión de disponibilidad general.
Solución: actualice tanto el punto de conexión de la clave efímera como la dirección URL de conexión.
error de compatibilidad del SDK de .NET
Symptom: .NET aplicación produce errores al intentar usar el protocolo GA.
Cause: el protocolo ga requiere openAI .NET SDK versión 2.9.0 o posterior.
Solution: actualice el paquete del SDK de .NET a la versión 2.9.0 o posterior mediante:
dotnet add package OpenAI --version 2.9.0
Lista de comprobación
Use esta lista de comprobación para comprobar que la migración se ha completado:
- SDK actualizado a la versión compatible con GA (Python ≥1.54.0, JavaScript ≥4.77.0, .NET ≥2.9.0)
- Direcciones URL del endpoint cambiadas al formato
/openai/v1/realtime -
api-versionparámetro de consulta quitado de las direcciones URL del punto de conexión - Nombres de evento actualizados (
response.text.delta→response.output_text.delta, etc.) -
typecampo agregado a lasession.updateconfiguración de eventos -
OpenAI-Betaencabezado quitado de implementaciones de cliente personalizadas - Puntos de conexión de WebRTC actualizados (si procede)
- Aplicación probada correctamente en un entorno que no es de producción
- Entrada de audio y salida comprobadas para que funcionen correctamente
- No hay advertencias de desaprobación en los registros de la aplicación
- Las métricas de rendimiento cumplen o superan las expectativas de línea base
Pasos siguientes
Al migrar a la versión de disponibilidad general de la API en tiempo real, explore estos recursos para mejorar la implementación:
- Referencia de API en tiempo real : documentación completa de la API
- Guía de implementación de WebSocket : configuración detallada de WebSocket
- Guía de implementación de WebRTC : implementación de audio basada en explorador
- Integración SIP - habilitar la integración de llamadas telefónicas
- Inicio rápido de api en tiempo real : ejemplos de implementación adicionales
- Precios de Azure OpenAI: información de costes y facturación