Modelos de Claude en Microsoft Foundry (versión preliminar)

Los modelos Claude de Anthropic aportan capacidades avanzadas de IA conversacional a Microsoft Foundry, al proporcionar comprensión y generación del lenguaje de última generación para aplicaciones inteligentes. Los modelos de Claude se destacan en razonamiento complejo, generación de código y tareas multimodales, incluido el análisis de imágenes. En este artículo se describen los modelos de Claude disponibles, cómo se hospedan y facturan, su superficie de API, funcionalidades, cuotas y procedimientos recomendados.

Para implementar y llamar a un modelo de Claude, consulte Implementación y uso de modelos de Claude en Microsoft Foundry.

Modelos de Claude disponibles

Los modelos de Claude en Foundry incluyen:

Familia de modelos Models
Claude Mythos claude-mythos-5 1 (versión preliminar de investigación cerrada), claude-mythos-preview1 (versión preliminar de investigación cerrada)
Claude Fable claude-fable-5 (versión preliminar)
Claude Opus claude-opus-4-8 2 (versión preliminar), claude-opus-4-7 (versión preliminar), claude-opus-4-6 (versión preliminar), claude-opus-4-5 (versión preliminar), claude-opus-4-1 (versión preliminar)
Claude Sonnet claude-sonnet-4-6 (versión preliminar), claude-sonnet-4-5 (versión preliminar)
Claude Haiku claude-haiku-4-5 (versión preliminar)

1Claude Mythos 5 y Claude Mythos Preview solo están disponibles como versión preliminar de investigación cerrada. El acceso a los modelos se concede únicamente a la discreción de Anthropic y se da prioridad a los casos de uso de ciberseguridad defensiva. Consulta la tarjeta del sistema De vista previa de Claude Mythos y la tarjeta del sistema Claude Mythos 5 para obtener una guía de uso responsable.

2 Siga la guía de migración para migrar el código de la API messages de Claude Opus 4.7 a Claude Opus 4.8.

Para obtener más información sobre las funcionalidades del modelo, consulte funcionalidades de los modelos de Claude.

Superficie de la API

Use los SDKs Anthropic y las siguientes APIs de Claude:

  • API de mensajes: envíe una lista estructurada de mensajes de entrada con contenido de texto o imagen. El modelo genera el siguiente mensaje en la conversación.
  • API de recuento de tokens: cuente el número de tokens de un mensaje.
  • API de archivos: cargue y administre archivos para su uso con la API de Claude sin volver a cargar contenido con cada solicitud.
  • Skills API: cree aptitudes personalizadas para Claude AI.

Puede llamar a la API de Messages desde el paquete anthropic de Python, el paquete @anthropic-ai/foundry-sdk de JavaScript o directamente mediante REST. El punto de conexión de implementación tiene la forma https://<resource-name>.services.ai.azure.com/anthropic/v1/messages, y los clientes REST y JavaScript usan el encabezado anthropic-version: 2023-06-01.

Comparación de modelos de Claude

Foundry admite modelos de Claude a través de la implementación estándar global. Use la tabla siguiente para comparar modelos y, a continuación, consulte Funcionalidades para obtener más información sobre las características a las que se hace referencia en la tabla.

Warning

La versión beta de contexto de 1M en Claude Sonnet 4.5 se retiró el 30 de abril de 2026.

A partir del 1 de mayo de 2026:

  • Las solicitudes superiores a 200 000 tokens que incluyen el context-1m-2025-08-07 encabezado beta en Sonnet 4.5 devuelven un error.
  • Las solicitudes de 200 000 tokens o menos permanecen sin verse afectadas, incluso con el encabezado presente.

Para migrar, quite el encabezado beta context-1m-2025-08-07 de sus solicitudes. En el caso de las cargas de trabajo que requieren un contexto de 1M, migre a Claude Sonnet 4.6 (donde el contexto 1M está disponible con carácter general) o a Claude Opus 4.6 o Claude Opus 4.7 para cargas de trabajo de inteligencia superior.

Modelo Ventana de contexto/Salida máxima Principales funcionalidades Más adecuado para
claude-mythos-5 1 (versión preliminar de investigación restringida) 1M/128K
  • Pensamiento adaptable
  • Entrada de imagen y texto
  • Autenticación solo con Microsoft Entra ID
  • Biología y ciencias de la vida
  • Ciberseguridad (casos de uso defensivos priorizados): detección de vulnerabilidades, auditoría de superficie expuesta a ataques, formación de equipos rojos, inteligencia sobre amenazas
  • Codificación autónoma
  • Agentes de larga duración
claude-fable-5 (versión preliminar) 1M/128K
  • Pensamiento adaptable
  • Razonamiento sobre bases de código completas y el contexto de proyectos de varios días
  • Más trabajo autónomo que cualquier modelo anterior de Claude
  • Autoverificación
  • Orquestación de subagentes
  • Rechazo stop_reason de políticas de salvaguardia de doble uso2
  • Cybersecurity
  • Codificación autónoma
  • Agentes de larga duración
  • Codificación y agentes, con un razonamiento más profundo para los flujos de trabajo empresariales
claude-mythos-preview 1 (versión preliminar de investigación restringida) 1M/128K
  • Pensamiento adaptable
  • Entrada de imagen y texto
  • Solo con autenticación de Microsoft Entra ID
  • Ciberseguridad (casos de uso defensivos con prioridad)
  • Codificación autónoma
  • Agentes de larga duración
claude-opus-4-8 3 (versión preliminar) 1M/128K
  • Pensamiento adaptable con xhigh nivel de esfuerzo
  • Razonamiento aplicado a bases de código completas y al contexto del proyecto de varios días
  • Entrada de imagen de alta resolución (hasta 2576px / 3,75MP)
  • Coding
  • Agentes de larga duración
  • Análisis financiero
  • Cybersecurity
  • Uso del equipo
claude-opus-4-7 (versión preliminar) 1M/128K
  • Pensamiento adaptable
  • Razonamiento sobre bases de código completas
  • Entrada de imagen de alta resolución (hasta 2576px / 3,75MP)
  • Coding
  • Flujos de trabajo empresariales
  • Agentes de larga duración
  • Razonamiento multimodal
  • Análisis financiero
  • Cybersecurity
claude-opus-4-6 (versión preliminar) 1M/128K
  • Pensamiento adaptable
  • Entrada de imagen y texto
  • Uso del equipo
  • Uso avanzado de herramientas (búsqueda, llamada mediante programación, ejemplos)
  • Coding
  • Agentes empresariales
claude-opus-4-5 (versión preliminar) 200 000 / 64 000
  • Pensamiento ampliado
  • Entrada de imagen y texto
  • Uso del equipo
  • Uso avanzado de herramientas (búsqueda, llamada mediante programación, ejemplos)
  • Coding
  • Agentes
  • Uso del equipo
  • Flujos de trabajo empresariales
claude-opus-4-1 (versión preliminar) 200 000 /32 000
  • Pensamiento ampliado
  • Entrada de imagen y texto
  • Coding
  • Tareas de larga duración
claude-sonnet-4-6 (versión preliminar) 1M/128K
  • Pensamiento adaptable
  • Entrada de imagen y texto
  • Uso del equipo
  • Uso avanzado de herramientas (búsqueda, llamada mediante programación, ejemplos)
  • Coding
  • Agentes
  • Flujos de trabajo empresariales
claude-sonnet-4-5 (versión preliminar) 200 000 / 64 000
  • Pensamiento ampliado
  • Entrada de imagen y texto
  • Uso del equipo
  • Agentes y tareas complejas de largo alcance
  • Cargas de trabajo de gran volumen
claude-haiku-4-5 (versión preliminar) 200 000 / 64 000
  • Pensamiento ampliado
  • Entrada de imagen y texto
  • Coding
  • Agentes

1Claude Mythos 5 y Claude Mythos Preview solo están disponibles como versión preliminar de investigación cerrada. El acceso a los modelos se concede únicamente a la discreción de Anthropic y se da prioridad a los casos de uso de ciberseguridad defensiva. Consulta la tarjeta del sistema De vista previa de Claude Mythos y la tarjeta del sistema Claude Mythos 5 para obtener una guía de uso responsable.

2 Claude Fable 5 aplica clasificadores adicionales de entrada y salida que pueden rechazar las solicitudes cuyos contenidos desencadenan directivas de protección de doble uso. Cuando se produce una denegación, la solicitud devuelve una respuesta correcta (200) con un indicador stop_reason: "refusal" de denegación en lugar de contenido generado por el modelo. No se facturan los tokens de entrada que son rechazados.

3 Siga la guía de migración para migrar el código de la API messages de Claude Opus 4.7 a Claude Opus 4.8.

Capabilities

Los modelos de Claude en Foundry exponen dos tipos de funcionalidades: funcionalidades básicas para el procesamiento, el análisis y la generación de contenido, y herramientas que permiten a Claude interactuar con sistemas externos.

Capacidades principales

Las funcionalidades principales mejoran las capacidades fundamentales de Claude para el procesamiento, el análisis y la generación de contenido. Foundry admite las siguientes funcionalidades básicas para Claude:

  • Ventana de contexto grande: Una ventana de contexto extendida que procesa documentos más grandes y conversaciones más largas.

  • Entrada de imagen y texto: Visión sólida para analizar gráficos, gráficos, diagramas técnicos, informes y otros recursos visuales.

  • Generación de código: Generación, análisis y depuración de código avanzados.

  • Aptitudes del agente: Amplíe las capacidades de Claude con habilidades.

  • Citas: Las respuestas de Ground Claude en los documentos de origen.

  • Compatibilidad con PDF: Procese y analice el texto y el contenido visual de los documentos PDF.

  • Edición de contexto: Administre automáticamente el contexto de conversación con estrategias configurables.

  • Pensamiento extendido: Razonamiento mejorado para tareas complejas, disponible con todos los modelos de Claude. En la tabla siguiente se muestran los tipos de parámetro que thinking admite cada modelo. El adaptive tipo permite al modelo decidir si debe pensar, en función de la complejidad de la consulta y el nivel de esfuerzo.

    Modelo adaptive enabled disabled
    claude-mythos-5 No No
    claude-fable-5 No No
    claude-mythos-preview No
    claude-opus-4-8 No
    claude-opus-4-7 No
    claude-opus-4-6
    claude-sonnet-4-6
  • Esfuerzo: Capacidad de controlar el equilibrio de calidad/costo de las respuestas. Use este parámetro con o sin habilitar el pensamiento. En la tabla siguiente se muestran los niveles que effort admite cada modelo. El xhigh nivel genera el mismo resultado que max.

    Modelo low medium high max xhigh
    claude-mythos-5 No
    claude-fable-5 No
    claude-opus-4-8
    claude-opus-4-7
    claude-opus-4-6 No
    claude-sonnet-4-6 No

Herramientas

Las herramientas permiten a Claude interactuar con sistemas externos, ejecutar código y realizar tareas automatizadas. Foundry admite las siguientes herramientas para Claude:

  • Conector MCP: Conéctese a servidores MCP remotos directamente desde la API messages sin un cliente MCP independiente.
  • Memoria: Almacenar y recuperar información entre conversaciones. Cree bases de conocimiento a lo largo del tiempo, mantenga el contexto del proyecto y aprenda de las interacciones anteriores.
  • Captura web: Recupere contenido completo de páginas web y documentos PDF especificados para el análisis detallado.

Para obtener una lista completa de las funcionalidades y herramientas admitidas, consulte información general sobre las características de Claude.

Soporte para agentes

Cómo se hospedan y facturan los modelos de Claude

Claude se ofrece a través de Foundry Models de socios y de la comunidad. Los modelos de asociados y comunidad que no se venden por Azure son Productos no Microsoft en los Términos del producto.

La implementación de un modelo de Claude requiere una suscripción Azure Marketplace. Asegúrese de que tiene los permisos necesarios para suscribirse a las ofertas de modelo antes de implementar.

Cuotas, límites de cuota y regiones

Los modelos de Claude están disponibles para la implementación global estándar en las siguientes regiones:

  • EE. UU. Este 2
  • Centro de Suecia

Los límites de velocidad de los modelos de Claude en Foundry se miden en tokens por minuto (TPM) y solicitudes por minuto (RPM). Los valores son diferentes en función del tipo de suscripción, como se muestra en la tabla siguiente. Para aumentar la cuota más allá de los límites predeterminados, envíe una solicitud mediante el formulario de solicitud de aumento de cuota.

Pago por uso

Modelo Tipo de implementación RPM TPM
claude-fable-5 Estándar global 0 0
claude-opus-4-8 Estándar global 40 40,000
claude-opus-4-7 Estándar global 40 40,000
claude-opus-4-6 Estándar global 40 40,000
claude-opus-4-5 Estándar global 40 40,000
claude-opus-4-1 Estándar global 40 40,000
claude-sonnet-4-6 Estándar global 80 80,000
claude-sonnet-4-5 Estándar global 80 80,000
claude-haiku-4-5 Estándar global 80 80,000

Consideraciones sobre IA responsable

Al usar modelos de Claude en Foundry, tenga en cuenta estas prácticas de inteligencia artificial responsables:

procedimientos recomendados

Siga estos procedimientos recomendados al trabajar con modelos de Claude en Foundry:

Ingeniería rápida

  • Instrucciones claras: Proporcione avisos específicos y detallados.
  • Administración de contextos: use la ventana de contexto disponible de forma eficaz.
  • Definiciones de los roles: Use los mensajes del sistema para definir el rol y el comportamiento del asistente.
  • Avisos estructurados: use formato coherente para obtener mejores resultados.

Optimización de costos

Para optimizar el uso y evitar la limitación de velocidad:

  • Implementar lógica de reintento: controle 429 respuestas con retroceso exponencial.
  • Solicitudes por lotes: combine varias solicitudes siempre que sea posible.
  • Supervisión del uso de tokens: realice un seguimiento del consumo de tokens y los patrones de solicitud.
  • Usar modelos adecuados: use el modelo más rentable para su caso de uso. Consulte Modelos de Claude disponibles.