Modelos de Claude en Microsoft Foundry (versión preliminar)

Los modelos Claude de Anthropic aportan capacidades avanzadas de IA conversacional a Microsoft Foundry, al proporcionar comprensión y generación del lenguaje de última generación para aplicaciones inteligentes. Los modelos de Claude se destacan en razonamiento complejo, generación de código y tareas multimodales, incluido el análisis de imágenes. En este artículo se describen los modelos de Claude disponibles, cómo se hospedan y facturan, su superficie de API, funcionalidades, cuotas y procedimientos recomendados.

Para implementar y llamar a un modelo de Claude, consulte Implementación y uso de modelos de Claude en Microsoft Foundry.

Modelos de Claude disponibles

Los modelos de Claude en Foundry incluyen:

Familia de modelos	Models
Claude Mythos	`claude-mythos-5` ¹ (versión preliminar de investigación cerrada), `claude-mythos-preview`¹ (versión preliminar de investigación cerrada)
Claude Fable	`claude-fable-5` (versión preliminar)
Claude Opus	`claude-opus-4-8` ² (versión preliminar), `claude-opus-4-7` (versión preliminar), `claude-opus-4-6` (versión preliminar), `claude-opus-4-5` (versión preliminar), `claude-opus-4-1` (versión preliminar)
Claude Sonnet	`claude-sonnet-4-6` (versión preliminar), `claude-sonnet-4-5` (versión preliminar)
Claude Haiku	`claude-haiku-4-5` (versión preliminar)

¹Claude Mythos 5 y Claude Mythos Preview solo están disponibles como versión preliminar de investigación cerrada. El acceso a los modelos se concede únicamente a la discreción de Anthropic y se da prioridad a los casos de uso de ciberseguridad defensiva. Consulta la tarjeta del sistema De vista previa de Claude Mythos y la tarjeta del sistema Claude Mythos 5 para obtener una guía de uso responsable.

² Siga la guía de migración para migrar el código de la API messages de Claude Opus 4.7 a Claude Opus 4.8.

Para obtener más información sobre las funcionalidades del modelo, consulte funcionalidades de los modelos de Claude.

Superficie de la API

Use los SDKs Anthropic y las siguientes APIs de Claude:

API de mensajes: envíe una lista estructurada de mensajes de entrada con contenido de texto o imagen. El modelo genera el siguiente mensaje en la conversación.
API de recuento de tokens: cuente el número de tokens de un mensaje.
API de archivos: cargue y administre archivos para su uso con la API de Claude sin volver a cargar contenido con cada solicitud.
Skills API: cree aptitudes personalizadas para Claude AI.

Puede llamar a la API de Messages desde el paquete anthropic de Python, el paquete @anthropic-ai/foundry-sdk de JavaScript o directamente mediante REST. El punto de conexión de implementación tiene la forma https://<resource-name>.services.ai.azure.com/anthropic/v1/messages, y los clientes REST y JavaScript usan el encabezado anthropic-version: 2023-06-01.

Comparación de modelos de Claude

Foundry admite modelos de Claude a través de la implementación estándar global. Use la tabla siguiente para comparar modelos y, a continuación, consulte Funcionalidades para obtener más información sobre las características a las que se hace referencia en la tabla.

Warning

La versión beta de contexto de 1M en Claude Sonnet 4.5 se retiró el 30 de abril de 2026.

A partir del 1 de mayo de 2026:

Las solicitudes superiores a 200 000 tokens que incluyen el context-1m-2025-08-07 encabezado beta en Sonnet 4.5 devuelven un error.
Las solicitudes de 200 000 tokens o menos permanecen sin verse afectadas, incluso con el encabezado presente.

Para migrar, quite el encabezado beta context-1m-2025-08-07 de sus solicitudes. En el caso de las cargas de trabajo que requieren un contexto de 1M, migre a Claude Sonnet 4.6 (donde el contexto 1M está disponible con carácter general) o a Claude Opus 4.6 o Claude Opus 4.7 para cargas de trabajo de inteligencia superior.

Modelo	Ventana de contexto/Salida máxima	Principales funcionalidades	Más adecuado para
`claude-mythos-5` ¹ (versión preliminar de investigación restringida)	1M/128K	Pensamiento adaptable Entrada de imagen y texto Autenticación solo con Microsoft Entra ID	Biología y ciencias de la vida Ciberseguridad (casos de uso defensivos priorizados): detección de vulnerabilidades, auditoría de superficie expuesta a ataques, formación de equipos rojos, inteligencia sobre amenazas Codificación autónoma Agentes de larga duración
`claude-fable-5` (versión preliminar)	1M/128K	Pensamiento adaptable Razonamiento sobre bases de código completas y el contexto de proyectos de varios días Más trabajo autónomo que cualquier modelo anterior de Claude Autoverificación Orquestación de subagentes Rechazo `stop_reason` de políticas de salvaguardia de doble uso²	Cybersecurity Codificación autónoma Agentes de larga duración Codificación y agentes, con un razonamiento más profundo para los flujos de trabajo empresariales
`claude-mythos-preview` ¹ (versión preliminar de investigación restringida)	1M/128K	Pensamiento adaptable Entrada de imagen y texto Solo con autenticación de Microsoft Entra ID	Ciberseguridad (casos de uso defensivos con prioridad) Codificación autónoma Agentes de larga duración
`claude-opus-4-8` ³ (versión preliminar)	1M/128K	Pensamiento adaptable con `xhigh` nivel de esfuerzo Razonamiento aplicado a bases de código completas y al contexto del proyecto de varios días Entrada de imagen de alta resolución (hasta 2576px / 3,75MP)	Coding Agentes de larga duración Análisis financiero Cybersecurity Uso del equipo
`claude-opus-4-7` (versión preliminar)	1M/128K	Pensamiento adaptable Razonamiento sobre bases de código completas Entrada de imagen de alta resolución (hasta 2576px / 3,75MP)	Coding Flujos de trabajo empresariales Agentes de larga duración Razonamiento multimodal Análisis financiero Cybersecurity
`claude-opus-4-6` (versión preliminar)	1M/128K	Pensamiento adaptable Entrada de imagen y texto Uso del equipo Uso avanzado de herramientas (búsqueda, llamada mediante programación, ejemplos)	Coding Agentes empresariales
`claude-opus-4-5` (versión preliminar)	200 000 / 64 000	Pensamiento ampliado Entrada de imagen y texto Uso del equipo Uso avanzado de herramientas (búsqueda, llamada mediante programación, ejemplos)	Coding Agentes Uso del equipo Flujos de trabajo empresariales
`claude-opus-4-1` (versión preliminar)	200 000 /32 000	Pensamiento ampliado Entrada de imagen y texto	Coding Tareas de larga duración
`claude-sonnet-4-6` (versión preliminar)	1M/128K	Pensamiento adaptable Entrada de imagen y texto Uso del equipo Uso avanzado de herramientas (búsqueda, llamada mediante programación, ejemplos)	Coding Agentes Flujos de trabajo empresariales
`claude-sonnet-4-5` (versión preliminar)	200 000 / 64 000	Pensamiento ampliado Entrada de imagen y texto Uso del equipo	Agentes y tareas complejas de largo alcance Cargas de trabajo de gran volumen
`claude-haiku-4-5` (versión preliminar)	200 000 / 64 000	Pensamiento ampliado Entrada de imagen y texto	Coding Agentes

² Claude Fable 5 aplica clasificadores adicionales de entrada y salida que pueden rechazar las solicitudes cuyos contenidos desencadenan directivas de protección de doble uso. Cuando se produce una denegación, la solicitud devuelve una respuesta correcta (200) con un indicador stop_reason: "refusal" de denegación en lugar de contenido generado por el modelo. No se facturan los tokens de entrada que son rechazados.

³ Siga la guía de migración para migrar el código de la API messages de Claude Opus 4.7 a Claude Opus 4.8.

Capabilities

Los modelos de Claude en Foundry exponen dos tipos de funcionalidades: funcionalidades básicas para el procesamiento, el análisis y la generación de contenido, y herramientas que permiten a Claude interactuar con sistemas externos.

Capacidades principales

Las funcionalidades principales mejoran las capacidades fundamentales de Claude para el procesamiento, el análisis y la generación de contenido. Foundry admite las siguientes funcionalidades básicas para Claude:

Ventana de contexto grande: Una ventana de contexto extendida que procesa documentos más grandes y conversaciones más largas.
Entrada de imagen y texto: Visión sólida para analizar gráficos, gráficos, diagramas técnicos, informes y otros recursos visuales.
Generación de código: Generación, análisis y depuración de código avanzados.
Aptitudes del agente: Amplíe las capacidades de Claude con habilidades.
Citas: Las respuestas de Ground Claude en los documentos de origen.
Compatibilidad con PDF: Procese y analice el texto y el contenido visual de los documentos PDF.
Edición de contexto: Administre automáticamente el contexto de conversación con estrategias configurables.

Pensamiento extendido: Razonamiento mejorado para tareas complejas, disponible con todos los modelos de Claude. En la tabla siguiente se muestran los tipos de parámetro que thinking admite cada modelo. El adaptive tipo permite al modelo decidir si debe pensar, en función de la complejidad de la consulta y el nivel de esfuerzo.

Modelo	`adaptive`	`enabled`	`disabled`
`claude-mythos-5`	Sí	No	No
`claude-fable-5`	Sí	No	No
`claude-mythos-preview`	Sí	Sí	No
`claude-opus-4-8`	Sí	No	Sí
`claude-opus-4-7`	Sí	No	Sí
`claude-opus-4-6`	Sí	Sí	Sí
`claude-sonnet-4-6`	Sí	Sí	Sí

Esfuerzo: Capacidad de controlar el equilibrio de calidad/costo de las respuestas. Use este parámetro con o sin habilitar el pensamiento. En la tabla siguiente se muestran los niveles que effort admite cada modelo. El xhigh nivel genera el mismo resultado que max.

Modelo	`low`	`medium`	`high`	`max`	`xhigh`
`claude-mythos-5`	Sí	Sí	Sí	No	Sí
`claude-fable-5`	Sí	Sí	Sí	No	Sí
`claude-opus-4-8`	Sí	Sí	Sí	Sí	Sí
`claude-opus-4-7`	Sí	Sí	Sí	Sí	Sí
`claude-opus-4-6`	Sí	Sí	Sí	Sí	No
`claude-sonnet-4-6`	Sí	Sí	Sí	Sí	No

Herramientas

Las herramientas permiten a Claude interactuar con sistemas externos, ejecutar código y realizar tareas automatizadas. Foundry admite las siguientes herramientas para Claude:

Conector MCP: Conéctese a servidores MCP remotos directamente desde la API messages sin un cliente MCP independiente.
Memoria: Almacenar y recuperar información entre conversaciones. Cree bases de conocimiento a lo largo del tiempo, mantenga el contexto del proyecto y aprenda de las interacciones anteriores.
Captura web: Recupere contenido completo de páginas web y documentos PDF especificados para el análisis detallado.

Para obtener una lista completa de las funcionalidades y herramientas admitidas, consulte información general sobre las características de Claude.

Soporte para agentes

Microsoft Agent Framework admite la creación de agentes que usan modelos de Claude.
Cree agentes de IA personalizados con el SDK del agente de Claude.

Cómo se hospedan y facturan los modelos de Claude

Claude se ofrece a través de Foundry Models de socios y de la comunidad. Los modelos de asociados y comunidad que no se venden por Azure son Productos no Microsoft en los Términos del producto.

La implementación de un modelo de Claude requiere una suscripción Azure Marketplace. Asegúrese de que tiene los permisos necesarios para suscribirse a las ofertas de modelo antes de implementar.

Cuotas, límites de cuota y regiones

Los modelos de Claude están disponibles para la implementación global estándar en las siguientes regiones:

EE. UU. Este 2
Centro de Suecia

Los límites de velocidad de los modelos de Claude en Foundry se miden en tokens por minuto (TPM) y solicitudes por minuto (RPM). Los valores son diferentes en función del tipo de suscripción, como se muestra en la tabla siguiente. Para aumentar la cuota más allá de los límites predeterminados, envíe una solicitud mediante el formulario de solicitud de aumento de cuota.

Pago por uso

Modelo	Tipo de implementación	RPM	TPM
claude-fable-5	Estándar global	0	0
claude-opus-4-8	Estándar global	40	40,000
claude-opus-4-7	Estándar global	40	40,000
claude-opus-4-6	Estándar global	40	40,000
claude-opus-4-5	Estándar global	40	40,000
claude-opus-4-1	Estándar global	40	40,000
claude-sonnet-4-6	Estándar global	80	80,000
claude-sonnet-4-5	Estándar global	80	80,000
claude-haiku-4-5	Estándar global	80	80,000

Enterprise y MCA-E

Modelo	Tipo de implementación	RPM	TPM
claude-fable-5	Estándar global	2.000	2,000,000
claude-opus-4-8	Estándar global	2.000	2,000,000
claude-opus-4-7	Estándar global	2.000	2,000,000
claude-opus-4-6	Estándar global	2.000	2,000,000
claude-opus-4-5	Estándar global	2.000	2,000,000
claude-opus-4-1	Estándar global	2.000	2,000,000
claude-sonnet-4-6	Estándar global	4,000	4,000,000
claude-sonnet-4-5	Estándar global	4,000	4,000,000
claude-haiku-4-5	Estándar global	4,000	4,000,000

Versión de prueba gratuita

Modelo	Tipo de implementación	RPM	TPM
claude-fable-5	Estándar global	0	0
claude-opus-4-8	Estándar global	0	0
claude-opus-4-7	Estándar global	0	0
claude-opus-4-6	Estándar global	0	0
claude-opus-4-5	Estándar global	0	0
claude-opus-4-1	Estándar global	0	0
claude-sonnet-4-6	Estándar global	0	0
claude-sonnet-4-5	Estándar global	0	0
claude-haiku-4-5	Estándar global	0	0

Consideraciones sobre IA responsable

Al usar modelos de Claude en Foundry, tenga en cuenta estas prácticas de inteligencia artificial responsables:

Configure la seguridad del contenido de IA durante la inferencia del modelo, ya que Foundry no proporciona filtrado de contenido integrado para los modelos de Claude en el momento de la implementación.
Asegúrese de que las aplicaciones cumplen con la directiva de uso aceptable de Anthropic. Vea también los detalles de las evaluaciones de seguridad para Claude Fable 5, Claude Mythos 5, Claude Mythos Preview, Claude Opus 4.8, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 y Claude Haiku 4.5.

procedimientos recomendados

Siga estos procedimientos recomendados al trabajar con modelos de Claude en Foundry:

Ingeniería rápida

Instrucciones claras: Proporcione avisos específicos y detallados.
Administración de contextos: use la ventana de contexto disponible de forma eficaz.
Definiciones de los roles: Use los mensajes del sistema para definir el rol y el comportamiento del asistente.
Avisos estructurados: use formato coherente para obtener mejores resultados.

Optimización de costos

Para optimizar el uso y evitar la limitación de velocidad:

Implementar lógica de reintento: controle 429 respuestas con retroceso exponencial.
Solicitudes por lotes: combine varias solicitudes siempre que sea posible.
Supervisión del uso de tokens: realice un seguimiento del consumo de tokens y los patrones de solicitud.
Usar modelos adecuados: use el modelo más rentable para su caso de uso. Consulte Modelos de Claude disponibles.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-06-12