Directivas de límites y controles predeterminados para modelos de Microsoft Foundry (clásico)

Solo se aplica a:portal Foundry (clásico). Este artículo no está disponible para el nuevo portal de Foundry. Obtenga más información sobre el nuevo portal.

Nota

Los vínculos de este artículo pueden abrir contenido en la nueva documentación de Microsoft Foundry en lugar de la documentación de Foundry (clásico) que está viendo ahora.

Microsoft Foundry Models aplica la seguridad predeterminada a todos los modelos, excepto los modelos de audio, como Whisper en Azure OpenAI en Foundry Models. Estas configuraciones proporcionan una experiencia responsable de forma predeterminada.

Las medidas de seguridad predeterminadas tienen por objeto mitigar riesgos tales como el odio y la discriminación, el contenido de carácter sexual, la violencia, las autolesiones, el contenido prohibido y los ataques de inyección de comandos por parte de los usuarios. Para más información sobre el filtrado de contenido, lea sobre las categorías de riesgo y los niveles de gravedad.

En este artículo se describe la configuración de seguridad predeterminada.

Sugerencia

La configuración predeterminada se aplica a todos los modelos. Sin embargo, puede configurar el filtrado de contenido por implementación de modelos, como se explica en Configuración de filtros de contenido.

Modelos de texto

Los modelos de texto de Foundry Models pueden tomar y generar texto y código. Estos modelos aplican los modelos de filtrado de contenido de texto de Azure para detectar y evitar contenido dañino. Este sistema funciona tanto en la solicitud como en la finalización.

Categoría de riesgo	Solicitud o finalización	Umbral de gravedad
Odio y equidad	Indicaciones y finalizaciones	Medio
Violencia	Indicaciones y finalizaciones	Medio
Sexual	Indicaciones y finalizaciones	Medio
Autolesiones	Indicaciones y finalizaciones	Medio
Ataque por inyección de indicaciones de usuario (liberar)	Indicaciones	N/A
Material protegido: texto	Finalizaciones	N/A
Material protegido: código	Finalizaciones	N/A

Visión y chat con modelos de visión

Los modelos de visión pueden tomar texto e imágenes al mismo tiempo como parte de la entrada. Las funcionalidades de filtrado de contenido predeterminadas varían según el modelo y el proveedor.

Azure OpenAI: GPT-4o y GPT-4 Turbo

Categoría de riesgo	Solicitud o finalización	Umbral de gravedad
Odio y equidad	Indicaciones y finalizaciones	Medio
Violencia	Indicaciones y finalizaciones	Medio
Sexual	Indicaciones y finalizaciones	Medio
Autolesiones	Indicaciones y finalizaciones	Medio
Identificación de individuos e inferencia de atributos confidenciales	Indicaciones	N/A
Ataque por inyección de indicaciones de usuario (liberar)	Indicaciones	N/A

Azure OpenAI: modelos de generación de imágenes

Categoría de riesgo	Solicitud o finalización	Umbral de gravedad
Odio y equidad	Indicaciones y finalizaciones	Bajo
Violencia	Indicaciones y finalizaciones	Bajo
Sexual	Indicaciones y finalizaciones	Bajo
Autolesiones	Indicaciones y finalizaciones	Bajo
Credenciales de contenido	Finalizaciones	N/A
Generación engañosa de candidatos políticos	Indicaciones	N/A
Representaciones de figuras públicas	Indicaciones	N/A
Ataque por inyección de indicaciones de usuario (liberar)	Indicaciones	N/A
Material protegido: Personajes de arte y estudio	Indicaciones	N/A
Palabras soeces	Indicaciones	N/A

Además de las configuraciones de seguridad anteriores, Azure OpenAI DALL-E también incluye la transformación de indicaciones de forma predeterminada. Esta transformación se produce en todas las indicaciones para mejorar la seguridad de su indicación original, específicamente en las categorías de riesgo de diversidad, generación engañosa de candidatos políticos, representaciones de figuras públicas, material protegido y otros.

Meta: Llama-3.2-11B-Vision-Instruct y Llama-3.2-90B-Vision-Instruct

Los filtros de contenido solo se aplican a indicaciones de texto y completaciones. La moderación de contenido no se aplica a las imágenes.

Paso siguiente

Configuración de filtros de contenido en modelos de Foundry

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-05-21