Filtro de información de identificación personal (PII)

La información de identificación personal (datos personales) hace referencia a cualquier información que se pueda usar para identificar a un individuo determinado, como un nombre, dirección, número de teléfono, dirección de correo electrónico, número de seguridad social, número de licencia de conducir, número de pasaporte o información similar.

La detección de datos personales se usa para ayudar a evitar que los datos personales se expongan o compartan, protegiendo a los usuarios contra el robo de identidad, el fraude financiero u otros tipos de infracciones de privacidad.

En el contexto de los modelos de lenguaje grande (LLM), la detección de datos personales implica el análisis del contenido de texto en las finalizaciones de LLM. Cuando se han identificado datos personales, se puede marcar para su posterior revisión o se puede bloquear la salida. El filtro de datos personales examina la salida de los LLM para identificar y marcar la información personal conocida. Está diseñado para ayudar a las organizaciones a evitar la generación de contenido que coincida estrechamente con la información personal confidencial.

Por ejemplo, si un modelo genera "Póngase en contacto conmigo en [email protected] o llame al 555-0123", el filtro de datos personales puede detectar y marcar la dirección de correo electrónico y el número de teléfono antes de que el contenido llegue al usuario.

Sugerencia

Use el filtrado de datos personales para cumplir los requisitos de cumplimiento (HIPAA, CCPA), evitar pérdidas de datos en aplicaciones orientadas al cliente y auditar la exposición de información confidencial en las salidas del modelo.

Tipos de datos personales

Hay muchos tipos diferentes de datos personales y puede especificar qué tipos desea filtrar. Entre las categorías de datos personales comunes se incluyen:

  • Información personal: Correo electrónico, Número de teléfono, Dirección, Persona, Dirección IP, Fecha de nacimiento, Número de licencia de conducir, Número de pasaporte
  • Información financiera: Número de tarjeta de crédito, Número de cuenta bancaria, Código SWIFT, IBAN
  • Identificadores gubernamentales: Número de seguro social (EE. UU.), números de identificación nacional (más de 50 países), identificadores fiscales, números de pasaporte
  • Relativo a Azure: Cadenas de conexión, claves de cuenta de almacenamiento, claves de autenticación
  • Geolocalización: Aeropuerto, Ciudad, Estado, Ubicaciones específicas

Para obtener la lista completa de los tipos de entidad de datos personales admitidos, consulte categorías de entidades de datos personales.

Modos de filtrado

El filtro de datos personales se puede configurar para que funcione en dos modos:

  • El modo de Anotar señala los datos personales devueltos en la salida del modelo.
  • Annotar y bloquear bloquea toda la salida si se detectan datos personales.

El modo de filtrado se puede establecer para cada categoría de datos personales individualmente.

Pasos siguientes