Uso de modelos precompilados

Completado

Sugerencia

Consulte la pestaña Texto e imágenes para obtener más detalles.

Los modelos creados previamente en Azure Document Intelligence permiten extraer datos de tipos de formulario comunes sin entrenar sus propios modelos. Microsoft entrena estos modelos en un gran número de documentos de ejemplo, por lo que puede esperar resultados precisos y confiables para los tipos de documentos estándar.

Modelos de análisis de documentos

Antes de examinar los modelos precompilados específicos del dominio, es importante comprender los modelos de análisis de documentos que los sustentan.

Modelo de lectura

El modelo de lectura extrae texto impreso y manuscrito de documentos e imágenes. Detecta el idioma de cada línea de texto y clasifica si el texto se escribe a mano o se imprime. El modelo de lectura se usa como base para la extracción de texto en todos los demás modelos de Document Intelligence.

Para archivos PDF o TIFF de varias páginas, puede usar el parámetro en la pages solicitud para especificar un intervalo de páginas para su análisis.

El modelo de lectura es ideal cuando desea extraer palabras y líneas de documentos sin estructura fija o predecible.

Captura de pantalla que muestra el modelo de lectura que analiza un documento de ejemplo en Document Intelligence Studio.

Modelo de diseño

El modelo de diseño amplía la extracción de texto del modelo de lectura con la detección de marcas de selección, tablas e información de estructura del documento. También admite una característica opcional keyValuePairs para extraer pares clave-valor.

Al digitalizar un documento, es posible que se angule o que las tablas tengan estructuras complejas con celdas combinadas o filas incompletas. El modelo de diseño puede controlar estas dificultades. Cada celda de tabla se extrae con su contenido, posición del cuadro delimitador e índices de fila/columna.

Las marcas de selección (casillas y botones de opción) se extraen junto con su rectángulo delimitador, el nivel de confianza, y si las marcas están seleccionadas.

Captura de pantalla que muestra el modelo de diseño que extrae tablas y estructura de un documento de ejemplo en Document Intelligence Studio.

Nota:

El modelo de documento general estaba disponible en versiones anteriores de Document Intelligence, pero estaba en desuso en la 2023-10-31-preview versión. Su funcionalidad para pares clave-valor y la extracción de entidades se ha incorporado en el modelo de diseño y otras características.

Modelos creados previamente para tipos de documentos específicos

Azure Document Intelligence incluye modelos creados previamente entrenados en tipos de documentos específicos. Los siguientes modelos precompilados son algunos ejemplos disponibles para extraer campos de documentos empresariales comunes:

Modelo Descripción
Factura Extrae el nombre del cliente, los detalles del proveedor, el número de pedido de compra, las fechas de facturación y vencimiento, las direcciones de facturación y envío, los artículos de línea y los totales.
Recibo Extrae los detalles del comerciante, la fecha y hora de transacción, los elementos de línea y los totales. Admite el procesamiento de recibos de hotel de página única.
Estado de cuenta Extrae información de la cuenta, saldos iniciales y finales y detalles de la transacción.
Comprobación Extrae el beneficiario, la cantidad, la fecha y otra información pertinente.
Recibo de pago Extrae salarios, horas, deducciones, salario neto y otros campos habituales de los recibos de pago.
Tarjeta de crédito Extrae la información de la tarjeta de pago.
Contrato Extrae los detalles del contrato y de las partes.

Documentos fiscales de EE. UU.

Modelo Descripción
Impuestos unificados de EE. UU. Modelo único que extrae de cualquier tipo de formulario fiscal de EE. UU. admitido.
W-2 Extrae la información sobre la compensación sujeta a impuestos.
1098 y variaciones Extrae el interés de la hipoteca y detalles relacionados.
1099 y variaciones Extrae los ingresos de varias fuentes.
1040 y variaciones Extrae los detalles de la declaración de impuestos de ingresos individuales.

Documentos hipotecarios estadounidenses

Modelo Descripción
1003 (URLA) Extrae los detalles de la solicitud de préstamo.
1004 (URAR) Extrae información de las evaluaciones de propiedades.
1005 Extrae información de verificación de empleo.
1008 Extrae detalles de transmisión de préstamos.
Cierre de la divulgación Extrae los términos de cierre del préstamo.

Documentos de identificación personal

Modelo Descripción
Documento de identificación Extrae los detalles de las licencias de conducir de EE. UU., los identificadores de la Unión Europea y las licencias de conducir y los pasaportes internacionales. Incluye nombres, fechas de nacimiento, números de documento y aprobaciones o restricciones.
Tarjeta de seguro de salud Extrae campos comunes de tarjetas de seguro de salud de EE. UU.
Certificado de matrimonio Extrae información certificada sobre matrimonios.

Importante

El modelo de documento de identificación extrae información personal cubierta por las leyes de protección de datos en la mayoría de las jurisdicciones. Asegúrese de que tiene el permiso del individuo para almacenar sus datos y que cumple todos los requisitos legales aplicables.

Características de los modelos precompilados

Los modelos creados previamente están diseñados para extraer diferentes tipos de datos de documentos. Estas características incluyen:

  • Extracción de texto: todos los modelos precompilados extraen líneas y palabras del texto manuscrito e impreso.
  • Pares clave-valor: intervalos de texto que identifican una etiqueta y su respuesta. Por ejemplo, Peso y 31 kg.
  • Marcas de selección: casillas y botones de radio, incluido si están seleccionados o no.
  • Tablas: datos en celdas, incluido el número de columnas y filas, encabezados de columna y fila, y celdas combinadas.
  • Campos: los modelos entrenados para un tipo de formulario específico identifican un conjunto fijo de campos. Por ejemplo, el modelo de factura extrae CustomerName y InvoiceTotal.

Cuándo usar modelos predefinidos frente a modelos personalizados

Los modelos creados previamente cubren los tipos de documento más comunes. Si tiene un tipo de formulario específico o único del sector, puede obtener resultados más precisos con un modelo personalizado. Sin embargo, los modelos personalizados requieren tiempo y datos de ejemplo para entrenar. Compruebe siempre si existe un modelo precompilado para su escenario antes de invertir en el desarrollo de modelos personalizados.

Aprende más