Redacción de modelos personalizados

estilo de énfasis

Este contenido se aplica a:checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (retirada)red-checkmarkv2.1 (retirada)

Este contenido se aplica a:checkmarkv3.1 (GA) | Versión más reciente:purple-checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este contenido se aplica a:red-checkmarkv3.0 (retirada) | Versiones más recientes:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versión anterior:blue-checkmarkv2.1 (retirada)

Este contenido se aplica a:red-checkmarkv2.1 | Versión más reciente:blue-checkmarkv4.0 (GA)

Importante

El comportamiento de composición del modelo se ha cambiado para api-version=2024-11-30 (GA). Para obtener más información, consulte modelos personalizados compuestos. El comportamiento siguiente solo se aplica a la versión 3.1 y versiones anteriores.

Para crear un modelo compuesto, se toma una colección de modelos personalizados y se asignan a un identificador de modelo único. Puede asignar hasta 200 modelos personalizados entrenados a un único identificador de modelo compuesto. Cuando se envía un documento a un modelo compuesto, el servicio realiza un paso de clasificación para decidir qué modelo personalizado representa con precisión el formulario presentado para el análisis. Los modelos compuestos son útiles cuando se entrenan varios modelos y se desean agrupar para analizar tipos de formularios similares. Por ejemplo, el modelo compuesto podría incluir modelos personalizados entrenados para analizar los pedidos de compra de suministros, equipos y muebles. En lugar de intentar seleccionar manualmente el modelo adecuado, puede usar un modelo compuesto para determinar el modelo personalizado adecuado para cada análisis y extracción.

Para más información, consulte Modelos personalizados compuestos.

En este artículo, aprenderá a crear y usar modelos personalizados compuestos para analizar los formularios y documentos.

Requisitos previos

Para empezar, necesita los siguientes recursos:

  • Una suscripción de Azure. Puede crear una suscripción gratuita Azure.

  • Una instancia de Document Intelligence. Una vez que tenga la suscripción de Azure, cree un recurso de Inteligencia de documentos en el portal de Azure para obtener la clave y el punto de conexión. Si tiene un recurso de Document Intelligence existente, vaya directamente a la página de recursos. Puede usar el plan de tarifa gratis (F0) para probar el servicio y actualizarlo más adelante a un nivel de pago para producción.

    1. Después de implementar el recurso, seleccione Ir al recurso.

    2. Copie los valores Keys y Endpoint desde el portal de Azure y péguelos en una ubicación cómoda, como Microsoft Bloc de notas. Necesita los valores de clave y punto de conexión para conectar su aplicación a la API de Document Intelligence.

Fotografía fija que muestra cómo acceder a la clave de recurso y la URL del extremo.

Sugerencia

Para obtener más información, consulte Creación de un recurso de Document Intelligence.

  • Una cuenta de almacenamiento Azure. Si no sabe cómo crear una cuenta de almacenamiento de Azure, siga el inicio rápido de Azure Storage para Azure Portal. Puede usar el plan de tarifa gratis (F0) para probar el servicio y actualizarlo más adelante a un nivel de pago para producción.

Creación de modelos personalizados

En primer lugar, necesita un conjunto de modelos personalizados para componer. Puede usar las bibliotecas cliente, API REST o Document Intelligence Studio. Los pasos son los siguientes:

Ensamblar el conjunto de datos de entrenamiento

La creación de un modelo personalizado comienza con el establecimiento del conjunto de datos de entrenamiento. Necesita un mínimo de cinco formularios completados del mismo tipo para el conjunto de datos de ejemplo. Pueden ser de diferentes tipos de archivo (jpg, png, pdf, tiff) y contienen texto y escritura a mano. Los formularios deben cumplir los requisitos de entrada de Document Intelligence.

Sugerencia

Siga estas sugerencias para optimizar el conjunto de datos para el entrenamiento:

  • Si es posible, use documentos PDF basados en texto en lugar de documentos basados en imágenes. Los archivos PDF escaneados se gestionan como imágenes.
  • Para los formularios rellenados, use ejemplos que tienen todos sus campos rellenados.
  • Use formularios con valores diferentes en cada campo.
  • Si las imágenes de formulario son de menor calidad, use un conjunto de datos mayor (imágenes de 10 a 15, por ejemplo).

Consulte Creación de un conjunto de datos de entrenamiento para obtener sugerencias sobre cómo recopilar los documentos de entrenamiento.

Carga del conjunto de datos de entrenamiento

Una vez que recopile un conjunto de documentos de entrenamiento, debe cargar los datos de entrenamiento en un contenedor de blobs de Azure.

Si desea usar datos etiquetados manualmente, debe cargar los archivos de.labels.json y .ocr.json correspondientes a los documentos de entrenamiento.

Entrenamiento del modelo personalizado

Al entrenar el modelo con datos etiquetados, el modelo usa el aprendizaje supervisado para extraer valores de interés, mediante los formularios etiquetados que proporcione. Los datos etiquetados generan modelos de mejor rendimiento y pueden generar modelos que funcionan con formularios complejos o formularios que contienen valores sin claves.

Document Intelligence usa la API del modelo de diseño preconstruido para aprender los tamaños esperados y las posiciones de los elementos de texto mecanografiado y manuscrito, y extraer tablas. A continuación, usa etiquetas especificadas por el usuario para obtener información sobre las asociaciones de clave y valor y las tablas de los documentos. Se recomienda usar cinco formularios etiquetados manualmente del mismo tipo (misma estructura) para empezar a entrenar un nuevo modelo. A continuación, agregue más datos etiquetados, según sea necesario, para mejorar la precisión del modelo. La inteligencia de documentos permite entrenar un modelo para extraer pares clave-valor y tablas mediante funcionalidades de aprendizaje supervisado.

Para crear modelos personalizados, empiece por configurar el proyecto:

  1. En la página principal de Studio, seleccione Crear nuevo en la tarjeta de modelo personalizado.

  2. Use el ➕ comando Crear un proyecto para iniciar el asistente para la configuración del nuevo proyecto.

  3. Escriba los detalles del proyecto, seleccione la suscripción y el recurso de Azure y el contenedor de Blob Storage Azure que contiene los datos.

  4. Revise, envíe la configuración y cree el proyecto.

Animación que muestra cómo crear un proyecto personalizado en Document Intelligence Studio.

Al crear los modelos personalizados, es posible que tenga que extraer colecciones de datos de los documentos. Las colecciones pueden aparecer en uno de los dos formatos. Uso de tablas como patrón visual:

  • Recuento dinámico o variable de valores (filas) para un conjunto determinado de campos (columnas)

  • Colección específica de valores para un conjunto determinado de campos (columnas o filas)

Consulte Studio de Documento de inteligencia: etiquetado como tablas

Creación de un modelo compuesto

Nota

La create compose model operación solo está disponible para modelos personalizados entrenados con etiquetas. Si intenta crear modelos sin etiquetar, se producirá un error.

Con la operación crear modelo de composición, puede asignar hasta 100 modelos personalizados entrenados a un identificador de modelo único. Al analizar documentos con un modelo compuesto, La inteligencia de documentos clasifica primero el formulario que envió y, a continuación, elige el mejor modelo asignado coincidente y devuelve los resultados de ese modelo. Esta operación es útil cuando los formularios entrantes pueden pertenecer a una de varias plantillas.

Una vez completado correctamente el proceso de entrenamiento, puede empezar a compilar el modelo compuesto. Estos son los pasos para crear y usar modelos compuestos:

Reúne tus identificadores de modelo

Al entrenar modelos mediante Document Intelligence Studio, el identificador de modelo se encuentra en el menú modelos de un proyecto:

Captura de pantalla de la ventana de configuración del modelo en Document Intelligence Studio.

Redacción de modelos personalizados

  1. Seleccione un proyecto de modelos personalizados.

  2. En el proyecto, seleccione el elemento del menú Models.

  3. En la lista resultante de modelos, seleccione los modelos que desea componer.

  4. Elija el botón Redactar en la esquina superior izquierda.

  5. En la ventana emergente, asigne un nombre al modelo recién compuesto y seleccione Redactar.

  6. Una vez completada la operación, el modelo recién compuesto aparece en la lista.

  7. Una vez que el modelo esté listo, use el comando Test para validarlo con los documentos de prueba y observar los resultados.

Análisis de documentos

La operación Analizar del modelo personalizado requiere que proporcione el parámetro modelID en la llamada a Documento de inteligencia. Debe proporcionar el identificador de modelo compuesto para el parámetro modelID en las aplicaciones.

Captura de pantalla de un identificador de modelo compuesto en Document Intelligence Studio.

Administración de los modelos compuestos

Puede administrar los modelos personalizados a lo largo de los ciclos de vida:

  • Pruebe y valide nuevos documentos.
  • Descargue el modelo para usarlo en las aplicaciones.
  • Elimine el modelo cuando finalice su ciclo de vida.

Captura de pantalla de un modelo compuesto en Document Intelligence Studio

¡Genial! Ha aprendido los pasos para crear modelos personalizados y compuestos y usarlos en los proyectos y aplicaciones de Document Intelligence.

Pasos siguientes

Pruebe uno de los inicios rápidos de Document Intelligence:

C#

Document Intelligence usa tecnología avanzada de aprendizaje automático para detectar y extraer información de imágenes de documento y devolver los datos extraídos en una salida JSON estructurada. Con Document Intelligence, puede entrenar modelos personalizados independientes o combinar modelos personalizados para crear modelos compuestos.

  • Modelos personalizados. Los modelos personalizados de Document Intelligence permiten analizar y extraer datos de formularios y documentos específicos de su negocio. Los modelos personalizados se entrenan para los distintos datos y casos de uso.

  • Modelos compuestos. Para crear un modelo compuesto, se toma una colección de modelos personalizados y se asignan a un único modelo que abarca los tipos de formulario. Cuando se envía un documento a un modelo compuesto, el servicio realiza un paso de clasificación para decidir qué modelo personalizado representa con precisión el formulario presentado para el análisis.

En este artículo, aprenderá a crear modelos personalizados y compuestos de Document Intelligence mediante nuestra herramienta de etiquetado de ejemplo de Document Intelligence, API REST o bibliotecas cliente.

Herramienta de etiquetado de ejemplo

Pruebe a extraer datos de formularios personalizados mediante nuestra herramienta de etiquetado de ejemplo. Necesita los siguientes recursos:

  • Una suscripción Azure: puede crear una gratuita

  • Una instancia de Document Intelligence en el portal de Azure. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de las claves y la ubicación del punto de conexión en el portal de Azure.

En la interfaz de usuario de Inteligencia de documentos:

  1. Seleccione Usar configuración personalizada para entrenar un modelo con etiquetas y obtener pares clave-valor.

Captura de pantalla de la herramienta FOTT seleccionando la opción de modelo personalizado.

  1. En la ventana siguiente, seleccione Nuevo proyecto:

Captura de pantalla de la herramienta

Creación de modelos

Los pasos para crear, entrenar y usar modelos personalizados y compuestos son los siguientes:

Ensamblar el conjunto de datos de entrenamiento

La creación de un modelo personalizado comienza con el establecimiento del conjunto de datos de entrenamiento. Necesita un mínimo de cinco formularios completados del mismo tipo para el conjunto de datos de ejemplo. Pueden ser de diferentes tipos de archivo (jpg, png, pdf, tiff) y contienen texto y escritura a mano. Los formularios deben cumplir los requisitos de entrada de Document Intelligence.

Carga del conjunto de datos de entrenamiento

Debe cargar sus datos de entrenamiento en un almacén de blobs de Azure. Si no sabe cómo crear una cuenta de almacenamiento de Azure con un contenedor, consulteinicio rápido de Azure Storage para el portal de Azure. Puede usar el plan de tarifa gratis (F0) para probar el servicio y actualizarlo más adelante a un nivel de pago para producción.

Entrenamiento del modelo personalizado

Entrenas tu modelo con conjuntos de datos etiquetados. Los conjuntos de datos etiquetados se basan en la API de diseño precompilada, pero se incluyen aportaciones humanas complementarias, como sus etiquetas específicas y las ubicaciones de los campos. Comience con al menos cinco formularios completados del mismo tipo para los datos de entrenamiento etiquetados.

Al entrenar con datos etiquetados, el modelo usa el aprendizaje supervisado para extraer valores de interés, mediante los formularios etiquetados que proporcione. Los datos etiquetados generan modelos de mejor rendimiento y pueden generar modelos que funcionan con formularios complejos o formularios que contienen valores sin claves.

Document Intelligence utiliza la API Layout para aprender los tamaños y posiciones esperados de los elementos de texto de tipografía y manuscritos, y extraer tablas. A continuación, usa etiquetas especificadas por el usuario para obtener información sobre las asociaciones de clave y valor y las tablas de los documentos. Se recomienda usar cinco formularios etiquetados manualmente del mismo tipo (misma estructura) para empezar a entrenar un nuevo modelo. Agregue más datos etiquetados según sea necesario para mejorar la precisión del modelo. Document Intelligence permite entrenar un modelo para extraer pares de valor clave y tablas mediante funcionalidades de aprendizaje supervisado.

Introducción al entrenamiento con etiquetas

[! VÍDEO https://mms.heiai.top/Shows/Docs-Azure/Azure-Form-Recognizer/player]

Creación de un modelo compuesto

Nota

Model Compose solo está disponible para modelos personalizados entrenados con etiquetas. Si intenta crear modelos sin etiquetar, se producirá un error.

Con la operación Model Compose, puede asignar hasta 200 modelos personalizados entrenados a un identificador de modelo único. Al llamar a Analyze con el identificador de modelo compuesto, La inteligencia de documentos clasifica primero el formulario que envió, elige el mejor modelo asignado coincidente y, a continuación, devuelve los resultados de ese modelo. Esta operación es útil cuando los formularios entrantes pueden pertenecer a una de varias plantillas.

Con la herramienta de etiquetado de ejemplo del Document Intelligence, la REST API o las bibliotecas de cliente, siga los pasos para configurar un modelo compuesto:

  1. Reúne tus identificadores de modelo personalizados
  2. Crear tus modelos personalizados

Reúne tus identificadores de modelo personalizados

Una vez completado correctamente el proceso de entrenamiento, al modelo personalizado se le asigna un identificador de modelo. Puede recuperar un identificador de modelo de la siguiente manera:

Al entrenar modelos mediante la herramienta de etiquetado de ejemplo de Document Intelligence, el identificador del modelo se encuentra en la ventana Resultado de entrenamiento:

Captura de pantalla de la ventana de resultados de entrenamiento.

Redacción de modelos personalizados

Después de recopilar los modelos personalizados que corresponden a un solo tipo de formulario, puede componerlos en un solo modelo.

La herramienta de etiquetado de muestras le permite empezar a entrenar rápidamente modelos y combinarlos en un único identificador de modelo.

Una vez completado el entrenamiento, componga los modelos de la siguiente manera:

  1. En el menú de raíl izquierdo, seleccione el icono Composición del modelo (flecha de combinación).

  2. En la ventana principal, seleccione los modelos que desea asignar a un identificador de modelo único. Los modelos con el icono de flechas ya están precompuestos.

  3. Elija el botón Redactar en la esquina superior izquierda.

  4. En la ventana emergente, asigne un nombre al modelo recién compuesto y seleccione Redactar.

Una vez completada la operación, el modelo recién compuesto aparece en la lista.

Captura de pantalla de la ventana de redacción del modelo.

Análisis de documentos con el modelo personalizado o compuesto

La operación Analizar del formulario personalizado requiere que proporcione el parámetro modelID en la llamada a Documento de inteligencia. Puede proporcionar un identificador de modelo personalizado único o un identificador de modelo compuesto para el modelID parámetro .

  1. En el menú del panel izquierdo de la herramienta, seleccione el Analyze icono (bombilla).

  2. Elija un archivo local o una dirección URL de imagen para analizar.

  3. Seleccione el botón Ejecutar análisis .

  4. La herramienta aplicará etiquetas en los cuadros de límite e informará del porcentaje de confianza de cada etiqueta.

Captura de pantalla de la ventana analyze-a-custom-form de la herramienta de inteligencia de documentos.

Pruebe los modelos recién entrenados mediante el análisis de formularios que no formaban parte del conjunto de datos de entrenamiento. En función de la precisión notificada, es posible que desee realizar más entrenamiento para mejorar el modelo. Puede seguir entrenando para mejorar los resultados.

Administración de los modelos personalizados

Puede administrar los modelos personalizados a lo largo de su ciclo de vida viendo una lista de todos los modelos personalizados de su suscripción, recuperando información sobre un modelo personalizado específico y eliminando modelos personalizados de su cuenta.

¡Genial! Ha aprendido los pasos para crear modelos personalizados y compuestos y usarlos en los proyectos y aplicaciones de Document Intelligence.

Pasos siguientes

Para más información sobre la biblioteca cliente de Document Intelligence, explore nuestra documentación de referencia de API.