Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Este contenido se aplica a:
v4.0 (GA) | Versiones anteriores:
v3.1 (GA)
v3.0 (retirada)
v2.1 (retirada)
Este contenido se aplica a:
v3.1 (GA) | Versión más reciente:
v4.0 (GA) | Versiones anteriores:
v3.0
v2.1
Este contenido se aplica a:
v3.0 (retirada) | Versiones más recientes:
v4.0 (GA)
v3.1 | Versión anterior:
v2.1 (retirada)
Este contenido se aplica a:
v2.1 | Versión más reciente:
v4.0 (GA)
Importante
El comportamiento de composición del modelo se ha cambiado para api-version=2024-11-30 (GA). Para obtener más información, consulte modelos personalizados compuestos. El comportamiento siguiente solo se aplica a la versión 3.1 y versiones anteriores.
Para crear un modelo compuesto, se toma una colección de modelos personalizados y se asignan a un identificador de modelo único. Puede asignar hasta 200 modelos personalizados entrenados a un único identificador de modelo compuesto. Cuando se envía un documento a un modelo compuesto, el servicio realiza un paso de clasificación para decidir qué modelo personalizado representa con precisión el formulario presentado para el análisis. Los modelos compuestos son útiles cuando se entrenan varios modelos y se desean agrupar para analizar tipos de formularios similares. Por ejemplo, el modelo compuesto podría incluir modelos personalizados entrenados para analizar los pedidos de compra de suministros, equipos y muebles. En lugar de intentar seleccionar manualmente el modelo adecuado, puede usar un modelo compuesto para determinar el modelo personalizado adecuado para cada análisis y extracción.
Para más información, consulte Modelos personalizados compuestos.
En este artículo, aprenderá a crear y usar modelos personalizados compuestos para analizar los formularios y documentos.
Requisitos previos
Para empezar, necesita los siguientes recursos:
Una suscripción de Azure. Puede crear una suscripción gratuita Azure.
Una instancia de Document Intelligence. Una vez que tenga la suscripción de Azure, cree un recurso de Inteligencia de documentos en el portal de Azure para obtener la clave y el punto de conexión. Si tiene un recurso de Document Intelligence existente, vaya directamente a la página de recursos. Puede usar el plan de tarifa gratis (F0) para probar el servicio y actualizarlo más adelante a un nivel de pago para producción.
Después de implementar el recurso, seleccione Ir al recurso.
Copie los valores Keys y Endpoint desde el portal de Azure y péguelos en una ubicación cómoda, como Microsoft Bloc de notas. Necesita los valores de clave y punto de conexión para conectar su aplicación a la API de Document Intelligence.
Sugerencia
Para obtener más información, consulte Creación de un recurso de Document Intelligence.
- Una cuenta de almacenamiento Azure. Si no sabe cómo crear una cuenta de almacenamiento de Azure, siga el inicio rápido de Azure Storage para Azure Portal. Puede usar el plan de tarifa gratis (F0) para probar el servicio y actualizarlo más adelante a un nivel de pago para producción.
Creación de modelos personalizados
En primer lugar, necesita un conjunto de modelos personalizados para componer. Puede usar las bibliotecas cliente, API REST o Document Intelligence Studio. Los pasos son los siguientes:
- Ensamblar el conjunto de datos de entrenamiento
- Sube tu conjunto de entrenamiento al almacenamiento blob de Azure
- Entrenamiento de modelos personalizados
Ensamblar el conjunto de datos de entrenamiento
La creación de un modelo personalizado comienza con el establecimiento del conjunto de datos de entrenamiento. Necesita un mínimo de cinco formularios completados del mismo tipo para el conjunto de datos de ejemplo. Pueden ser de diferentes tipos de archivo (jpg, png, pdf, tiff) y contienen texto y escritura a mano. Los formularios deben cumplir los requisitos de entrada de Document Intelligence.
Sugerencia
Siga estas sugerencias para optimizar el conjunto de datos para el entrenamiento:
- Si es posible, use documentos PDF basados en texto en lugar de documentos basados en imágenes. Los archivos PDF escaneados se gestionan como imágenes.
- Para los formularios rellenados, use ejemplos que tienen todos sus campos rellenados.
- Use formularios con valores diferentes en cada campo.
- Si las imágenes de formulario son de menor calidad, use un conjunto de datos mayor (imágenes de 10 a 15, por ejemplo).
Consulte Creación de un conjunto de datos de entrenamiento para obtener sugerencias sobre cómo recopilar los documentos de entrenamiento.
Carga del conjunto de datos de entrenamiento
Una vez que recopile un conjunto de documentos de entrenamiento, debe cargar los datos de entrenamiento en un contenedor de blobs de Azure.
Si desea usar datos etiquetados manualmente, debe cargar los archivos de.labels.json y .ocr.json correspondientes a los documentos de entrenamiento.
Entrenamiento del modelo personalizado
Al entrenar el modelo con datos etiquetados, el modelo usa el aprendizaje supervisado para extraer valores de interés, mediante los formularios etiquetados que proporcione. Los datos etiquetados generan modelos de mejor rendimiento y pueden generar modelos que funcionan con formularios complejos o formularios que contienen valores sin claves.
Document Intelligence usa la API del modelo de diseño preconstruido para aprender los tamaños esperados y las posiciones de los elementos de texto mecanografiado y manuscrito, y extraer tablas. A continuación, usa etiquetas especificadas por el usuario para obtener información sobre las asociaciones de clave y valor y las tablas de los documentos. Se recomienda usar cinco formularios etiquetados manualmente del mismo tipo (misma estructura) para empezar a entrenar un nuevo modelo. A continuación, agregue más datos etiquetados, según sea necesario, para mejorar la precisión del modelo. La inteligencia de documentos permite entrenar un modelo para extraer pares clave-valor y tablas mediante funcionalidades de aprendizaje supervisado.
Para crear modelos personalizados, empiece por configurar el proyecto:
En la página principal de Studio, seleccione Crear nuevo en la tarjeta de modelo personalizado.
Use el ➕ comando Crear un proyecto para iniciar el asistente para la configuración del nuevo proyecto.
Escriba los detalles del proyecto, seleccione la suscripción y el recurso de Azure y el contenedor de Blob Storage Azure que contiene los datos.
Revise, envíe la configuración y cree el proyecto.
Al crear los modelos personalizados, es posible que tenga que extraer colecciones de datos de los documentos. Las colecciones pueden aparecer en uno de los dos formatos. Uso de tablas como patrón visual:
Recuento dinámico o variable de valores (filas) para un conjunto determinado de campos (columnas)
Colección específica de valores para un conjunto determinado de campos (columnas o filas)
Consulte Studio de Documento de inteligencia: etiquetado como tablas
Creación de un modelo compuesto
Nota
La create compose model operación solo está disponible para modelos personalizados entrenados con etiquetas. Si intenta crear modelos sin etiquetar, se producirá un error.
Con la operación crear modelo de composición, puede asignar hasta 100 modelos personalizados entrenados a un identificador de modelo único. Al analizar documentos con un modelo compuesto, La inteligencia de documentos clasifica primero el formulario que envió y, a continuación, elige el mejor modelo asignado coincidente y devuelve los resultados de ese modelo. Esta operación es útil cuando los formularios entrantes pueden pertenecer a una de varias plantillas.
Una vez completado correctamente el proceso de entrenamiento, puede empezar a compilar el modelo compuesto. Estos son los pasos para crear y usar modelos compuestos:
- Reúne tus identificadores de modelo personalizados
- Cree sus modelos personalizados
- Análisis de documentos
- Administración de los modelos compuestos
Reúne tus identificadores de modelo
Al entrenar modelos mediante Document Intelligence Studio, el identificador de modelo se encuentra en el menú modelos de un proyecto:
Redacción de modelos personalizados
Seleccione un proyecto de modelos personalizados.
En el proyecto, seleccione el elemento del menú
Models.En la lista resultante de modelos, seleccione los modelos que desea componer.
Elija el botón Redactar en la esquina superior izquierda.
En la ventana emergente, asigne un nombre al modelo recién compuesto y seleccione Redactar.
Una vez completada la operación, el modelo recién compuesto aparece en la lista.
Una vez que el modelo esté listo, use el comando Test para validarlo con los documentos de prueba y observar los resultados.
Análisis de documentos
La operación Analizar del modelo personalizado requiere que proporcione el parámetro modelID en la llamada a Documento de inteligencia. Debe proporcionar el identificador de modelo compuesto para el parámetro modelID en las aplicaciones.
Administración de los modelos compuestos
Puede administrar los modelos personalizados a lo largo de los ciclos de vida:
- Pruebe y valide nuevos documentos.
- Descargue el modelo para usarlo en las aplicaciones.
- Elimine el modelo cuando finalice su ciclo de vida.
¡Genial! Ha aprendido los pasos para crear modelos personalizados y compuestos y usarlos en los proyectos y aplicaciones de Document Intelligence.
Pasos siguientes
Pruebe uno de los inicios rápidos de Document Intelligence:
Document Intelligence usa tecnología avanzada de aprendizaje automático para detectar y extraer información de imágenes de documento y devolver los datos extraídos en una salida JSON estructurada. Con Document Intelligence, puede entrenar modelos personalizados independientes o combinar modelos personalizados para crear modelos compuestos.
Modelos personalizados. Los modelos personalizados de Document Intelligence permiten analizar y extraer datos de formularios y documentos específicos de su negocio. Los modelos personalizados se entrenan para los distintos datos y casos de uso.
Modelos compuestos. Para crear un modelo compuesto, se toma una colección de modelos personalizados y se asignan a un único modelo que abarca los tipos de formulario. Cuando se envía un documento a un modelo compuesto, el servicio realiza un paso de clasificación para decidir qué modelo personalizado representa con precisión el formulario presentado para el análisis.
En este artículo, aprenderá a crear modelos personalizados y compuestos de Document Intelligence mediante nuestra herramienta de etiquetado de ejemplo de Document Intelligence, API REST o bibliotecas cliente.
Herramienta de etiquetado de ejemplo
Pruebe a extraer datos de formularios personalizados mediante nuestra herramienta de etiquetado de ejemplo. Necesita los siguientes recursos:
Una suscripción Azure: puede crear una gratuita
Una instancia de Document Intelligence en el portal de Azure. Puede usar el plan de tarifa gratuito (
F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.
En la interfaz de usuario de Inteligencia de documentos:
- Seleccione Usar configuración personalizada para entrenar un modelo con etiquetas y obtener pares clave-valor.
- En la ventana siguiente, seleccione Nuevo proyecto:
Creación de modelos
Los pasos para crear, entrenar y usar modelos personalizados y compuestos son los siguientes:
- Ensamblar el conjunto de datos de entrenamiento
- Sube tu conjunto de entrenamiento al almacenamiento blob de Azure
- Entrena tu modelo personalizado
- Redacción de modelos personalizados
- Análisis de documentos
- Administración de los modelos personalizados
Ensamblar el conjunto de datos de entrenamiento
La creación de un modelo personalizado comienza con el establecimiento del conjunto de datos de entrenamiento. Necesita un mínimo de cinco formularios completados del mismo tipo para el conjunto de datos de ejemplo. Pueden ser de diferentes tipos de archivo (jpg, png, pdf, tiff) y contienen texto y escritura a mano. Los formularios deben cumplir los requisitos de entrada de Document Intelligence.
Carga del conjunto de datos de entrenamiento
Debe cargar sus datos de entrenamiento en un almacén de blobs de Azure. Si no sabe cómo crear una cuenta de almacenamiento de Azure con un contenedor, consulteinicio rápido de Azure Storage para el portal de Azure. Puede usar el plan de tarifa gratis (F0) para probar el servicio y actualizarlo más adelante a un nivel de pago para producción.
Entrenamiento del modelo personalizado
Entrenas tu modelo con conjuntos de datos etiquetados. Los conjuntos de datos etiquetados se basan en la API de diseño precompilada, pero se incluyen aportaciones humanas complementarias, como sus etiquetas específicas y las ubicaciones de los campos. Comience con al menos cinco formularios completados del mismo tipo para los datos de entrenamiento etiquetados.
Al entrenar con datos etiquetados, el modelo usa el aprendizaje supervisado para extraer valores de interés, mediante los formularios etiquetados que proporcione. Los datos etiquetados generan modelos de mejor rendimiento y pueden generar modelos que funcionan con formularios complejos o formularios que contienen valores sin claves.
Document Intelligence utiliza la API Layout para aprender los tamaños y posiciones esperados de los elementos de texto de tipografía y manuscritos, y extraer tablas. A continuación, usa etiquetas especificadas por el usuario para obtener información sobre las asociaciones de clave y valor y las tablas de los documentos. Se recomienda usar cinco formularios etiquetados manualmente del mismo tipo (misma estructura) para empezar a entrenar un nuevo modelo. Agregue más datos etiquetados según sea necesario para mejorar la precisión del modelo. Document Intelligence permite entrenar un modelo para extraer pares de valor clave y tablas mediante funcionalidades de aprendizaje supervisado.
Introducción al entrenamiento con etiquetas
[! VÍDEO https://mms.heiai.top/Shows/Docs-Azure/Azure-Form-Recognizer/player]
Creación de un modelo compuesto
Nota
Model Compose solo está disponible para modelos personalizados entrenados con etiquetas. Si intenta crear modelos sin etiquetar, se producirá un error.
Con la operación Model Compose, puede asignar hasta 200 modelos personalizados entrenados a un identificador de modelo único. Al llamar a Analyze con el identificador de modelo compuesto, La inteligencia de documentos clasifica primero el formulario que envió, elige el mejor modelo asignado coincidente y, a continuación, devuelve los resultados de ese modelo. Esta operación es útil cuando los formularios entrantes pueden pertenecer a una de varias plantillas.
Con la herramienta de etiquetado de ejemplo del Document Intelligence, la REST API o las bibliotecas de cliente, siga los pasos para configurar un modelo compuesto:
Reúne tus identificadores de modelo personalizados
Una vez completado correctamente el proceso de entrenamiento, al modelo personalizado se le asigna un identificador de modelo. Puede recuperar un identificador de modelo de la siguiente manera:
- Herramienta de etiquetado de ejemplo de Documento de inteligencia
- REST API
- SDK de biblioteca cliente
Al entrenar modelos mediante la herramienta de etiquetado de ejemplo de Document Intelligence, el identificador del modelo se encuentra en la ventana Resultado de entrenamiento:
Redacción de modelos personalizados
Después de recopilar los modelos personalizados que corresponden a un solo tipo de formulario, puede componerlos en un solo modelo.
- Herramienta de etiquetado de ejemplo de Documento de inteligencia
- REST API
- SDK de biblioteca cliente
La herramienta de etiquetado de muestras le permite empezar a entrenar rápidamente modelos y combinarlos en un único identificador de modelo.
Una vez completado el entrenamiento, componga los modelos de la siguiente manera:
En el menú de raíl izquierdo, seleccione el icono Composición del modelo (flecha de combinación).
En la ventana principal, seleccione los modelos que desea asignar a un identificador de modelo único. Los modelos con el icono de flechas ya están precompuestos.
Elija el botón Redactar en la esquina superior izquierda.
En la ventana emergente, asigne un nombre al modelo recién compuesto y seleccione Redactar.
Una vez completada la operación, el modelo recién compuesto aparece en la lista.
Análisis de documentos con el modelo personalizado o compuesto
La operación Analizar del formulario personalizado requiere que proporcione el parámetro modelID en la llamada a Documento de inteligencia. Puede proporcionar un identificador de modelo personalizado único o un identificador de modelo compuesto para el modelID parámetro .
- Herramienta de etiquetado de ejemplo de Documento de inteligencia
- REST API
- SDK de biblioteca cliente
En el menú del panel izquierdo de la herramienta, seleccione el
Analyzeicono (bombilla).Elija un archivo local o una dirección URL de imagen para analizar.
Seleccione el botón Ejecutar análisis .
La herramienta aplicará etiquetas en los cuadros de límite e informará del porcentaje de confianza de cada etiqueta.
Pruebe los modelos recién entrenados mediante el análisis de formularios que no formaban parte del conjunto de datos de entrenamiento. En función de la precisión notificada, es posible que desee realizar más entrenamiento para mejorar el modelo. Puede seguir entrenando para mejorar los resultados.
Administración de los modelos personalizados
Puede administrar los modelos personalizados a lo largo de su ciclo de vida viendo una lista de todos los modelos personalizados de su suscripción, recuperando información sobre un modelo personalizado específico y eliminando modelos personalizados de su cuenta.
¡Genial! Ha aprendido los pasos para crear modelos personalizados y compuestos y usarlos en los proyectos y aplicaciones de Document Intelligence.
Pasos siguientes
Para más información sobre la biblioteca cliente de Document Intelligence, explore nuestra documentación de referencia de API.