¿Qué es Azure Document Intelligence?

Completado

Sugerencia

Consulte la pestaña Texto e imágenes para obtener más detalles.

Azure Document Intelligence es un servicio de inteligencia artificial basado en la nube en Microsoft Foundry que usa modelos de OCR y aprendizaje profundo para extraer texto, pares clave-valor, marcas de selección y tablas de documentos.

OCR captura la estructura del documento creando cuadros delimitadores alrededor de los objetos detectados en una imagen. Las ubicaciones de los cuadros de límite se registran como coordenadas en relación con el resto de la página. Azure Document Intelligence devuelve datos del rectángulo delimitador y otra información en un formato JSON estructurado que preserva las relaciones del documento original.

Captura de pantalla en la que se muestra la inteligencia de documentos que analiza un documento de ejemplo con campos extraídos y cuadros de límite.

Para crear un modelo de extracción de documentos de alta precisión desde cero, requiere experiencia en aprendizaje profundo, grandes cantidades de proceso y tiempos de entrenamiento largos. Azure Document Intelligence proporciona modelos subyacentes ya entrenados en miles de ejemplos de formularios, por lo que puede lograr la extracción de datos de alta precisión con un esfuerzo mínimo.

Componentes del servicio Document Intelligence

Azure Document Intelligence se compone de tres categorías de modelos:

  • Modelos de análisis de documentos: extraiga texto, estructura, tablas y marcas de selección de documentos. El modelo de lectura extrae texto y detecta idiomas, mientras que el modelo de diseño agrega extracción de tablas y estructuras. Explorará estos modelos con detalle en la unidad Usar modelos precompilados .

  • Modelos creados previamente: extraiga información de tipos de documentos comunes ( como facturas, recibos, formularios fiscales, documentos de identificación, etc.) sin necesidad de entrenamiento. Verá la lista completa de los modelos precompilados disponibles en la unidad Usar modelos precompilados .

  • Modelos personalizados: extraiga datos de formularios específicos de su empresa mediante sus propios conjuntos de datos etiquetados. Las opciones incluyen modelos de plantilla personalizados (rápidos y rentables para diseños fijos), modelos neuronales personalizados (mayor precisión para diseños variables), modelos compuestos y clasificadores personalizados. Obtendrá información sobre el entrenamiento y el uso de modelos personalizados en la unidad Entrenar y usar modelos personalizados .

Acceso a los servicios de Inteligencia de documentos

Puede acceder a Azure Document Intelligence de varias maneras:

  • API REST: llame al servicio directamente mediante solicitudes HTTP.
  • SDK de biblioteca cliente: use SDK para Python, C#, Java y JavaScript.
  • Document Intelligence Studio: una herramienta en línea para explorar, probar y compilar soluciones de Document Intelligence visualmente.
  • Portal de Microsoft Foundry: Integre la Inteligencia de Documentos con otras herramientas de Foundry.

Sugerencia

El ejercicio de este módulo se centra en el SDK de Python. Cualquier idioma puede usar los servicios REST subyacentes.

Creación de un recurso de Documento de inteligencia

Para usar Azure Document Intelligence, necesita un recurso de Azure. Puede usar cualquiera de las siguientes opciones:

  • Un recurso Foundry: una suscripción multiservicio que proporciona acceso a diversos servicios de IA a través de un único punto de conexión y clave.
  • Un recurso de Azure Document Intelligence: un recurso exclusivo para uso con Inteligencia de Documentos.

Nota:

Cree un recurso foundry si planea acceder a varias herramientas de Foundry en un único punto de conexión y clave. Para el acceso exclusivo a Document Intelligence, cree un recurso dedicado de Document Intelligence.

Requisitos de entrada

Azure Document Intelligence funciona en documentos de entrada que cumplen estos requisitos:

  • El formato debe ser JPEG, PNG, BMP, PDF (texto o escaneado) o TIFF. El modelo de lectura también acepta formatos de archivo de Microsoft Office.
  • El tamaño del archivo debe ser inferior a 500 MB para el nivel estándar y 4 MB para el nivel gratis.
  • Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
  • Los documentos PDF deben tener dimensiones inferiores a 17 x 17 pulgadas (tamaño de papel A3).
  • Los documentos PDF no deben estar protegidos con contraseña.

Aprende más