Analyzer - Analyze Layout

Servicio:: Azure AI Services

Versión de la API:: 2.1

Extraiga información de texto y diseño de un documento determinado. El documento de entrada debe ser de uno de los tipos de contenido admitidos: "application/pdf", "image/jpeg", "image/png", "image/tiff" o "image/bmp". Como alternativa, use el tipo "application/json" para especificar la ubicación (URI o ruta de acceso local) del documento que se va a analizar.

POST {endpoint}/formrecognizer/v2.1/layout/analyze

Con parámetros opcionales:

POST {endpoint}/formrecognizer/v2.1/layout/analyze?pages={pages}&language={language}&readingOrder={readingOrder}

Parámetros de identificador URI

Nombre	En	Requerido	Tipo	Description
endpoint	path	True	string	Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus2.api.cognitive.microsoft.com).
language	query		Language	Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico.
pages	query		string[]	Números de página personalizados para documentos de varias páginas (PDF/TIFF), escriba el número de páginas que desea obtener el resultado de OCR. Para un intervalo de páginas, use un guión. Separe cada página o intervalo con una coma.
readingOrder	query		ReadingOrder	Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural.

Encabezado de la solicitud

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Nombre	Requerido	Tipo	Description
Ocp-Apim-Subscription-Key	True	string

Cuerpo de la solicitud

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Nombre	Tipo	Description
source	string minLength: 0 maxLength: 2048	Ruta de acceso de origen del archivo.

Respuestas

Nombre	Tipo	Description
202 Accepted		La solicitud se pone en cola correctamente. Encabezados Operation-Location: string
Other Status Codes	ErrorResponse	Entidad de respuesta que acompaña a respuestas no correctas que contienen detalles adicionales sobre el error.

Nombre

Tipo

Description

202 Accepted

La solicitud se pone en cola correctamente.

Encabezados

Operation-Location: string

Other Status Codes

ErrorResponse

Entidad de respuesta que acompaña a respuestas no correctas que contienen detalles adicionales sobre el error.

Seguridad

Ocp-Apim-Subscription-Key

Tipo: apiKey
En: header

Ejemplos

Analyze layout

Solicitud de ejemplo

HTTP

POST {endpoint}/formrecognizer/v2.1/layout/analyze?language=en

Respuesta de muestra

status code:: 202

Operation-Location: {endpoint}/formrecognizer/v2.1/layout/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f

Definiciones

Nombre	Description
ErrorInformation
ErrorResponse
Language	Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico.
ReadingOrder	Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural.
SourcePath	Uri o ruta de acceso local a los datos de origen.

ErrorInformation

Objeto

Nombre	Tipo	Description
code	string
message	string

ErrorResponse

Objeto

Nombre	Tipo	Description
error	ErrorInformation

Language

Enumeración

Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico.

Valor	Description
af
ast
bi
br
ca
ceb
ch
co
crh
cs
csb
da
de
en
es
et
eu
fi
fil
fj
fr
fur
fy
ga
gd
gil
gl
gv
hni
hsb
ht
hu
ia
id
it
iu
ja
jv
kaa
kac
kea
kha
kl
ko
ku
kw
lb
ms
mww
nap
nl
no
oc
pl
pt
quc
rm
sco
sl
sq
sv
sw
tet
tr
tt
uz
vo
wae
yua
za
zh-Hans
zh-Hant
zu

ReadingOrder

Enumeración

Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural.

Valor	Description
basic
natural

SourcePath

Objeto

Uri o ruta de acceso local a los datos de origen.

Nombre	Tipo	Description
source	string minLength: 0 maxLength: 2048	Ruta de acceso de origen del archivo.