Analyzer - Analyze Layout

Extraiga información de texto y diseño de un documento determinado. El documento de entrada debe ser de uno de los tipos de contenido admitidos: "application/pdf", "image/jpeg", "image/png", "image/tiff" o "image/bmp". Como alternativa, use el tipo "application/json" para especificar la ubicación (URI o ruta de acceso local) del documento que se va a analizar.

POST {endpoint}/formrecognizer/v2.1/layout/analyze
POST {endpoint}/formrecognizer/v2.1/layout/analyze?pages={pages}&language={language}&readingOrder={readingOrder}

Parámetros de identificador URI

Nombre En Requerido Tipo Description
endpoint
path True

string

Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus2.api.cognitive.microsoft.com).

language
query

Language

Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico.

pages
query

string[]

Números de página personalizados para documentos de varias páginas (PDF/TIFF), escriba el número de páginas que desea obtener el resultado de OCR. Para un intervalo de páginas, use un guión. Separe cada página o intervalo con una coma.

readingOrder
query

ReadingOrder

Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural.

Encabezado de la solicitud

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Nombre Requerido Tipo Description
Ocp-Apim-Subscription-Key True

string

Cuerpo de la solicitud

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Nombre Tipo Description
source

string

minLength: 0
maxLength: 2048

Ruta de acceso de origen del archivo.

Respuestas

Nombre Tipo Description
202 Accepted

La solicitud se pone en cola correctamente.

Encabezados

Operation-Location: string

Other Status Codes

ErrorResponse

Entidad de respuesta que acompaña a respuestas no correctas que contienen detalles adicionales sobre el error.

Seguridad

Ocp-Apim-Subscription-Key

Tipo: apiKey
En: header

Ejemplos

Analyze layout

Solicitud de ejemplo

POST {endpoint}/formrecognizer/v2.1/layout/analyze?language=en

Respuesta de muestra

Operation-Location: {endpoint}/formrecognizer/v2.1/layout/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f

Definiciones

Nombre Description
ErrorInformation
ErrorResponse
Language

Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico.

ReadingOrder

Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural.

SourcePath

Uri o ruta de acceso local a los datos de origen.

ErrorInformation

Nombre Tipo Description
code

string

message

string

ErrorResponse

Nombre Tipo Description
error

ErrorInformation

Language

Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico.

Valor Description
af
ast
bi
br
ca
ceb
ch
co
crh
cs
csb
da
de
en
es
et
eu
fi
fil
fj
fr
fur
fy
ga
gd
gil
gl
gv
hni
hsb
ht
hu
ia
id
it
iu
ja
jv
kaa
kac
kea
kha
kl
ko
ku
kw
lb
ms
mww
nap
nl
no
oc
pl
pt
quc
rm
sco
sl
sq
sv
sw
tet
tr
tt
uz
vo
wae
yua
za
zh-Hans
zh-Hant
zu

ReadingOrder

Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural.

Valor Description
basic
natural

SourcePath

Uri o ruta de acceso local a los datos de origen.

Nombre Tipo Description
source

string

minLength: 0
maxLength: 2048

Ruta de acceso de origen del archivo.