Analyzer - Analyze Layout
Extraiga información de texto y diseño de un documento determinado. El documento de entrada debe ser de uno de los tipos de contenido admitidos: "application/pdf", "image/jpeg", "image/png", "image/tiff" o "image/bmp". Como alternativa, use el tipo "application/json" para especificar la ubicación (URI o ruta de acceso local) del documento que se va a analizar.
POST {endpoint}/formrecognizer/v2.1/layout/analyze
POST {endpoint}/formrecognizer/v2.1/layout/analyze?pages={pages}&language={language}&readingOrder={readingOrder}
Parámetros de identificador URI
| Nombre | En | Requerido | Tipo | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus2.api.cognitive.microsoft.com). |
|
language
|
query |
Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico. |
||
|
pages
|
query |
string[] |
Números de página personalizados para documentos de varias páginas (PDF/TIFF), escriba el número de páginas que desea obtener el resultado de OCR. Para un intervalo de páginas, use un guión. Separe cada página o intervalo con una coma. |
|
|
reading
|
query |
Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural. |
Encabezado de la solicitud
Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"
| Nombre | Requerido | Tipo | Description |
|---|---|---|---|
| Ocp-Apim-Subscription-Key | True |
string |
Cuerpo de la solicitud
Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"
| Nombre | Tipo | Description |
|---|---|---|
| source |
string minLength: 0maxLength: 2048 |
Ruta de acceso de origen del archivo. |
Respuestas
| Nombre | Tipo | Description |
|---|---|---|
| 202 Accepted |
La solicitud se pone en cola correctamente. Encabezados Operation-Location: string |
|
| Other Status Codes |
Entidad de respuesta que acompaña a respuestas no correctas que contienen detalles adicionales sobre el error. |
Seguridad
Ocp-Apim-Subscription-Key
Tipo:
apiKey
En:
header
Ejemplos
Analyze layout
Solicitud de ejemplo
POST {endpoint}/formrecognizer/v2.1/layout/analyze?language=en
Respuesta de muestra
Operation-Location: {endpoint}/formrecognizer/v2.1/layout/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f
Definiciones
| Nombre | Description |
|---|---|
|
Error |
|
|
Error |
|
| Language |
Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico. |
|
Reading |
Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural. |
|
Source |
Uri o ruta de acceso local a los datos de origen. |
ErrorInformation
| Nombre | Tipo | Description |
|---|---|---|
| code |
string |
|
| message |
string |
ErrorResponse
| Nombre | Tipo | Description |
|---|---|---|
| error |
Language
Actualmente, only Afrikaans ('af'), albanés ('sq'), asturiano ('ast'), vasco ('eu'), Bislama ('bi'), Breton ('br'), catalán ('ca'), Cebuano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Tatar de Crimea - Alfabeto latino('crh'), '), Checo ('cs'), danés ('da'), neerlandés ('nl'), inglés ('en'), estonio ('et'), fijiano ('fj'), filipino ('fil'), finlandés ('fi'), francés ('fr'), friuliano ('fur'), gallega ('gl'), alemán ('de'), Gilbertese ('gil'), islandés ('kl'), Criollo haití ('ht'), Hani ('hni'), Hmong Daw ('mww'), húngaro ('hu'), indonesio ('id'), Interlingua ('ia'), Inuktitut ('iu'), irlandés ('ga'), italiano ('it'), japonés ('ja'), javanés ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Kurdo - Alfabeto Latino ('ku'), K'iche' ('quc'), Luxemburgo ('lb'), Malayo ('ms'), Manx ('gv'), Neapolitan ('nap'), Noruego ('no'), Occitan ('oc'), Polaco ('pl'), Portugués ('pt'), Romano ('rm'), Escocesas ('sco'), Gaélico escocés ('gd'), chino simplificado ('zh-Hans'), esloveno ('sl'), español ('es'), swahili ('sw'), sueco ('sv'), tatar - alfabeto latino ('tt'), tetum ('tet'), chino tradicional ('zh-Hant'), Se admiten turcos ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Frisiano occidental ('fy'), Maya de Uzbekistec ('yua'), Zhuang ('za') y Zulu ('zu') (impresión – setenta y tres idiomas y manuscritos – solo inglés). Layout admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese como ese idioma específico.
| Valor | Description |
|---|---|
| af | |
| ast | |
| bi | |
| br | |
| ca | |
| ceb | |
| ch | |
| co | |
| crh | |
| cs | |
| csb | |
| da | |
| de | |
| en | |
| es | |
| et | |
| eu | |
| fi | |
| fil | |
| fj | |
| fr | |
| fur | |
| fy | |
| ga | |
| gd | |
| gil | |
| gl | |
| gv | |
| hni | |
| hsb | |
| ht | |
| hu | |
| ia | |
| id | |
| it | |
| iu | |
| ja | |
| jv | |
| kaa | |
| kac | |
| kea | |
| kha | |
| kl | |
| ko | |
| ku | |
| kw | |
| lb | |
| ms | |
| mww | |
| nap | |
| nl | |
| no | |
| oc | |
| pl | |
| pt | |
| quc | |
| rm | |
| sco | |
| sl | |
| sq | |
| sv | |
| sw | |
| tet | |
| tr | |
| tt | |
| uz | |
| vo | |
| wae | |
| yua | |
| za | |
| zh-Hans | |
| zh-Hant | |
| zu |
ReadingOrder
Algoritmo de orden de lectura para ordenar las líneas de texto devueltas. Los pedidos de lectura admitidos incluyen: basic(default), natural.
| Valor | Description |
|---|---|
| basic | |
| natural |
SourcePath
Uri o ruta de acceso local a los datos de origen.
| Nombre | Tipo | Description |
|---|---|---|
| source |
string minLength: 0maxLength: 2048 |
Ruta de acceso de origen del archivo. |