Supervisión y observabilidad de los trabajos de Lakeflow

La interfaz de usuario de Azure Databricks le permite ver los trabajos a los que tiene acceso, examinar un historial de ejecuciones para cada trabajo e inspeccionar los detalles de las ejecuciones de trabajos individuales. Para configurar notificaciones para tareas, consulte Agregar notificaciones en una tarea.

Para obtener información sobre el uso de la CLI de Databricks para ver trabajos y ejecutar trabajos, ejecute los comandos de la CLI databricks jobs list -h, databricks jobs get -h y databricks jobs run-now -h. Para más información sobre el uso de la API de trabajos, consulte la API de trabajos.

Si tiene acceso al esquema system.lakeflow, también puede ver y consultar los registros de ejecuciones de trabajos y tareas de toda su cuenta. Vea Referencia de la tabla del sistema de trabajos. También puede unir las tablas del sistema de trabajos con tablas de facturación para supervisar el costo de los trabajos en toda la cuenta. Consulte Supervisión de los costes y el rendimiento de los trabajos con las tablas del sistema.

Ver trabajos y canalizaciones

Para ver la lista de trabajos a los que tiene acceso, haga clic en el icono Flujos de trabajo.Trabajos y canalizaciones en la barra lateral. La pestaña Trabajos y canalizaciones de la interfaz de usuario trabajos de Lakeflow muestra información sobre todos los trabajos y canalizaciones disponibles, como el creador, el desencadenador (si existe) y el resultado de las últimas cinco ejecuciones.

Para cambiar las columnas mostradas en la lista, haga clic en el icono Configuración de columna y seleccione o anule la selección de columnas.

Importante

La lista de trabajos y canalizaciones unificados está en versión preliminar pública. Puede deshabilitar la característica y volver a la experiencia predeterminada deshabilitando trabajos y canalizaciones: administración unificada, búsqueda y filtrado. Consulte Administración de versiones preliminares de Azure Databricks para más información.

Puede filtrar los trabajos en la lista Trabajos y canalizaciones , tal como se muestra en la captura de pantalla siguiente.

Vista de lista de trabajos con llamadas destacadas.

  1. Búsqueda de texto: la búsqueda de palabras clave es compatible con los campos Nombre e Id. de trabajo . Para buscar una etiqueta creada con una clave y un valor, puede buscar por la clave, el valor o la clave y el valor. Por ejemplo, para una etiqueta con la clave department y el valor finance, puede buscar department o finance para encontrar trabajos coincidentes. Para buscar por la clave y el valor, escriba la clave y el valor separados por dos puntos (por ejemplo, department:finance).
  2. Tipo: seleccione solo trabajos, canalizaciones o todos.
  3. Propietario: seleccione solo los trabajos o canalizaciones de los que es propietario.
  4. Favoritos: seleccione todos los trabajos o canalizaciones que haya marcado como favoritos.
  5. Etiquetas: use etiquetas. Para buscar por etiqueta, puede usar el menú desplegable etiquetas para filtrar hasta cinco etiquetas al mismo tiempo o usar directamente la búsqueda de palabras clave.
  6. Ejecutar como: filtre por hasta dos valores run as.

Para iniciar un trabajo o una canalización, haga clic en el botón de reproducir Icono de reproducción. Para detener un flujo de trabajo, haga clic en el botón Icono de Detener. Para acceder a otras acciones, haga clic en el icono de menú de kebab.. Por ejemplo, puede eliminar el flujo de trabajo o la configuración de acceso de una canalización desde este menú.

Visualización de ejecuciones de un solo trabajo

Puede ver una lista de ejecuciones actualmente en ejecución y recientemente completadas para un trabajo al que tiene acceso, incluidas las ejecuciones iniciadas por herramientas de orquestación externas, como Apache Airflow o Azure Data Factory. Para ver la lista de ejecuciones de trabajos recientes:

  1. En la barra lateral del área de trabajo de Azure Databricks, haga clic en Trabajos y canalizaciones.

  2. Opcionalmente, seleccione los filtros Trabajos y Propiedad de mí .

  3. Haga clic en el vínculo Nombre del trabajo.

    La pestaña Ejecuciones aparece con las vistas de matriz y lista de las ejecuciones activas y completadas.

La vista de matriz muestra un historial de ejecuciones para el trabajo, incluida cada tarea de trabajo.

vista de matriz de trabajos.

La fila Duración total de ejecución de la matriz muestra la duración total de la ejecución y su estado. Para ver los detalles de la ejecución, incluida la hora de inicio, la duración y el estado, mantenga el puntero sobre la barra de la fila Duración total de ejecución.

Cada celda de la fila Tareas representa una tarea y el estado correspondiente de la tarea. Para ver los detalles de cada tarea, incluida la hora de inicio, la duración, el clúster y el estado, mantenga el puntero sobre la celda de esa tarea.

Las barras de ejecución de trabajos y de ejecución de tareas están codificadas por colores para indicar el estado de la ejecución. Las ejecuciones exitosas son verdes. Las ejecuciones incorrectas son rojas, las ejecuciones omitidas son rosas y las ejecuciones en espera de reintento son amarillas. Pendiente, cancelado o caducado son grises. La altura de las barras de cada ejecución de trabajo y de tarea indica visualmente la duración de esa ejecución.

Si ha configurado una hora de finalización esperada, la vista de matriz mostrará una advertencia cuando la duración de una ejecución supere el tiempo configurado.

De forma predeterminada, la vista de lista de ejecuciones muestra lo siguiente:

  • Hora de inicio de la ejecución.
  • El identificador de ejecución. Consulte Dirección URL y identificador de ejecución del trabajo para obtener información sobre cómo buscar y compartir la dirección URL de ejecución.
  • Si la ejecución se desencadenó mediante una programación de trabajo o una solicitud de API, o si se inició manualmente.
  • Tiempo transcurrido para un trabajo que se ejecuta actualmente o el tiempo total de ejecución de una ejecución completada. Se muestra una advertencia si la duración supera un tiempo de finalización esperado configurado.
  • El estado de la ejecución, ya sea En cola, Pendiente, En ejecución, Omitida, Completada, Error, Expirada, Cancelando o Cancelada.
  • Código de error con el que finalizó la ejecución.
  • Parámetros de ejecución.

Actualmente, las ejecuciones activas muestran un botón de detención. Para detener todas las ejecuciones activas y en cola, seleccione Cancelar ejecuciones o Cancelar todas las ejecuciones en cola en el menú desplegable.

Para acceder a acciones del contexto específicas para la ejecución, haga clic en el icono de menú Kebab. (por ejemplo, para detener una ejecución activa o eliminar una completada).

Para cambiar las columnas mostradas en la vista de lista de ejecuciones, haga clic en Icono Configuración y seleccione o anule la selección de columnas.

Para ver los detalles de ejecución de un trabajo, haga clic en el vínculo de la ejecución en la columna Hora de inicio de la vista de lista de ejecuciones. Para ver los detalles de la ejecución correcta más reciente de este trabajo, haga clic en Ir a la ejecución correcta más reciente.

Azure Databricks mantiene un historial de las ejecuciones de trabajo durante un máximo de 60 días. Si necesita conservar las ejecuciones de trabajos, Databricks recomienda exportar los resultados antes de que expiren. Para más información, consulte Exportación de resultados de ejecución de trabajos.

Visualización de los detalles de ejecución de un trabajo

La página de detalles de ejecución del trabajo contiene la salida del trabajo y vínculos a los registros, incluida la información sobre el éxito o error de cada tarea de la ejecución del trabajo. Puede acceder a los detalles de ejecución del trabajo desde la pestaña Runs (Ejecuciones) del trabajo.

Para ver los detalles de ejecución de un trabajo desde la pestaña Ejecuciones, haga clic en el vínculo de la ejecución en la columna Hora de inicio de la vista de lista de ejecuciones. Para volver a la pestaña Ejecuciones del trabajo, haga clic en el valor Id. de trabajo.

Los trabajos con varias tareas tienen además un gráfico, una escala de tiempo y una vista de lista.

Vista de gráfico

Haga clic en un nodo de tarea en el gráfico para ver los detalles de la ejecución de tareas, entre los que se incluyen:

  • Detalles de la tarea, como la ejecución, cómo se inició el trabajo, la hora de inicio, la hora de finalización, la duración y el estado.
  • Código fuente.
  • El clúster que ejecutó la tarea y proporciona enlaces a su historial de consultas y registros de actividad.
  • Métricas de la tarea.

Vista de gráfico de trabajos.

Vista de escala de tiempo

Los trabajos que contienen varias tareas tienen una vista de escala de tiempo para identificar las tareas que tardan mucho tiempo en completarse, comprender las dependencias y superponerse para ayudar a depurar y optimizar estos trabajos.

vista de la cronología de trabajos.

En el caso de los trabajos sin servidor, las consultas y los perfiles de consulta se integran en la vista de escala de tiempo. Haga clic en la flecha situada junto a un nombre de tarea para ver las instrucciones de consulta y sus duraciones y, a continuación, haga clic en una instrucción para ir al perfil de consulta correspondiente. Consulte Visualización de los detalles de la consulta para las ejecuciones de trabajos.

Vista de lista

De forma predeterminada, la vista de lista muestra el estado, el nombre, el tipo, el recurso, la duración y las dependencias. Puede agregar y quitar columnas en esta vista.

Puede buscar una tarea por nombre, filtrar por estado de tarea o tipo de tarea y ordenar las tareas por estado, nombre o duración.

Haga clic en el valor Job ID (Id. de trabajo) para volver a la pestaña Runs (Ejecuciones) del trabajo.

vista de lista de trabajos.

Cómo Azure Databricks determina el estado de ejecución del trabajo

Azure Databricks determina si una ejecución de un trabajo fue exitosa basándose en el resultado de las tareas hoja del trabajo. Una tarea hoja es una tarea que no tiene dependencias descendentes. Una ejecución de trabajos puede tener uno de los siguientes resultados:

  • Correcto: todas las tareas se realizaron correctamente.
  • Correcto con errores: algunas tareas han producido un error, pero todas las tareas hoja se realizaron correctamente.
  • Error: error en una o varias tareas hoja.
  • Omitida: se omitió la ejecución del trabajo (por ejemplo, una tarea podría omitirse porque superó el máximo de ejecuciones simultáneas para el trabajo o el área de trabajo).
  • Tiempo límite excedido: la ejecución del trabajo tardó demasiado tiempo en completarse y agotó el tiempo límite.
  • Cancelado: la ejecución del trabajo se canceló (por ejemplo, un usuario canceló manualmente la ejecución en curso).

Las tareas individuales también pueden finalizar con un estado Disabled cuando se deshabilitan explícitamente en la configuración del trabajo o cuando Lakeflow Jobs las deshabilita para una ejecución porque una tarea precedente está deshabilitada. Un icono de círculo grande desactivado se muestra en la esquina superior derecha del DAG para las tareas deshabilitadas. Consulte Tareas deshabilitadas en trabajos de Lakeflow.

Ver métricas para tareas de streaming

Importante

La observabilidad de streaming para Lakeflow Jobs está en versión preliminar pública.

Al consultar los detalles de ejecución del trabajo, puede obtener datos sobre cargas de trabajo de streaming con métricas de observabilidad de streaming en la interfaz de usuario de trabajos. Estas métricas incluyen segundos de trabajo pendiente, bytes de trabajo pendiente, registros de trabajo pendiente y archivos de trabajo pendiente para orígenes compatibles con Spark Structured Streaming, como Apache Kafka, Amazon Kinesis, Auto Loader, Google Pub/Sub y tablas Delta. Las métricas se muestran como gráficos en el panel derecho al ver los detalles de ejecución de una tarea. Las métricas que se muestran en cada gráfico son valores máximos agregados por minuto y pueden incluir hasta las 48 horas anteriores.

Cada origen de streaming solo admite métricas específicas. Las métricas no admitidas por un origen de streaming no están disponibles para ver en la interfaz de usuario. En la tabla siguiente se muestran las métricas disponibles para los orígenes de streaming admitidos:

fuente bytes de trabajos pendientes registros de trabajos pendientes segundos de trabajos pendientes archivos pendientes
Kafka
Kinesis
Delta
Cargador automático
Google Pub/Sub

También puede especificar umbrales para cada métrica de streaming y configurar notificaciones si una secuencia supera un umbral durante la ejecución de una tarea. Consulte Configuración de notificaciones para trabajos lentos.

Para ver las métricas de streaming de una ejecución de una tarea que transmite los datos de una de las fuentes de Structured Streaming admitidas:

  1. En la página Detalles de ejecución del trabajo, haga clic en la tarea para la que desea ver las métricas.
  2. Haga clic en la pestaña Métricas en el panel Ejecución de tarea.
  3. Para abrir el gráfico de una métrica, haga clic en Símbolo de intercalación correcto junto al nombre de la métrica.
  4. Para ver las métricas de una secuencia específica, escriba el identificador de secuencia en el cuadro de texto Filtrar por identificador de flujo. Puede encontrar el identificador de flujo en la salida de la ejecución del trabajo.
  5. Para cambiar el período de tiempo de los gráficos de métricas, use el menú desplegable de hora.
  6. Para desplazarse por las secuencias si la ejecución contiene más de diez secuencias, haga clic en Siguiente o Anterior.

Limitaciones de observabilidad de streaming

  • Las métricas se actualizan cada minuto a menos que una ejecución tenga más de cuatro secuencias. Si una ejecución tiene más de cuatro secuencias, las métricas se actualizan cada cinco minutos.
  • Las métricas solo se recopilan para las primeros cincuenta secuencias de cada ejecución.
  • Las métricas se recopilan a intervalos de un segundo. Es posible que las métricas no sean visibles si la triggerInterval configuración es inferior a un segundo.
  • La mayoría de los orígenes de datos recopilan métricas de streaming de forma predeterminada. Sin embargo, para otros usuarios, debe habilitar esta característica. Si el origen de datos no recopila métricas de streaming, establezca la bandera spark.sql.streaming.metricsEnabled en True.

Visualización de métricas de rendimiento de consultas para trabajos sin servidor

Importante

Esta característica se encuentra en su versión beta. Los administradores del área de trabajo pueden controlar el acceso a esta característica desde la página Vistas previas . Consulte Administrar versiones preliminares de Azure Databricks.

Al ejecutar un trabajo sin servidor, Databricks expone las métricas del perfil de consulta seleccionadas y la información de rendimiento directamente en la interfaz de usuario de ejecución del trabajo, por lo que puede identificar problemas de rendimiento sin abrir un perfil de consulta independiente para cada consulta. Use estas métricas para investigar por qué una ejecución es lenta o para comparar el rendimiento entre dos ejecuciones.

Antes de poder ver estas métricas:

  • La versión preliminar de la observabilidad de rendimiento de Lakeflow mejorada debe estar habilitada para el área de trabajo. Los administradores del área de trabajo pueden habilitarlo desde la página Vistas previas.
  • El área de trabajo debe tener acceso a Información de rendimiento de consultas. Sin ella, los indicadores de bombilla no aparecen, aunque todavía se muestran las métricas agregadas (lectura de filas, filas escritas y recuento total de consultas).

Databricks muestra las métricas siguientes, agregadas a partir de las consultas de una ejecución de trabajo sin servidor:

  • Filas leídas y filas escritas por ejecución de tarea.
  • Número total de consultas por ejecución de tareas.
  • Indicador de información de rendimiento (bombilla) en una tarea cuando una o varias consultas de esa tarea tienen información sobre el rendimiento.

Estas métricas aparecen en diferentes lugares según cómo veas la ejecución:

Donde aparece Lo que ve
Barra lateral de ejecución de tareas Filas leídas y escritas, recuento total de consultas y un indicador de información para la ejecución de la tarea.
Vista de DAG Una insignia con forma de bombilla en un nodo de la tarea cuando cualquiera de las consultas de la tarea tiene información de rendimiento.
Vista de escala de tiempo Una bombilla junto al nombre de la tarea con el número de hallazgos en todas las consultas de la tarea, además de una bombilla en cada consulta de la tarea que contiene hallazgos.
Vista de lista Una bombilla en la columna Insights cuando cualquiera de las consultas de la tarea tiene información sobre el rendimiento. Si no ve esta columna, agréguela desde el selector de columnas.

Nota

La vista de cronología ya está disponible para los trabajos con una sola tarea como parte de esta beta. Antes, solo los trabajos multitarea tenían una vista de cronología.

Comportamiento al hacer clic y al pasar el cursor:

  • En la vista Cronología, pase el cursor sobre una tarea para ver sus métricas agregadas y cualquier información sobre el rendimiento de las consultas de la tarea.
  • En la vista DAG o en la vista Lista, haga clic en la bombilla de una tarea para abrir la vista Escala de tiempo con las consultas de esa tarea expandidas.
  • En la vista Escala de tiempo, haga clic en el texto de consulta de una consulta que tenga una bombilla para abrir un panel con información general sobre la información de rendimiento de esa consulta.

Para investigar por qué un trabajo sin servidor se ejecuta más lentamente de lo esperado:

  1. Abre la ejecución del trabajo.
  2. Cambiar a la vista Cronología.
  3. Identifique las tareas que tardan más de lo esperado en función de la distribución de duración.
  4. Pase el cursor sobre una tarea de ejecución prolongada para ver:
    • Filas leídas y filas escritas: compruebe si la tarea procesó más datos de lo habitual.
    • Número total de consultas: cambios puntuales en la forma de la carga de trabajo.
    • Indicador de información de rendimiento: regresiones puntuales o cambios de código ineficaces.
  5. Si el aumento de la duración se explica mediante un mayor volumen de datos, se puede esperar la ralentización. De lo contrario, expanda la tarea en la línea de tiempo para ver sus consultas individuales. Las consultas con información detectada muestran una bombilla junto a ellas.
  6. Haga clic en el texto de la consulta de una consulta que tenga una bombilla para abrir un panel con información detallada sobre el rendimiento de esa consulta.
  7. Aplique los cambios recomendados y vuelva a ejecutar el trabajo para confirmar que se ha resuelto el problema.

Para obtener la lista completa de información y lo que significan, consulte Información de rendimiento de consultas. Para obtener más detalles sobre la ejecución de consultas, consulte Perfil de consulta.

Tip

Estas mismas métricas facilitan la búsqueda de diferencias entre una ejecución lenta y una ejecución rápida anterior. Abra ambas ejecuciones en paralelo y compare:

  • Filas leídas y filas escritas para detectar cambios en el volumen de datos.
  • Número total de consultas para identificar los cambios en la forma de la carga de trabajo.
  • Información de rendimiento para identificar las ineficiencias introducidas desde la ejecución anterior.

Limitaciones de las métricas de rendimiento de consultas

  • Estas métricas y conclusiones solo se aplican a trabajos de Lakeflow sin servidor . Los trabajos que se ejecutan en cómputo clásico no muestran esta información.
  • Las métricas se agregan en las primeras 100 consultas de una ejecución de trabajo. Si una ejecución tiene más consultas, solo las primeras 100 consultas se tienen en cuenta en los totales.

Ver el historial de ejecución de trabajos

Para ver el historial de ejecución de una tarea, incluidas las ejecuciones correctas y incorrectas:

  1. Haga clic en una tarea en la página Detalles de ejecución del trabajo . Se muestra la página Detalles de ejecución de la tarea.
  2. Seleccione la ejecución de la tarea en el menú desplegable historial de ejecución.

Visualización del historial de ejecución de trabajos de un trabajo For each

El acceso al historial de ejecución de una For each tarea es el mismo que para una tarea de trabajos de Lakeflow estándar. Puede hacer clic en el nodo de trabajo For each en la página Detalles de ejecución del trabajo o en la celda correspondiente de la vista de matriz. Sin embargo, a diferencia de una tarea estándar, los detalles de ejecución de una For each tarea se presentan como una tabla de las iteraciones de la tarea anidada.

Para ver solo iteraciones con errores, haga clic en Solo iteraciones con errores.

Para ver la salida de una iteración, haga clic en los valores Hora de inicio o Hora de finalización de la iteración.

Historial de ejecución de trabajos para cada tarea.

Visualización de ejecuciones recientes en todos los trabajos y canalizaciones

Puede ver una lista de ejecuciones actualmente en ejecución y completadas recientemente para todos los trabajos y canalizaciones de un área de trabajo a la que tiene acceso, incluidas las ejecuciones iniciadas por herramientas de orquestación externas, como Apache Airflow o Azure Data Factory. Para ver la lista de ejecuciones recientes:

  1. Haga clic en el icono Flujos de trabajo.Trabajos y canalizaciones en la barra lateral.
  2. Haga clic en la pestaña Ejecuciones para mostrar el gráfico de Conteo de ejecuciones finalizadas y la lista de ejecuciones de trabajos y de canalizaciones.
  3. (Opcional) Haga clic en Trabajos o canalizaciones para filtrar la lista por tipo.

Lista de ejecuciones unificadas.

La lista de ejecuciones incluye opciones de filtrado en la parte superior, un gráfico de ejecuciones finalizadas recientemente y cinco errores principales, y una lista de ejecuciones completadas recientemente.

Puede filtrar por:

  • Nombre del trabajo o flujo de trabajo.
  • Todos, trabajos o canalizaciones.
  • Tipo de canalización (ETL, Ingesta, MV/ST o Sincronización de tablas de base de datos).
  • El elemento Run as user (Ejecutar como usuario).
  • Identificador de ejecución para buscar una ejecución específica.
  • Hora de inicio de ejecución (en las últimas 48 horas).
  • Estado De ejecución.
  • El código de error de las ejecuciones con errores.

Los filtros se aplican al gráfico, los códigos de error y la lista de ejecuciones.

Nota

Las ejecuciones enviadas a través del endpoint runs/submit de Jobs API, incluidas las ejecuciones de Apache Airflow DatabricksSubmitRunOperator, son ejecuciones puntuales que no están asociadas a ningún trabajo guardado. Dado que estas ejecuciones no tienen ningún trabajo asociado, no puede encontrarlos filtrando por un nombre de trabajo. Filtrar por ID de ejecución, Ejecutar como o Hora de inicio en su lugar. Para crear trabajos duraderos que aparezcan en búsquedas de Name y admitan reintentos, cree un trabajo y, a continuación, ejecútelo en lugar de usar runs/submit.

Gráfico de recuento de ejecuciones finalizadas

El gráfico Recuento de ejecuciones finalizadas muestra el número de ejecuciones completadas en las últimas 48 horas. De forma predeterminada, el gráfico muestra ejecuciones erróneas, omitidas y correctas. También puede filtrar el gráfico para mostrar estados de ejecución específicos o restringir el gráfico a un intervalo de tiempo específico.

Gráfico de recuento de ejecuciones finalizadas de trabajos.

Nota

El gráfico Número de ejecuciones finalizadas solo aparece cuando filtras por Trabajos o Canales. No se muestra cuando se selecciona Todo . A los administradores se les muestra el gráfico de todas las ejecuciones. En el caso de los no administradores, debe hacer clic en Ejecutar como y seleccionar me.

Los filtros de la parte superior de la pestaña Ejecuciones se aplican al gráfico.

Para limitar el intervalo de tiempo que se muestra en el gráfico Recuento de ejecuciones finalizadas , defina un intervalo de tiempo en el filtro. Como alternativa, puede hacer clic y arrastrar el cursor en el gráfico para seleccionar el intervalo de tiempo. El gráfico y la tabla de ejecuciones se actualizan para mostrar únicamente las ejecuciones correspondientes al intervalo de tiempo definido.

La tabla Top 5 tipos de error muestra una lista de los tipos de error más frecuentes del intervalo de tiempo seleccionado, lo que le permite ver rápidamente las causas más comunes de problemas en el área de trabajo.

Lista de ejecuciones

La pestaña Ejecuciones también incluye una tabla de ejecuciones de tareas y canalizaciones de los últimos 60 días. Azure Databricks conserva el historial de ejecuciones durante 60 días tanto para los trabajos como para las canalizaciones. De forma predeterminada, la tabla incluye detalles sobre ejecuciones fallidas, omitidas y satisfactorias.

Lista de ejecuciones.

Los filtros de la parte superior de la pestaña Ejecuciones se aplican a la lista.

De forma predeterminada, la lista de ejecuciones de la tabla de ejecuciones muestra lo siguiente:

  • Hora de inicio de la ejecución.
  • El nombre del trabajo o proceso asociado a la ejecución.
  • Tipo (Job o Pipeline) de la ejecución.
  • El nombre de usuario con el que se ejecuta la ejecución.
  • Cómo se desencadenó la ejecución (iniciada), mediante una programación o una solicitud de API, o se inició manualmente.
  • Tiempo transcurrido para un trabajo o canalización que se está ejecutando actualmente o el tiempo de ejecución total de una ejecución completada. Se muestra una advertencia si la duración supera un tiempo de finalización esperado configurado.
  • El estado de la ejecución: En cola, Pendiente, En ejecución, Omitida, Completada, Error, Expirada, Cancelando o Cancelada.
  • Cualquier código de error con el que finalizó la ejecución.
  • Cualquier parámetro de la ejecución.
  • Para detener un trabajo o una canalización en ejecución, haga clic en el botón Detener. Para acceder a las acciones de la ejecución, haga clic en el icono de menú Kebab. (por ejemplo, para detener una ejecución activa o eliminar una ejecución completada).

Para cambiar las columnas mostradas en la lista de ejecuciones, haga clic en el icono Columnas y seleccione o desmarque columnas.

Para ver los detalles de la ejecución del trabajo, haga clic en el vínculo de la columna Hora de inicio de la ejecución. Para ver los detalles del trabajo o de la pipeline, haga clic en el nombre en la columna Job.

Visualización de la información de linaje de un trabajo

Si Unity Catalog está habilitado en el área de trabajo, puede ver la información de linaje de las tablas de Unity Catalog en el flujo de trabajo. Si la información de linaje está disponible para su flujo de trabajo, verá un enlace con el número de tablas de origen y de destino en el panel Detalles del trabajo de su trabajo, en el panel Detalles de la ejecución del trabajo de una ejecución de trabajo o en el panel Detalles de la ejecución de la tarea de una ejecución de tarea. Haga clic en el vínculo para mostrar la lista de tablas. Haga clic en una tabla para ver la información detallada en Catalog Explorer.

Visualización y ejecución de un trabajo creado con agrupaciones de automatización declarativa

Puede usar la interfaz de usuario de trabajos de Lakeflow para ver y ejecutar trabajos implementados por agrupaciones de Automatización declarativa. De forma predeterminada, estos trabajos son de solo lectura en la interfaz de usuario Trabajos. Para editar un trabajo implementado por una agrupación, cambie el archivo de configuración del lote y vuelva a implementar el trabajo. La aplicación de cambios solo a la configuración de agrupación garantiza que los archivos de origen del lote siempre capturen la configuración del trabajo actual.

Sin embargo, si debe realizar cambios inmediatos en un trabajo, puede desconectar el trabajo de la configuración de agrupación para habilitar la edición de la configuración del trabajo en la interfaz de usuario. Para desconectar el trabajo, haga clic en Desconectar del origen. En el cuadro de diálogo Desconectar del origen, haga clic en Desconectar para confirmar.

Los cambios realizados en el trabajo de la interfaz de usuario no se aplican a la configuración de agrupación. Para aplicar los cambios realizados en la interfaz de usuario a la agrupación, debe actualizar manualmente la configuración de agrupación. Para volver a conectar el trabajo a la configuración de agrupación, vuelva a implementar el trabajo mediante la agrupación.

Exportación de los resultados de la ejecución del trabajo

Puede exportar los resultados de la ejecución del cuaderno y los registros de ejecución de trabajos para todos los tipos de trabajo.

Exportación de resultados de ejecución de cuadernos

Puede conservar las ejecuciones de trabajos exportando sus resultados. Para las ejecuciones de trabajos de cuaderno, puede exportar un cuaderno representado que se pueda importar más adelante en el área de trabajo de Azure Databricks.

Para exportar los resultados de la ejecución del cuaderno para un trabajo con una sola tarea:

  1. En la página de detalles del trabajo, haga clic en el vínculo View Details (Ver detalles) de la ejecución en la columna Run (Ejecución) de la tabla Completed Runs (past 60 days) [Ejecuciones finalizadas (últimos 60 días)].
  2. Haga clic en Export to HTML (Exportar a HTML).

Para exportar los resultados de la ejecución del cuaderno para un trabajo con varias tareas:

  1. En la página de detalles del trabajo, haga clic en el vínculo View Details (Ver detalles) de la ejecución en la columna Run (Ejecución) de la tabla Completed Runs (past 60 days) [Ejecuciones finalizadas (últimos 60 días)].
  2. Haga clic en la tarea del cuaderno que quiere exportar.
  3. Haga clic en Export to HTML (Exportar a HTML).

Exportación de registros de ejecución de trabajos

También puede exportar los registros de la ejecución del trabajo. Puede configurar el trabajo para entregar registros automáticamente a DBFS mientras configura el proceso de trabajos (consulte Referencia de configuración de proceso) o a través de la API de trabajos. Vea el objeto new_cluster.cluster_log_conf en el cuerpo de la solicitud pasado a la operación Create a new job (Crear un trabajo) (POST /jobs/create) en la API de trabajos.