Referencia de la tabla del sistema del historial de consultas
Importante
Esta tabla del sistema está en versión preliminar pública. Para acceder a la tabla, el esquema debe estar habilitado en el catálogo system
. Para obtener más información, consulte Habilitación de esquemas de tabla del sistema.
En este artículo, se incluye información sobre la tabla del sistema del historial de consultas, incluida una descripción del esquema de la tabla.
Importante
Para acceder a la tabla del sistema del historial de consultas, debe habilitar el esquema query
. Para obtener instrucciones sobre cómo habilitar los esquemas del sistema, consulte Habilitación de esquemas de tabla del sistema.
Ruta de acceso de tabla: esta tabla del sistema se encuentra en system.query.history
.
Uso de la tabla del historial de consultas
La tabla del historial de consultas incluye registros para cada instrucción SQL que se ejecuta mediante almacenes de SQL. La tabla incluye registros de toda la cuenta de todas las áreas de trabajo de la misma región desde la que se accede a la tabla.
De manera predeterminada, solo los administradores tienen acceso a la tabla del sistema. Si desea compartir los datos de la tabla con un usuario o grupo, Databricks recomienda crear una vista dinámica para cada usuario o grupo. Consulte Creación de una vista dinámica.
Esquema de la tabla del sistema del historial de consultas
La tabla del historial de consultas usa el esquema siguiente:
Nombre de la columna | Tipo de datos | Descripción | Ejemplo |
---|---|---|---|
account_id |
cadena | Id. de la cuenta. | 11e22ba4-87b9-4cc2 -9770-d10b894b7118 |
workspace_id |
string | Id. del área de trabajo donde se ejecutó la consulta. | 1234567890123456 |
statement_id |
string | Id. que identifica de forma única la ejecución de la instrucción. Puede usar este id. para buscar la ejecución de la instrucción en la interfaz de usuario del historial de consultas. | 7a99b43c-b46c-432b -b0a7-814217701909 |
session_id |
string | Id. de sesión de Spark. | 01234567-cr06-a2mp -t0nd-a14ecfb5a9c2 |
execution_status |
string | Estado de finalización de la instrucción. Los valores posibles son: - FINISHED : se ha realizado correctamente la ejecución- FAILED : error de ejecución con el motivo descrito en el mensaje de error que lo acompaña- CANCELED : se canceló la ejecución de la consulta |
FINISHED |
compute |
struct | Estructura que representa el tipo de recurso de proceso usado para ejecutar la instrucción y el id. del recurso cuando corresponda. El valor type será WAREHOUSE o SERVERLESS_COMPUTE . |
{ type: WAREHOUSE, cluster_id: NULL, warehouse_id: ec58ee3772e8d305 } |
executed_by_user_id |
string | Id. del usuario que ejecutó la instrucción. | 2967555311742259 |
executed_by |
string | Dirección de correo electrónico o nombre del usuario que ejecutó la instrucción. | example@databricks.com |
statement_text |
string | Texto de la instrucción SQL. Si ha configurado claves administradas por el cliente, statement_text está vacío. |
SELECT 1 |
statement_type |
string | Tipo de instrucción. Por ejemplo: ALTER , COPY y INSERT . |
SELECT |
error_message |
string | Mensaje que describe la condición de error. Si ha configurado claves administradas por el cliente, error_message está vacío. |
[INSUFFICIENT_PERMISSIONS] Insufficient privileges: User does not have permission SELECT on table 'default.nyctaxi_trips'. |
client_application |
string | Aplicación cliente que ejecutó la instrucción. Por ejemplo: Databricks SQL, Tableau y Power BI. | Databricks SQL |
client_driver |
string | Conector que se usa para conectarse a Azure Databricks para ejecutar la instrucción. Por ejemplo: Databricks SQL Driver for Go, Databricks ODBC Driver, Databricks JDBC Driver. | Databricks JDBC Driver |
total_duration_ms |
bigint | Tiempo total de ejecución de la instrucción en milisegundos (excepto el tiempo de captura de resultados). | 1 |
waiting_for_compute_duration_ms |
bigint | Tiempo dedicado a esperar a que los recursos de proceso se aprovisionen, en milisegundos. | 1 |
waiting_at_capacity_duration_ms |
bigint | Tiempo dedicado a esperar en cola por la capacidad de proceso disponible, en milisegundos. | 1 |
execution_duration_ms |
bigint | Tiempo dedicado a ejecutar la instrucción, en milisegundos. | 1 |
compilation_duration_ms |
bigint | Tiempo dedicado a la carga de los metadatos y la optimización de la instrucción, en milisegundos. | 1 |
total_task_duration_ms |
bigint | Suma de todas las duraciones de tareas, en milisegundos. Representa el tiempo combinado necesario para ejecutar la consulta en todos los núcleos de todos los nodos. Puede ser significativamente mayor que la duración del reloj si se ejecutan varias tareas en paralelo. Puede ser menor que la duración del reloj si las tareas esperan por los nodos disponibles. | 1 |
result_fetch_duration_ms |
bigint | Tiempo dedicado, en milisegundos, a la captura de resultados de la instrucción una vez finalizada la ejecución. | 1 |
start_time |
timestamp | Hora a la que Databricks recibió la solicitud. La información de zona horaria se registra al final del valor con +00:00 , que representa la hora UTC. |
2022-12-05T00:00:00.000+0000 |
end_time |
timestamp | Hora en que finalizó la ejecución de la instrucción, excluido el tiempo de captura de resultados. La información de zona horaria se registra al final del valor con +00:00 , que representa la hora UTC. |
2022-12-05T00:00:00.000+00:00 |
update_time |
timestamp | Hora en que la instrucción recibió una actualización de progreso por última vez. La información de zona horaria se registra al final del valor con +00:00 , que representa la hora UTC. |
2022-12-05T00:00:00.000+00:00 |
read_partitions |
bigint | Número de particiones leídas después de la eliminación. | 1 |
pruned_files |
bigint | Número de archivos eliminados. | 1 |
read_files |
bigint | Número de archivos leídos después de la eliminación. | 1 |
read_rows |
bigint | Número total de filas leídas por la instrucción. | 1 |
produced_rows |
bigint | Número total de filas devueltas por la instrucción. | 1 |
read_bytes |
bigint | Tamaño total de datos leídos por la instrucción, en bytes. | 1 |
read_io_cache_percent |
int | Porcentaje de bytes de datos persistentes leídos de la caché de E/S. | 50 |
from_result_cache |
boolean | TRUE indica que el resultado de la instrucción se capturó de la memoria caché. |
TRUE |
spilled_local_bytes |
bigint | Tamaño de los datos, en bytes, escritos temporalmente en el disco mientras se ejecuta la instrucción. | 1 |
written_bytes |
bigint | Tamaño de los datos persistentes, en bytes, escritos en el almacenamiento de objetos en la nube. | 1 |
shuffle_read_bytes |
bigint | Cantidad total de los datos, en bytes, enviados a través de la red. | 1 |
query_source |
struct | Estructura que contiene pares clave-valor que representan una o varias entidades de Databricks implicadas en la ejecución de esta instrucción, como trabajos, cuadernos o paneles. Este campo solo registra entidades de Databricks. | { job_info: { job_id: 64361233243479 job_run_id: 887406461287882 job_task_key: “job_task_1” job_task_run_id: 110378410199121 } |
executed_as |
string | Nombre del usuario o entidad de servicio cuyo privilegio se usó para ejecutar la instrucción. | example@databricks.com |
executed_as_user_id |
string | Identificador del usuario o entidad de servicio cuyo privilegio se usó para ejecutar la instrucción. | 2967555311742259 |
Visualización del perfil de consulta de un registro
Para navegar a un perfil de consulta en función de un registro de la tabla del historial de consultas, haga lo siguiente:
- Identifique el registro de interés y, luego, copie el
statement_id
del registro. - Haga referencia al
workspace_id
del registro para asegurarse de que ha iniciado sesión en la misma área de trabajo que el registro. - Haga clic en Historial de consultas en la barra lateral del área de trabajo.
- En el campo Id. de instrucción, pegue el
statement_id
en el registro. - Haga clic en el nombre de una consulta. Aparece información general de las métricas de consulta.
- Haga clic en Ver perfil de consulta.