Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Importante
Las tablas del sistema de MLflow se encuentran en versión preliminar pública.
Las mlflow tablas del sistema capturan metadatos del experimento administrados en el servicio de seguimiento de MLflow. Estas tablas permiten a los usuarios con privilegios aprovechar las herramientas de Lakehouse de Databricks en sus datos de MLflow en todas las áreas de trabajo de la región. Puede usar las tablas para crear paneles personalizados de INTELIGENCIA ARTIFICIAL o BI, configurar alertas de SQL o realizar consultas analíticas a gran escala.
A través de las tablas del mlflow sistema, los usuarios pueden responder preguntas como:
- ¿Qué experimentos tienen la confiabilidad más baja?
- ¿Cuál es el uso medio de GPU en diferentes experimentos?
Nota:
Las mlflow tablas del sistema comenzaron a registrar datos de MLflow de todas las regiones el 2 de septiembre de 2025. Es posible que los datos anteriores a esa fecha no estén disponibles.
Tablas disponibles
El mlflow esquema incluye las tablas siguientes:
-
system.mlflow.experiments_latest: registra nombres de experimentos y eventos de eliminación lógica. Estos datos son similares a la página de experimentos de la interfaz de usuario de MLflow. -
system.mlflow.runs_latest: registra información sobre el ciclo de vida de ejecución, los parámetros y las etiquetas asociados a cada ejecución y estadísticas agregadas de valores mínimos, máximos y más recientes de todas las métricas. Estos datos son similares a la página de búsqueda de ejecuciones o a la página de detalles de ejecuciones. -
system.mlflow.run_metrics_history: registra el nombre, el valor, la marca de tiempo y el paso de todas las métricas registradas durante las ejecuciones, que se pueden usar para trazar series de tiempo detalladas de las ejecuciones. Estos datos son similares a la pestaña de métricas de la página de detalles de procesos.
A continuación se muestra un ejemplo de representación gráfica de información de ejecución mediante un panel de control.
Esquemas de tabla
A continuación se muestran los esquemas de tabla con descripciones y datos de ejemplo.
system.mlflow.experiments_latest
| Nombre de la columna | Tipo de dato | Description | Example | Anulable |
|---|---|---|---|---|
account_id |
cuerda / cadena | Identificador de la cuenta que contiene el experimento de MLflow | "bd59efba-4444-4444-443f-44444449203" |
No |
update_time |
marca de tiempo | Hora del sistema en la que se actualizó por última vez el experimento | 2024-06-27T00:58:57.000+00:00 |
No |
delete_time |
marca de tiempo | Hora del sistema en la que el usuario eliminó temporalmente el experimento de MLflow. | 2024-07-02T12:42:59.000+00:00 |
Sí |
experiment_id |
cuerda / cadena | Identificador del experimento de MLflow | "2667956459304720" |
No |
workspace_id |
cuerda / cadena | Identificador del área de trabajo que contiene el experimento de MLflow | "6051921418418893" |
No |
name |
cuerda / cadena | Nombre proporcionado por el usuario del experimento | "/Users/first.last@databricks.com/myexperiment" |
No |
create_time |
marca de tiempo | Hora del sistema en la que se creó el experimento | 2024-06-27T00:58:57.000+00:00 |
No |
system.mlflow.runs_latest
| Nombre de la columna | Tipo de dato | Description | Example | Anulable |
|---|---|---|---|---|
account_id |
cuerda / cadena | Identificador de la cuenta que contiene la ejecución de MLflow | "bd59efba-4444-4444-443f-44444449203" |
No |
update_time |
marca de tiempo | Hora del sistema en la que se actualizó por última vez la ejecución | 2024-06-27T00:58:57.000+00:00 |
No |
delete_time |
marca de tiempo | Hora del sistema en la que el usuario eliminó temporalmente la ejecución de MLflow. | 2024-07-02T12:42:59.000+00:00 |
Sí |
workspace_id |
cuerda / cadena | Identificador del área de trabajo que contiene la ejecución de MLflow | "6051921418418893" |
No |
run_id |
cuerda / cadena | Identificador de la ejecución de MLflow | "7716d750d279487c95f64a75bff2ad56" |
No |
experiment_id |
cuerda / cadena | Identificador del experimento de MLflow que contiene la ejecución de MLflow | "2667956459304720" |
No |
created_by |
cuerda / cadena | Nombre del "principal", usuario o grupo de Databricks que creó el correr de MLflow. | "<user>@<domain-name>" |
Sí |
start_time |
marca de tiempo | Hora especificada por el usuario cuando se inició la ejecución de MLflow | 2024-06-27T00:58:57.000+00:00 |
No |
end_time |
marca de tiempo | Hora especificada por el usuario cuando finalizó la ejecución de MLflow | 2024-07-02T12:42:59.000+00:00 |
Sí |
run_name |
cuerda / cadena | Nombre de la ejecución de MLflow |
"wistful-deer-932", "my-xgboost-training-run" |
No |
status |
cuerda / cadena | Estado de la ejecución de la operación de MLflow | "FINISHED" |
No |
params |
map<cadena, cadena> | Parámetros clave-valor de la ejecución de MLflow | {"n_layers": "5", "batch_size": "64", "optimizer": "Adam"} |
No |
tags |
map<cadena, cadena> | Etiquetas clave-valor establecidas en la ejecución de MLflow | {"ready_for_review": "true"} |
No |
aggregated_metrics |
list<struct<string, double, double, double>> | Una vista consolidada que resume las métricas en el run_metrics_history | [{"metric_name": "training_accuracy", "latest_value": 0.97, "min_value": 0.8, "max_value": 1.0}, ...] |
No |
aggregated_metrics.metric_name |
cuerda / cadena | Nombre especificado por el usuario de la métrica | "training_accuracy" |
No |
aggregated_metrics.latest_value |
double | El valor más reciente de la métrica 'nombre_métrica' en la serie temporal de esta combinación (ejecución, 'nombre_métrica') en run_metrics_history. | 0.97 |
No |
aggregated_metrics.max_value |
double | Valor máximo del metric_name en la serie temporal de esta combinación (ejecutar, metric_name) en run_metrics_history. Si se registró un valor NaN para una métrica, el valor será NaN. | 1.0 |
No |
aggregated_metrics.min_value |
double | Valor mínimo del nombre de métrica dentro de la serie temporal de esta combinación (ejecución, nombre de métrica) en run_metrics_history. Si se registró un valor NaN para una métrica, el valor será NaN. | 0.8 |
No |
system.mlflow.run_metrics_history
| Nombre de la columna | Tipo de dato | Description | Example | Anulable |
|---|---|---|---|---|
account_id |
cuerda / cadena | Identificador de la cuenta que contiene la ejecución de MLflow en la que se registró la métrica. | "bd59efba-4444-4444-443f-44444449203" |
No |
insert_time |
marca de tiempo | Hora del sistema en la que se insertó la métrica | 2024-06-27T00:58:57.000+00:00 |
No |
record_id |
cuerda / cadena | Identificador único de la métrica para distinguir entre valores idénticos | "Ae1mDT5gFMSUwb+UUTuXMQ==" |
No |
workspace_id |
cuerda / cadena | Identificador del área de trabajo que contiene la ejecución de MLflow en la que se registró la métrica. | "6051921418418893" |
No |
experiment_id |
cuerda / cadena | Identificador del experimento de MLflow al que pertenece la ejecución de MLflow en la que se registró la métrica. | "2667956459304720" |
No |
run_id |
cuerda / cadena | Identificador de la ejecución de MLflow en la que se registró la métrica. | "7716d750d279487c95f64a75bff2ad56" |
No |
metric_name |
cuerda / cadena | El nombre de la métrica | "training_accuracy" |
No |
metric_time |
marca de tiempo | Hora especificada por el usuario en la que se calculó la métrica | 2024-06-27T00:55:54.1231+00:00 |
No |
metric_step |
bigint | El paso (por ejemplo, época) del entrenamiento del modelo o el desarrollo del agente en el que se registró la métrica | 10 |
No |
metric_value |
double | El valor de la métrica | 0.97 |
No |
Uso compartido del acceso con usuarios
De forma predeterminada, solo los administradores de cuentas tienen acceso a esquemas del sistema. Para conceder acceso a usuarios adicionales a las tablas, un administrador de la cuenta debe concederles los permisos USE y SELECT en el system.mlflow. esquema. Consulte Referencia de privilegios del catálogo de Unity.
Cualquier usuario que tenga acceso a estas tablas puede ver metadatos en todos los experimentos de MLflow para todas las áreas de trabajo de la cuenta. Para configurar el acceso a tablas para un grupo determinado en lugar de usuarios individuales, consulte Procedimientos recomendados del catálogo de Unity.
Si necesita un control más preciso que conceder a todos los usuarios acceso a la tabla, puede usar vistas dinámicas con criterios personalizados para conceder a grupos determinados accesos. Por ejemplo, podría crear una vista que solo muestre registros de un conjunto determinado de identificadores de experimento. Después de configurar una vista personalizada, asigne el nombre de la vista a los usuarios para que puedan consultar la vista dinámica en lugar de la tabla del sistema directamente.
Nota:
No se pueden sincronizar directamente los permisos del experimento de MLflow con permisos de catálogo de Unity.
Casos de uso de ejemplo de metadatos de MLflow
En las secciones siguientes se proporcionan ejemplos de cómo puede usar las tablas del sistema de MLflow para responder a preguntas sobre los experimentos y ejecuciones de MLflow.
Configuración de una alerta SQL para una confiabilidad de experimento baja
Con las alertas de SQL de Databricks (versión preliminar pública), puede programar una consulta periódica periódica y recibir notificaciones si ya no se cumplen determinadas restricciones.
En este ejemplo se crea una alerta que examina los experimentos que se ejecutan con más frecuencia en el área de trabajo para determinar si tienen una confiabilidad baja y pueden necesitar especial atención. La consulta usa la runs_latest tabla para calcular las ejecuciones por experimento marcadas como finalizadas, divididas por el número total de ejecuciones.
Nota:
La característica Alertas de SQL se encuentra actualmente en versión preliminar pública y también puede usar alertas heredadas .
Haga clic en
en la barra lateral y haga clic en Crear alerta.Copie y pegue la consulta siguiente en el editor de consultas.
SELECT experiment_id, AVG(CASE WHEN status = 'FINISHED' THEN 1.0 ELSE 0.0 END) AS success_ratio, COUNT(status) AS run_count FROM system.mlflow.runs_latest WHERE status IS NOT NULL GROUP BY experiment_id ORDER BY run_count DESC LIMIT 20;En el campo Condición, establezca las condiciones en
MIN success_ratio < 0.9. Esto desencadenará la alerta si cualquiera de los 20 experimentos principales (por número de ejecuciones) tiene una relación de éxito inferior a 90%.
Además, puede probar la condición, establecer una programación y configurar notificaciones. Para obtener más información sobre cómo configurar la alerta, consulte Configuración de una alerta SQL. A continuación se muestra una configuración de ejemplo mediante la consulta.
Consultas de ejemplo
Puede usar las siguientes consultas de ejemplo para obtener información sobre la actividad de MLflow en su cuenta mediante Databricks SQL. También puede aprovechar herramientas como cuadernos de Python con Spark.
Obtener información de ejecución de runs_latest
SELECT
run_name,
date(start_time) AS start_date,
status,
TIMESTAMPDIFF(MINUTE, start_time, end_time) AS run_length_minutes
FROM system.mlflow.runs_latest
WHERE
experiment_id = :experiment_id
AND run_id = :run_id
LIMIT 1
Esto devuelve información sobre la ejecución especificada:
Obtener información sobre experimentos y ejecuciones desde experiments_latest y runs_latest
SELECT
runs.run_name,
experiments.name,
date(runs.start_time) AS start_date,
runs.status,
TIMESTAMPDIFF(MINUTE, runs.start_time, runs.end_time) AS run_length_minutes
FROM system.mlflow.runs_latest runs
JOIN system.mlflow.experiments_latest experiments ON runs.experiment_id = experiments.experiment_id
WHERE
runs.experiment_id = :experiment_id
AND runs.run_id = :run_id
LIMIT 1
Obtén las estadísticas resumidas de una ejecución determinada desde run_metrics_history
SELECT
metric_name,
count(metric_time) AS num_data_points,
ROUND(avg(metric_value), 1) AS avg,
ROUND(max(metric_value), 1) AS max,
ROUND(min(metric_value), 1) AS min,
ROUND(PERCENTILE_CONT(0.25) WITHIN GROUP (ORDER BY metric_value), 1) AS pct_25,
ROUND(PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY metric_value), 1) AS median,
ROUND(PERCENTILE_CONT(0.75) WITHIN GROUP (ORDER BY metric_value), 1) AS pct_75
FROM
system.mlflow.run_metrics_history
WHERE
run_id = :run_id
GROUP BY
metric_name, run_id
LIMIT 100
Esto devuelve un resumen de las métricas de la clase especificada run_id:
Paneles de control para experimentos y ejecuciones
Puede crear dashboards a partir de los datos de las tablas del sistema de MLflow para analizar sus experimentos de MLflow y ejecuciones en todo el área de trabajo.
Para más información, consulte Creación de paneles con metadatos de MLflow en tablas del sistema.