Bagikan melalui


Eksperimen MLflow

Sumber data eksperimen MLflow menyediakan API standar untuk memuat data yang dijalankan eksperimen MLflow. Anda dapat memuat data dari eksperimen buku catatan, atau Anda dapat menggunakan ID eksperimen atau nama eksperimen MLflow.

Persyaratan

Databricks Runtime 6.0 ML atau di atasnya.

Memuat data dari eksperimen buku catatan

Untuk memuat data dari eksperimen buku catatan, gunakan load().

Python

df = spark.read.format("mlflow-experiment").load()
display(df)

Scala

val df = spark.read.format("mlflow-experiment").load()
display(df)

Memuat data menggunakan ID eksperimen

Untuk memuat data dari satu atau beberapa eksperimen ruang kerja, tentukan ID eksperimen seperti yang ditunjukkan.

Python

df = spark.read.format("mlflow-experiment").load("3270527066281272")
display(df)

Scala

val df = spark.read.format("mlflow-experiment").load("3270527066281272,953590262154175")
display(df)

Memuat data menggunakan nama eksperimen

Anda juga dapat meneruskan nama eksperimen ke metode load().

Python

expId = mlflow.get_experiment_by_name("/Shared/diabetes_experiment/").experiment_id
df = spark.read.format("mlflow-experiment").load(expId)
display(df)

Scala

val expId = mlflow.getExperimentByName("/Shared/diabetes_experiment/").get.getExperimentId
val df = spark.read.format("mlflow-experiment").load(expId)
display(df)

Memfilter data berdasarkan metrik dan parameter

Contoh di bagian ini menunjukkan bagaimana Anda dapat memfilter data setelah memuatnya dari eksperimen.

Python

df = spark.read.format("mlflow-experiment").load("3270527066281272")
filtered_df = df.filter("metrics.loss < 0.01 AND params.learning_rate > '0.001'")
display(filtered_df)

Scala

val df = spark.read.format("mlflow-experiment").load("3270527066281272")
val filtered_df = df.filter("metrics.loss < 1.85 AND params.num_epochs > '30'")
display(filtered_df)

Skema

Skema DataFrame yang dihasilkan oleh sumber data adalah:

root
|-- run_id: string
|-- experiment_id: string
|-- metrics: map
|    |-- key: string
|    |-- value: double
|-- params: map
|    |-- key: string
|    |-- value: string
|-- tags: map
|    |-- key: string
|    |-- value: string
|-- start_time: timestamp
|-- end_time: timestamp
|-- status: string
|-- artifact_uri: string