ハイパーパラメーターの調整

Optuna、Ray Tune、Hyperopt などの Python ライブラリを使用すると、ハイパーパラメーターのチューニングが簡素化および自動化され、機械学習モデルに最適なハイパーパラメーターセットが効率的に見つかります。これらのライブラリは複数のコンピューティングにまたがってスケーリングされ、手動によるオーケストレーションと構成の要件が最小限で済み、ハイパーパラメーターをすばやく見つけることができます。

Optuna

Optuna は、ハイパーパラメーターのチューニングとモデルの選択のための動的な検索スペースを簡単に定義できるようにする、軽量のフレームワークです。 Optuna には、最新の最適化と機械学習のアルゴリズムがいくつか含まれています。

Optuna を Joblib と簡単に並列化してワークロードをスケーリングし、MLflow と統合して、評価版全体のハイパーパラメーターとメトリックを追跡できます。

Optuna の使用を開始するには、「Optuna を使用したハイパーパラメーターのチューニング」を参照してください。

Ray Tune

Databricks Runtime ML には、並列コンピューティング処理に使用されるオープンソースフレームワークである Ray が含まれています。 Ray Tune は、Ray に付属するハイパーパラメーターチューニングライブラリであり、Ray を分散コンピューティングのバックエンドとして使用します。

Databricks で Ray を実行する方法の詳細については、「Azure Databricks における Ray とは」を参照してください。 Ray Tune の例については、Ray Tune のドキュメントを参照してください。

Hyperopt

Note

Hyperopt のオープンソースバージョンはメンテナンスされなくなりました。

Hyperopt は、16.4 LTS ML 以降の Databricks Runtime for Machine Learning には含まれません。 Azure Databricks では、単一ノードの最適化に Optuna を、非推奨の Hyperopt 分散ハイパーパラメーターチューニング機能と同様のエクスペリエンスには RayTune を使用することを推奨しています。 Azure Databricks での RayTune の使用の詳細については、こちらをご覧ください。

Hyperopt は、分散型のハイパーパラメーターチューニングとモデルの選択に使用される Python ライブラリです。 Hyperopt は、Apache Spark MLlib や Horovod などの分散型 ML アルゴリズムだけでなく、scikit-learn や TensorFlow などのシングルマシン ML モデルにも対応しています。

Hyperopt の使用を開始するには、「Hyperopt による分散トレーニングのアルゴリズムを使用する」を参照してください。

MLlib 自動 MLflow 追跡

Note

MLlib 自動 MLflow 追跡は、Databricks Runtime 10.4 LTS ML 以降を実行するクラスターでは非推奨となり、無効になります。

代わりに、を呼び出して mlflow.pyspark.ml.autolog()を使用します。これは、Databricks Autologging では既定で有効になっています。

MLlib の自動 MLflow 追跡では、CrossValidator または TrainValidationSplit を使用するチューニングコードを実行すると、ハイパーパラメーターと評価メトリックが MLflow に自動的に記録されます。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-02-01