Databricks の MLflow モデルを使用した自動特徴検索
Model Serving により、公開されているオンライン ストアから、またはオンライン テーブルから、特徴値を自動的に検索できます。 この記事では、オンライン ストアを使用する方法について説明します。 オンライン テーブルの操作の詳細については、「オンライン テーブルを使用したリアルタイム機能の提供」を参照してください。
要件
- モデルは
FeatureEngineeringClient.log_model
(Unity カタログの Feature Engineering の場合) またはFeatureStoreClient.log_model
(ワークスペースフィーチャー ストアの場合は v0.3.5 以降が必要) でログに記録されている必要があります。 - オンライン ストアは、読み取り専用の資格情報で公開する必要があります。
注意
モデルのトレーニング後も含め、モデル デプロイの前にいつでも特徴テーブルを公開できます。
特徴の自動検索
Azure Databricks のモデルの提供では、次のオンライン ストアからの自動特徴検索がサポートされています。
- Azure Cosmos DB (v0.5.0 以降)
自動特徴検索は、次のデータ型でサポートされています。
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
オンライン モデル スコアリングで特徴値をオーバーライドする
モデルに必要なすべての特徴 (FeatureEngineeringClient.log_model
または FeatureStoreClient.log_model
でログに記録) は、モデル スコアリングのためにオンライン ストアから自動的に参照されます。 モデルの提供を利用してモデルのスコア付け時に REST API を使用して特徴値をオーバーライドするには、API ペイロードの一部として特徴値を含めます。
注意
新しい特徴値は、基になるモデルで想定されている特徴のデータ型に準拠している必要があります。
ノートブックの例: Unity Catalog
Databricks Runtime 13.3 LTS 以降では、主キーを持つ Unity Catalog 内の任意の Delta テーブルを特徴量テーブルとして使用できます。 Unity Catalog に特徴量テーブルとして登録されているテーブルを使用すると、自動的に、すべての Unity Catalog 機能をその特徴量テーブルで利用できるようになります。
以下のノートブックの例は、オンライン ストアにフィーチャーを公開して、オンライン ストアからフィーチャーを自動的に検索するトレーニング済みモデルを提供する方法を示します。
オンライン ストアと Unity Catalog のノートブックの例
ノートブックの例: ワークスペース特徴量ストア
以下のノートブックの例は、オンライン ストアにフィーチャーを公開して、オンライン ストアからフィーチャーを自動的に検索するトレーニング済みモデルを提供する方法を示します。