次の方法で共有


オンライン ワークフローで特徴量を使用する

Unity Catalog で特徴エンジニアリングを使うと、モデル開発プロセスのすべてのステップが Databricks Data Intelligence Platform に統合されます。 つまり、Databricks でインフラストラクチャを自動的に処理しながら特徴量の値を計算して提供する、自動化されたデータ パイプラインを構築できます。 Databricks プラットフォームは、特徴量値のオンデマンド計算などのリアルタイム サービスを、特徴量とモデルの両方に対して提供します。

特徴の自動検索

Databricks 特徴エンジニアリング クライアントを使用してモデルをトレーニングし、それを Databricks Model Serving で提供すると、モデルは Databricks Online Feature Store または サード パーティのオンライン ストアから機能値を自動的に検索します。 これは自動的に行われ、セットアップの必要はありません。

Important

Databricks オンライン テーブルはサポートされなくなりました。 既存のオンライン テーブルがある場合は、Databricks Online Feature Store に移行することをお勧めします。 「レガシおよびサード パーティのオンライン テーブルからの移行」を参照してください。

モデルにスコアリング要求が送られてくると、Model Serving はモデルに必要な公開された特徴量の値を自動的に取得します。 この方法では、常に最新の特徴量値が予測に使われます。 詳細とノートブックの例については、「 自動機能検索を使用したモデル サービス」を参照してください

次の図は、リアルタイム提供のためのプラットフォーム コンポーネント間の関係を示したものです。

オンライン検索を使用した Feature Store ワークフロー

オンデマンド特徴量

リアルタイム アプリケーションの機械学習モデルでは、最新の特徴量の値が必要になることがよくあります。 図に示す例では、レストランのレコメンデーション モデルの 1 つの特徴は、レストランからのユーザーの現在の距離です。 この特徴量は、"オンデマンド" (つまり、スコアリング要求時) に計算する必要があります。 スコアリング要求を受け取ると、モデルはレストランの場所を検索し、定義済みの関数を適用して、ユーザーの現在の場所とレストランの間の距離を計算します。 この距離は、特徴量ストアの他の事前計算済み特徴量と共に、モデルへの入力として渡されます。 詳しくは、特徴量のオンデマンド計算に関する記事をご覧ください。

オンデマンド ワークフローのコンピューティング機能