Foundation Model API を使用したバッチ推論

この記事では、Foundation Model API を使用して、プロビジョニングされたスループットエンドポイントでバッチ推論を実行するノートブックの例を示します。 Foundation Model API を使用してバッチ推論を実行するには、両方のノートブックが必要です。

例では、チャットタスク用の DBRX Instruct モデルを使用したバッチ推論を示しています。

要件

Foundation Model API のサポートされているリージョン内のワークスペース
Databricks Runtime 14.0 ML 以降
provisioned-throughput-batch-inference ノートブックと chat-batch-inference-api ノートブックは、ワークスペース内の同じディレクトリに存在している必要があります

次のノートブックでは、Python を使用して次のタスクを実行します。

次のノートブックは、上記のノートブックと同じタスクを実行しますが、Spark を使用します。

Python ノートブックではなく Spark ノートブックを使用する場合は、Python ノートブックを呼び出すコマンドを更新する必要があります。

プロビジョニングされたスループット提供エンドポイントを作成します
準備完了状態になるまでエンドポイントを監視します
chat-batch-inference-api ノートブックを呼び出して、準備されたエンドポイントに対してバッチ推論タスクを同時に実行します。 Spark を使用する場合は、chat-batch-inference-udf ノートブックを呼び出すようにこの参照を変更します。
バッチ推論が完了したら、プロビジョニングされたスループット提供エンドポイントを削除します