イメージアプリケーションのリファレンスソリューション

現実的な多くのイメージアプリケーションによって一般に共有される構成で、pandas UDF、PyTorch、TensorFlow を使用して、参照ソリューションノートブックから分散イメージモデル推論を実行する方法について説明します。この構成では、多数のイメージがオブジェクトストアに格納されており、必要に応じて新しいイメージを継続的に受け取れることを想定しています。

イメージモデル推論のワークフロー

たとえば、画像分類と物体検出のためにトレーニングしたディープラーニング (DL) モデルがいくつかあり (プライバシー保護のためにユーザーがアップロードした写真から人物を検出する MobileNetV2 など)、これらの DL モデルを格納されたイメージに適用するとします。

モデルを再トレーニングし、以前に計算した予測を更新することができます。しかし、多くのイメージを読み込み、DL モデルを適用すると、I/O 負荷とコンピューティングの負荷がどちらも大きくなります。さいわい、推論ワークロードは驚異的並列なので、理論的には簡単に分散できます。このガイドでは、次の 2 つの主要なステージを含む実用的なソリューションを示します。

自動ローダーを使用して Delta テーブルにイメージの ETL を行う
pandas UDF を使用して分散推論を実行する

自動ローダーを使用して Delta テーブルにイメージの ETL を行う

トレーニングや推論タスクを含むイメージアプリケーションでは、Databricks は自動ローダーを使用して Delta テーブルにイメージを ETL する方法をお勧めします。自動ローダーは、データ管理に役立ち、継続的に到着する新しいイメージを自動的に処理します。

Delta テーブルへのイメージデータセットの ETL ノートブック

ノートブックを入手

pandas UDF を使用して分散推論を実行する

次のノートブックでは、PyTorch と TensorFlow の tf.Keras を使用して、リファレンスソリューションのデモを行います。

Pytorch と pandas UDF した分散推論ノートブック

ノートブックを入手

Keras と pandas UDF を使用した分散推論ノートブック

ノートブックを入手

制限事項: イメージファイルのサイズ

大きなイメージファイル (平均イメージサイズが 100 MB を超える) の場合、Databricks ではメタデータ (ファイル名の一覧) の管理にのみ Delta テーブルを使用し、必要な場合にはパスを使用してオブジェクトストアからイメージを読み込むことをお勧めしています。

フィードバック

このページはお役に立ちましたか?

Last updated on 2024-08-09

次の方法で共有

イメージ アプリケーションのリファレンス ソリューション

イメージ モデル推論のワークフロー

自動ローダーを使用して Delta テーブルにイメージの ETL を行う

Delta テーブルへのイメージ データセットの ETL ノートブック

pandas UDF を使用して分散推論を実行する

Pytorch と pandas UDF した分散推論ノートブック

Keras と pandas UDF を使用した分散推論ノートブック

制限事項: イメージ ファイルのサイズ

フィードバック

その他のリソース

イメージアプリケーションのリファレンスソリューション

イメージモデル推論のワークフロー

Delta テーブルへのイメージデータセットの ETL ノートブック

制限事項: イメージファイルのサイズ