ソリューションのアイデア
この記事ではソリューションのアイデアについて説明します。 クラウド アーキテクトはこのガイダンスを使用すると、このアーキテクチャの一般的な実装の主要コンポーネントを視覚化しやすくなります。 ワークロードの特定の要件に適合する、適切に設計されたソリューションを設計するための出発点として、この記事を使用してください。
Computer Vision API、Azure 関数 などの Azure サービスを使用すると、企業はサーバーを個別に管理する必要がなくなり、コストを削減できるほか、既に Microsoft で開発済みの、Azure AI サービス でのイメージ処理に関する専門知識を利用できます。 このソリューション アイデアは、特に画像処理のユース ケースに対応しています。 別の AI ニーズがある場合は、一連の Azure AI サービス について検討してください。
アーキテクチャ
画像分類タスクに使用されるアーキテクチャの図。
このソリューションのアイデアの Visio ファイルをダウンロードします。
データフロー
このシナリオでは、Web またはモバイル アプリケーションのバックエンド コンポーネントに対応できます。 シナリオのデータ フローは次のとおりです。
- BLOB ストレージに新しいファイル (画像のアップロード) を追加すると、Azure Event Gridでイベントがトリガーされます。 アップロード プロセスは、Web またはモバイル アプリケーションを介して調整できます。 または、画像を Azure BLOB ストレージに個別にアップロードすることもできます。
- Event Grid により、Azure 関数 をトリガーする通知が送信されます。
- Azure Functions は Azure AI Vision API を呼び出して、新しくアップロードされた画像を分析します。 Azure AI Vision は、Azure Functions によって解析された BLOB URL を介して画像にアクセスします。
- Azure Functions は、Azure Cosmos DB で AI Vision API の応答を保持します。 この応答には、イメージ メタデータと共に分析の結果も含まれます。
- 結果を、Web またはモバイル フロントエンドで使用したり、そこに反映したりできます。 この方法では、アップロードされた画像ではなく、分類の結果が取得されます。
コンポーネント
Azure AI Vision は、Azure AI サービス スイートの一部です。 このアーキテクチャでは、各イメージに関する情報を取得します。 新しくアップロードされた画像を分析し、メタデータと分類の結果を提供します。 これらの結果により、画像の理解が自動化されます。
Azure Functions は、コードが少なくインフラストラクチャが少ない堅牢なアプリを構築するために使用できるサーバーレス ソリューションです。 このアーキテクチャでは、Azure Functions は Web アプリケーションのバックエンド API を提供します。 また、アップロードされたイメージのイベント処理もこのプラットフォームで行います。 Azure Functions は、AI Vision API の呼び出し、分析結果の処理、データベース内のメタデータの保持など、ワークフロー ステップを調整します。
Azure Event Grid は、パブリッシュ/サブスクライブ モデルを使用して均一なイベント消費を可能にするマネージド イベント ルーティング サービスです。 このアーキテクチャでは、Azure Event Grid は、新しいイメージが BLOB ストレージにアップロードされたときにイベントをトリガーし、Azure Functions に新しいアップロードのアラートを送信して自動処理ワークフローを開始します。
Azure Blob Storage は、非構造化データをクラウドに格納するためのオブジェクト ストレージ ソリューションです。 このアーキテクチャでは、Web アプリケーションにアップロードされたすべてのイメージ ファイルと、Web アプリケーションが使用するすべての静的ファイルを格納します。 Blob Storage は、受信イメージ データのプライマリ リポジトリであり、処理のソースとイメージ アクセスの参照の両方として機能します。
Azure Cosmos DB は NoSQL データベースです。 このアーキテクチャでは、Azure Cosmos DB は、Computer Vision API からの処理の結果を含め、アップロードされた各イメージに関するメタデータを格納します。
代替
- Azure OpenAI GPT-4o および GPT-4o-mini。 GPT-4o と GPT-4o-mini は、OpenAI のマルチモーダル チャット モデルであり、提供する画像に何が存在するかに関する一般的な質問に回答できます。
- Custom Vision Service。 Computer Vision API は、一連の 分類ベースのカテゴリを返します。 Computer Vision API によって返されていない情報を処理する必要がある場合は、Custom Vision Service を検討してください。これにより、カスタム イメージ分類子を構築できます。 このサービスの詳細については、「Custom Vision を使用して画像分類モデル構築する」のクイック スタートに従ってください。
- Azure AI Search をします。 特定の条件を満たす画像を検索するために、ご自身のユース ケースでメタデータにクエリを実行する必要がある場合は、Azure AI 検索を検討してください。
- Logic Apps。 Blob に追加されたファイルにリアルタイムに応答する必要がない場合は、Logic Apps の使用を検討できます。 ファイルが追加されたかどうかを確認できるロジック アプリは、 繰り返しトリガーまたはスライディング ウィンドウ トリガーによって開始される可能性があります。
- ドキュメントに画像が埋め込まれている場合は、Azure AI Document Intelligence を使用して、それらの画像を特定します。 その情報を使用して、埋め込み画像を抽出し、さらにコンピューター ビジョン タスクを実行できます。 Document Intelligence を使用して、埋め込み画像に関するデータを収集します。Computer Vision API を介して受信した画像の他のメタデータと共に格納できる、ページ番号やキャプション テキストなどです。 画像が主にドキュメントの写真またはスキャンである場合は、ドキュメント インテリジェンスのカスタム分類モデル を使用して、入力ファイルの分類を一度に 1 ページずつ実行し、その中のドキュメントを識別します。 この方法では、入力ファイル内の 1 つのドキュメントの複数のドキュメントまたは複数のインスタンスを識別することもできます。
シナリオの詳細
このシナリオは、イメージを処理する必要があるビジネスに関連があります。
応用の可能性としては、ファッション Web サイトのイメージの分類、保険金請求のテキストおよびイメージの分析、ゲームのスクリーンショットからの利用統計情報の把握などが挙げられます。 従来、企業では、機械学習モデルで専門知識を開発したうえで、そのモデルをトレーニングし、最終的にカスタム プロセスによってイメージを実行し、イメージからデータを取得していました。
考えられるユース ケース
このソリューションは、小売、ゲーム、金融、保険業界に最適です。 その他の関連するユース ケース:
ファッション Web サイトの画像の分類。 画像分類は、販売用にプラットフォーム上の製品の画像をアップロードする際に販売者が使用することができます。 その後、結果の関連する手動でのタグ付けを自動化できます。 顧客は、製品の視覚的な印象を検索することもできます。
ゲームのスクリーンショットの利用統計情報の分類。 スクリーンショットからのビデオ ゲームの分類は、コンピューター ビジョンと組み合わされて、ソーシャル メディアで意義のある問題に発展しています。 たとえば、Twitch ストリーミング配信者が連続して異なるゲームを再生する場合、ストリーム情報の手動更新を省くことがあります。 ストリーム情報を更新しないと、ユーザー検索でストリームが誤って分類され、コンテンツ作成者とストリーミング プラットフォームの両方で潜在的な視聴が失われる可能性があります。 新しいゲームを導入する際、カスタム モデル ルートが、それらのゲームから新しいイメージを検出する機能を導入するのに役立つ場合があります。
保険金請求のイメージの分類。 画像分類は、要求処理や引受の時間とコストを削減するのに役立ちます。 これは、自然災害の被害や車両の損傷を分析し、住宅や商業の資産を識別するのに役立ちます。
次のステップ
製品ドキュメント
- Azure AI Vision とは
- Azure AI 検索における AI エンリッチメント
- Azure Functions の概要
- Azure Event Grid とは
- Azure Blob Storage の概要
- Azure Cosmos DB へようこそ
ガイド付きラーニング パスについては、以下を参照してください。
- Azure でサーバーレス Web アプリを作成する
- Azure AI Custom Vision を使用して画像を分類する
- Custom Vision サービスを利用することで AI を使用して画像内のオブジェクトを認識する
- Custom Vision を使用して絶滅危惧種の鳥を分類する
- Azure AI Custom Vision サービスを使用して画像を分類する
- Azure AI Custom Vision を使用して画像内の物体を検出する
関連リソース
- 画像とテキストの処理での AI エンリッチメントの使用
- Azure OpenAI を使用したマルチモーダル ビジョン チャット アプリの概要