Azure 上の Vision Studio の概要

完了

Azure AI Vision サービスを使用するには、最初に Azure サブスクリプションでそのためのリソースを作成する必要があります。 次のいずれかのリソース タイプを使用できます。

  • Azure AI Vision:視覚サービスの特定のリソース。 このリソースの種類は、他の AI サービスを使用するつもりがない場合、または AI Vision リソースの使用率とコストを独立して追跡したい場合に使用します。
  • Azure AI サービス:Azure AI Language や Azure AI 音声など、他の多くの Azure AI サービスとともに、Azure AI Vision を含む一般的なリソース。 複数の Azure AI サービスを使用する予定で、管理と開発を簡略化する場合は、このリソースの種類を使用します。

リソースを作成した後に Azure AI Vision の Read API を使うには、いくつか方法があります。

  • Vision Studio
  • REST API
  • ソフトウェア開発キット (SDK):Python、C#、JavaScript

以下では、Vision Studio に焦点を当てます。

Azure AI Vision Studio

Azure AI Vision Studio を使うと、初めてでもコーディングを必要としないグラフィカル ユーザー インターフェイスで Azure AI Vision API にアクセスできます。

A screenshot showing the Vision Studio interface.

Vision Studio を開くときに、既定のリソースを選ぶ必要があります。 Vision Studio の既定のリソースは、Azure AI Vision リソースではなく、Azure AI サービス リソースである必要があります。

Vision Studio のホーム ページから、光学式文字認識と [画像からテキストを抽出する] タイルを選び、Read OCR エンジンを試すことができます。 リソースの使用コストが発生し始めるのは、結果を返すためにそれが使われるときです。 独自のファイルまたはサンプル ファイルのいずれかを使うと、Read OCR エンジンからどのように検出された属性が返されるかを確認できます。 これらの属性は、マシンが境界ボックス内で検出したものに対応します。

A screenshot showing the detected attributes.

バックグラウンドでは、画像の人物、テキスト、オブジェクトなどの特徴が分析され、境界ボックスでマークされます。 検出された情報は処理され、結果がユーザーに返されます。 生の結果は JSON で返され、ページ上の境界ボックスの位置と検出されたテキストに関する情報が含まれます。 Vision Studio は OCR の例を返すことはできますが、独自の OCR アプリケーションを構築するには、SDK または REST API を使う必要があることに注意してください。

A screenshot showing bounding boxes and the related json returned.