Azure Cognitive Services のテクノロジを選ぶ

Azure Cognitive Services は、AI アプリケーションおよびデータ フローで使用できるクラウドベースの API です。 アプリケーションにそのまま使えるトレーニング済みモデルが用意されているので、データの準備やモデルのトレーニングを行う必要はありません。 このサービスは、Microsoft の AI and Research チームにより開発され、最新のディープ ラーニング アルゴリズムを活用しています。 サービスの利用には、HTTP REST インターフェイスを使用します。 さらに、多くの一般的なアプリケーション開発フレームワークで SDK を使用できます。

主な利点:

  • 最小限の開発作業で最先端の AI サービスを利用。 定義済みアルゴリズムを使用する、または事前構築済みライブラリを使ってカスタム アルゴリズムを作成します。
  • HTTP REST インターフェイス経由でアプリケーションに簡単に統合。
  • あらゆるスキル レベルの開発者やデータ サイエンティストが、AI 機能をアプリに簡単に追加できます。

考慮事項:

  • これらのサービスは、Web 経由でのみ利用可能です。 通常、インターネット接続が必要です。 ただし、Custom Vision Service は例外です。このサービスでは、デバイスおよび IoT エッジで、トレーニングされたモデルを予測のためにエクスポートできます。
  • さまざまなカスタマイズがサポートされていますが、利用できるサービスがすべての予測分析要件には適合しない可能性もあります。

Azure Cognitive Services のカテゴリ

Azure では数十種類の Cognitive Services が利用できます。 サポートする機能領域別に分類された一覧を次に示します:

サービス 意思決定ガイドへのリンク 説明
Language Language Service を選ぶ Language Cognitive Service は、テキストを理解し分析するための自然言語処理 (NLP) 機能を提供するサービスです。
Speech Speech Service を選ぶ Speech Cognitive Service は、音声テキスト変換、テキスト読み上げ、音声翻訳、話者認識などの音声機能を提供するサービスです。
Vision Vision Service を選ぶ Vision Cognitive Service は、画像と動画の認識機能を提供するサービスです。
Decision Service

適用される AI サービス
Decision API または Applied AI Service を選ぶ Decision Cognitive Service は、情報に基づいた効率的な意思決定のための推奨事項を生成する NLP 機能を提供するサービスです。
Azure OpenAI Service 該当なし Azure OpenAI Service は、強力な OpenAI 言語モデルへの REST API アクセスを提供します。

一般的なユース ケース

Azure Cognitive Services の一般的なユース ケースを次に示します。

使用事例 カテゴリ
可聴音声を読み取り可能で検索可能なテキストに文字起こしする。 音声
テキストをリアルな音声に変換して、より自然なインターフェイスを実現する。 音声
リアルタイムの音声翻訳をアプリに統合する。 音声
音声特性を使用して、話者を識別し認証する。 音声
一般的に使用される用語とドメイン固有の用語を識別する。 言語
テキスト内のセンチメントと意見を自動的に検出する。 言語
情報を、よりナビゲートしやすい質問と回答に変換する。 言語
アプリがユーザーと自然言語で対話できるようにする。 言語
100 以上の言語と方言を翻訳します。 言語
画像や動画のコンテンツを識別し分析する。 視覚
ビジネス ニーズに合わせて画像認識をカスタマイズする。 視覚
潜在的問題を早期に特定する。 Decision Service /Anomaly Detector
不快感を与える可能性がある、または望ましくないコンテンツを検出する。 Decision Service / Content Moderator
ユーザー全員を対象に、豊富でパーソナライズされたエクスペリエンスを作成します。 Decision Service / Personalizer
高度なコーディングと言語モデルをさまざまなユース ケースに適用する。 Azure OpenAI

主要な選択条件

選択肢を絞り込むために、まず次の質問に答えてください:

  • 処理対象は話し言葉に関するものですか、それともテキスト、画像、またはドキュメントですか?

  • モデルをトレーニングするためのデータは持っていますか。 "はい" の場合、カスタム サービスの使用を検討してください。ユーザーが用意したデータを使って基になるモデルをトレーニングできるので、 精度とパフォーマンスが向上します。

このフローチャートは、ユース ケースに最適な API サービスを選択するのに役立ちます。

Diagram that shows how to select a Cognitive Services API.

  • ユース ケースで音声テキスト変換、テキスト読み上げ、または音声間変換が必要な場合は、Speech API を使用します。
  • ユース ケースで言語分析、テキスト評価、テキスト間変換が必要な場合は、Language API を使用します。
  • 画像、動画、テキストの分析が必要な場合は、Vision API を使用します。
  • 意思決定が必要な場合は、Decision API または Applied AI Services を使用します。

サービスのデプロイ

Cognitive Services のデプロイの際には、個別のサービスをデプロイする、あるいはCognitive Service のマルチサービス リソースをデプロイすることが可能です。 マルチサービス リソースでは、Decision Service、Language Service、Speech Service、Vision Service、Applied AI service がデプロイできます。

  • 他のサービスが必要ない場合、またはサービスごとにアクセスと課金を管理したい場合は、個々のサービスをデプロイします。
  • 複数のサービスを使用していて、すべてのサービスのアクセスと課金をまとめて管理したい場合は、マルチサービス リソースをデプロイします。

Note

これらの API サービスのリソース カテゴリは頻繁に変更されます。 新しいカテゴリに関する最新ドキュメントを必ず確認してください。

共同作成者

この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。

プリンシパルの作成者:

その他の共同作成者:

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

次のステップ