次の方法で共有


人工知能 (AI) の概要

人工知能 (AI) テクノロジは、多くのコミュニケーション エクスペリエンスに役立ちます。 AI は、人間がより良いコミュニケーションを行い、より効率的にミッションを達成するのに役立ちます。たとえば、銀行の従業員は、AI によって生成された会議の概要を使用してフォローアップを支援できます。 AI を使用すると、人間のワークロードを削減し、顧客がアカウントの残高を確認するために呼び出す 24 時間 365 日の電話ボットの運用など、より柔軟な顧客エンゲージメントを実現できます。

その他の例を示します:

  • 人間の会話に応答するチャットまたは音声ボットを操作する。
  • 音声コンテンツをテキスト文字起こしに変換する。
  • ユーザーの背景をぼかすためにビデオ フィードを変換する。
  • 会話に注釈を付けて分析し、サービスを改善するための傾向と機会を特定します。
  • テキスト チャットと会議の文字起こしのコーパスを概要に変換する。 このエクスペリエンスには、ユーザーが "自分とユーザー Joe の間のすべての会話を要約する" ことを依頼する生成 AI インターフェイスが含まれる場合があります。

この記事では、Azure Communication Services での AI と AI に隣接する機能の可用性の概要を示します。 AI 機能には、次の 2 つの大きなカテゴリがあります:

  • 統合 AI: Azure Communication Services は、Azure AI および Microsoft Copilot Studio と直接統合されます。 通常、これらの機能では、Azure portal で Azure Communication Services と Azure AI リソースの両方を作成してリンクする必要があります。 この 1 回限りのリンクの後、これらの AI 機能の使用は、単一の API 呼び出しと同じくらい簡単です。
  • Accessor: Azure Communication Services には、通信データへの生の変換されたアクセスを提供するさまざまな API が用意されているため、独自の外部サービスと AI システムを簡単に接続できます。

メッセージング: SMS、チャット、電子メール、WhatsApp

このセクションでは、AI を Azure Communication メッセージングに統合するための機能の概要を示します。

直接統合

  • 高度なメッセージ分析: WhatsApp 用の Azure Communication Services メッセージング API には、メッセージを分析して注釈を付ける Azure OpenAI との組み込みの統合が用意されています。 この統合により、ユーザーの言語を検出し、その意図を認識し、キー フレーズを抽出できます。
  • Azure Bot Service: チャット チャネルの統合: Azure Communication Services チャット システムは、Azure Bot Service と直接統合されています。 この統合により、人間のユーザーと連携するチャット ボットの作成が簡単になります。

アクセサー

すべての Azure Communication Services メッセージング機能には、REST API、サーバー指向 SDK、Event Grid 通知を使用してアクセスできます。 これらの SDK を使用して、コンテンツを外部データストアにエクスポートし、言語モデルをアタッチして会話を要約できます。 または、SDK を使用して、人間のユーザーと直接やり取りするボットを統合することもできます。 たとえば、この GitHub サンプル には、チャット用の Azure Communication Services API に REST API を介してアクセスし、Azure OpenAI によって分析する方法が示されています。

音声、ビデオ、テレフォニー

このセクションでは、AI を Azure Communication の音声通話とビデオ通話に統合するための機能の概要を示します。

直接統合

  • Call Automation の REST API と SDK: Azure Communication Services には、音声の合成認識のための単純な API があります。 これらの API の最も一般的なシナリオは、音声ボットを実装することです。これは対話型音声応答 (IVR) と呼ばれることがあります。
  • Microsoft Copilot Studio: Copilot Studio は、Azure Communication Services テレフォニーと直接統合されています。 この統合は、音声ボットと IVR 向けに設計されています。
  • クライアント キャプション: 通話クライアント SDK には、アクセシビリティに最適化された、リアルタイムのクローズド キャプション用 API が用意されています。
  • Azure portal の Copilot: Azure portal の Copilot を使用して、Azure Communication Services に関する質問をすることができます。 Copilot では、Azure の技術ドキュメントを使用して質問に回答し、エラー コードと API の動作に関する質問に最適です。
  • クライアントの背景効果: 通話クライアント SDK には、ユーザーの背景をぼかしたり置き換えたりするための API が用意されています。
  • クライアントのノイズ改良と効果: 通話クライアント SDK には DeepVQE 機械学習モデルが統合されていて、エコー キャンセルとバックグラウンド ノイズ抑制によってオーディオ品質が向上します。 この変換のオンとオフは、クライアント SDK を使用して切り替えます。

アクセサー

Azure Communication Services メッセージングと同様に、多くの音声およびビデオ通話機能用の REST API があります。 ただし、呼び出しのリアルタイムの性質には、クローズド ソース SDK と、WebSocket ストリーミングなどのより複雑な API が必要です。

  • Call Automation の REST API と SDK: サービスおよび AI アプリケーションは、Call Automation REST API を使用して、あらゆる種類の Azure 音声通話とビデオ通話の応答、ルーティング、管理を行います。
  • サービス間音声ストリーミング: AI アプリケーションは、Azure のサービス間 WebSocket API を使用してオーディオ データをストリーミングします。 これは双方向に機能し、AI は通話を聞いて話すことができます。
  • サービス間のリアルタイムの文字起こし: AI アプリケーションは、Azure のサービス間 WebSocket API を使用して、Azure で生成されたリアルタイムの文字起こしをストリーミングします。 音声やビデオのコンテンツと比較して、トランスクリプト データは多くの場合、AI モデルが推論しやすくなります。
  • 通話レコーディング: 独自のデータストアに Azure 通話を記録し、AI サービスにそのコンテンツを処理するよう指示できます。
  • クライアントの未加工のオーディオと動画: Calling Client SDK には、未加工のオーディオおよび動画フィードにアクセスして変更を行うための API が用意されています。 シナリオの例として、ビデオ フィードを取得し、コンピューター ビジョンを使用して人間の話者を背景から区別し、その背景をカスタマイズします。