AI: あなたのデータに対する Azure OpenAI

2025-06-17

Azure OpenAI 自然言語処理 (NLP) と完了機能の統合により、ユーザーの生産性を向上させる大きな可能性が提供されます。適切なプロンプトとルールを活用することで、AI アシスタントは、電子メールメッセージ、SMS メッセージなど、さまざまな形式の通信を効率的に生成できます。この機能により、ユーザーの効率が向上し、ワークフローが合理化されます。

この機能自体は非常に強力ですが、ユーザーが会社のカスタムデータに基づいて完了を生成する必要がある場合があります。たとえば、ユーザーがインストールの問題を顧客に支援する際に移動するのが困難な製品マニュアルのコレクションがあるとします。または、医療上の利点に関連する包括的な一連のよく寄せられる質問 (FAQ) を維持して、ユーザーが必要な回答を読み取り、取得することが困難であることを証明できます。このような場合や他の多くの場合、Azure OpenAI Service を使用すると、独自のデータを活用して補完を生成し、ユーザーの質問に対するより調整されたコンテキストに応じた正確な応答を実現できます。

Azure OpenAI ドキュメントの "Bring Your Own Data" 機能の概要を次に示します。

注

独自のデータに基づく Azure OpenAI の主な特徴の 1 つは、モデルの出力を強化する方法でデータを取得して利用できることです。独自のデータに基づく Azure OpenAI は、Azure AI Search と連携し、ユーザー入力と提供された会話履歴に基づいて、指定されたデータソースからどのデータを取得するかを決定します。その後、このデータは拡張され、OpenAI モデルに対するプロンプトとして再送信されます。取得された情報は元のプロンプトに追加されます。取得されたデータはプロンプトに追加されますが、結果として得られた入力は他のプロンプトと同様にモデルによって処理されます。データが取得され、プロンプトがモデルに送信されると、モデルはこの情報を使用して候補を提供します。

この演習では、以下のことを行います。

Azure AI Foundry ポータルを使用してカスタムデータソースを作成します。
Azure AI Foundry ポータルを使用して埋め込みモデルをデプロイします。
カスタムドキュメントをアップロードします。
チャットプレイグラウンドでチャットセッションを開始し、独自のデータに基づいて完了を生成する実験を行います。
Azure AI Search と Azure OpenAI を使用して、独自のデータに基づいて入力候補を生成するコードについて説明します。

埋め込みモデルをデプロイし、Azure AI Foundry にカスタムデータソースを追加することから始めましょう。

Azure AI Foundry へのカスタムデータソースの追加

Azure OpenAI Studio に移動し、Azure OpenAI リソースにアクセスできる資格情報でサインインします。
ナビゲーションメニューから [デプロイ] を選択します。
[モデルのデプロイの選択] -->ツールバーの [基本モデルのデプロイ] を選択します。
モデルの一覧から テキスト埋め込み ada-002 モデルを選択し、[確認] を選択 します。
次のオプションのいずれかを選択します。
- デプロイ名: text-embedding-ada-002
- モデルバージョン: 既定
- デプロイの種類: Standard
- 1 分あたりのトークンレート制限 (千) の値を 120,000 に設定する
- コンテンツフィルター: DefaultV2
- 動的見積もりを有効にする: 有効
[デプロイ] ボタンを選択します。
モデルが作成されたら、ナビゲーションメニューから [ホーム ] を選択してようこそ画面に移動します。
ようこそ画面で [ Bring your own data]\(独自のデータを持ち込む \) タイルを見つけて、[ 今すぐ試す] を選択します。
[ データの追加] を選択し、[ データソースの追加] を選択します。
[ データソースの選択 ] ドロップダウンで、[ ファイルのアップロード] を選択します。
[ Azure Blob Storage リソースの選択 ] ドロップダウンで、[ 新しい Azure Blob Storage リソースの作成] を選択します。
[サブスクリプション] ドロップダウンで Azure サブスクリプション を選択します。
[ Azure Blob Storage リソースの選択 ] ドロップダウンで、[ 新しい Azure Blob Storage リソースの作成] を選択します。
これにより、次のタスクを実行できる Azure portal にアクセスできます。
- byodstorage[Your Last Name]など、ストレージアカウントの一意の名前を入力します。
- 場所に近いリージョンを選択します。
- [ 確認 ] を選択し、[ 作成] を選択します。
BLOB ストレージリソースが作成されたら、Azure AI Foundry ダイアログに戻り、[Azure Blob Storage リソースの選択] ドロップダウンから新しく作成した BLOB ストレージリソースを選択 します。一覧に表示されない場合は、ドロップダウンの横にある更新アイコンを選択します。
ストレージアカウントにアクセスするには、クロスオリジンリソース共有 (CORS) を有効にする必要があります。 Azure AI Foundry ダイアログで [ CORS を有効にする ] を選択します。
[ Azure AI Search リソースの選択 ] ドロップダウンで、[ 新しい Azure AI Search リソースの作成] を選択します。
これにより、次のタスクを実行できる Azure portal に戻ります。
- byodsearch-[Your Last Name]などの AI Search リソースの一意の名前を入力します。
- 場所に近いリージョンを選択します。
- [ 価格レベル ] セクションで、[ 価格レベルの変更 ] を選択し、[ 基本 ] の後に [選択] を選択します。 Free レベルはサポートされていないため、このチュートリアルの最後に AI Search リソースをクリーンアップします。
- [ 確認 ] を選択し、[ 作成] を選択します。
AI Search リソースが作成されたら、リソース の [概要 ] ページに移動し、 URL 値をローカルファイルにコピーします。
ナビゲーションメニューの [設定 ] -->Keys を選択します。
[API アクセス制御] ページで、[両方] を選択して、マネージド ID またはキーを使用してサービスにアクセスできるようにします。メッセージが表示されたら、[ はい] を 選択します。

注

ロールの割り当てを追加するには最大 10 分かかるため、この演習では API キーを使用しますが、少しの追加作業で、システム割り当てマネージド ID がサービスに安全にアクセスできるようにすることができます。
左側のナビゲーションメニューで [ キー ] を選択し、 プライマリ管理者キー の値をローカルファイルにコピーします。 URL とキーの値は、演習の後半で必要になります。
ナビゲーションメニューで [設定 ] -->[Semantic ranker ] を選択し、[ Free ] が選択されていることを確認します。

注

セマンティックランカーが特定のリージョンで使用できるかどうかを確認するには、Azure Web サイトの [ リージョン別に利用可能な製品 ] ページで、リージョンが一覧表示されているかどうかを確認します。
Azure AI Foundry [データの追加] ダイアログに戻り、[Azure AI Search リソースの選択] ドロップダウンから新しく作成した検索リソースを選択します。一覧に表示されない場合は、ドロップダウンの横にある更新アイコンを選択します。
インデックス名の値を入力するには、 byod-search-indexの値を入力します 。
[ この検索リソースにベクター検索を追加する ] チェックボックスをオンにします。
[ 埋め込みモデルの選択 ] ドロップダウンで、前に作成した text-embedding-ada-002 モデルを選択します。
[ ファイルのアップロード ] ダイアログで、[ ファイルの参照] を選択します。
プロジェクトの 顧客ドキュメント フォルダー (プロジェクトのルートにある) に移動し、次のファイルを選択します。
- クロック A102 のインストール Instructions.docx
- 会社 FAQs.docx
注

この機能は現在、ローカルインデックスの作成に使用できるファイル形式 (.txt、.md、.html、.pdf、.docx、.pptx) をサポートしています。
[ ファイルのアップロード] を選択します。ファイルは、先ほど作成した BLOB ストレージリソース内の fileupload-byod-search-index コンテナーにアップロードされます。
[ 次へ ] を選択して、[ データ管理 ] ダイアログに移動します。
[ 検索の種類 ] ドロップダウンで、[ ハイブリッド + セマンティック] を選択します。

注

このオプションでは、キーワード検索とベクター検索がサポートされます。結果が返されると、ディープラーニングモデルを使用してセカンダリランク付けプロセスが結果セットに適用され、ユーザーの検索の関連性が向上します。セマンティック検索の詳細については、 Azure AI Search のドキュメントでセマンティック検索を参照してください。
[サイズの選択] の値が 1024 に設定されていることを確認します。
[次へ] を選択します。
Azure リソース認証の種類として、API キーを選択します。適切な認証の種類の選択の詳細については、 Azure AI Search 認証のドキュメントを参照してください。
[次へ] を選択します。
詳細を確認し、[ 保存して閉じる] を選択します。
カスタムデータがアップロードされたので、データのインデックスが作成され、 チャットプレイグラウンドで使用できるようになります。このプロセスには数分かかることがあります。完了したら、次のセクションに進みます。

チャットプレイグラウンドでのカスタムデータソースの使用

Azure OpenAI Studio でページの [チャットセッション ] セクションを見つけて、次の ユーザークエリを入力します。
```
What safety rules are required to install a clock?
```
ユーザークエリを送信すると、次のような結果が表示されます。
チャット応答の [1 参照 ] セクションを展開すると、 Clock A102 Installation Instructions.docx ファイルが表示され、それを選択してドキュメントを表示できます。
次の ユーザーメッセージを入力します。
```
What should I do to mount the clock on the wall?
```
次のような結果が表示されます。
次に、会社の FAQ ドキュメントを試してみましょう。 ユーザークエリ フィールドに次のテキストを入力します。
```
What is the company's policy on vacation time?
```
その要求に関する情報が見つからなかったことがわかります。
ユーザークエリ フィールドに次のテキストを入力します。
```
How should I handle refund requests?
```
次のような結果が表示されます。
チャット応答の [1 参照 ] セクションを展開すると、 会社の FAQs.docx ファイルが一覧表示され、それを選択してドキュメントを表示できます。
[チャット] プレイグラウンドのツールバーで [コードの表示] を選択します。
異なる言語を切り替え、エンドポイントを表示し、エンドポイントのキーにアクセスできることに注意してください。 [サンプルコード] ダイアログウィンドウを閉じます。
チャットメッセージの上にある [未加工の JSON を表示 する] トグルをオンにします。チャットセッションは、次のようなメッセージで始まることがわかります。
```
{
    "role": "system",
    "content": "You are an AI assistant that helps people find information."
}
```
カスタムデータソースを作成し、チャットプレイグラウンドで実験したので、プロジェクトのアプリケーションで使用する方法を見てみましょう。

アプリケーションで Bring Your Own Data Feature を使用する

VS Code でプロジェクトに戻り、 .env ファイルを開きます。 AI Services エンドポイント、キー、およびインデックス名を使用して、次の値を更新します。この演習の前半で、エンドポイントとキーをローカルファイルにコピーしました。
```
AZURE_AI_SEARCH_ENDPOINT=<AI_SERVICES_ENDPOINT_VALUE>
AZURE_AI_SEARCH_KEY=<AI_SERVICES_KEY_VALUE>
AZURE_AI_SEARCH_INDEX=byod-search-index
```
前の演習では、データベース、API、アプリケーションを開始しました。また、 .env ファイルも更新しました。これらの手順を完了していない場合は、先に進む前に、前の演習の最後の手順に従ってください。
アプリケーションがブラウザーに読み込まれたら、アプリケーションの右上にある チャットヘルプ アイコンを選択します。
チャットダイアログに次のテキストが表示されます。
```
How should I handle a company refund request?
```
[ ヘルプの取得 ] ボタンを選択します。 Azure OpenAI Studio で前にアップロードした Company FAQs.docx ドキュメントから返された結果が表示されます。ドキュメントを読み進める場合は、プロジェクトのルートにある 顧客ドキュメント フォルダーで見つけることができます。
テキストを次のように変更し、[ヘルプの取得 ] ボタンを選択します。
```
What safety rules are required to install a clock?
```
前に Azure OpenAI Studio でアップロードした Clock A102 Installation Instructions.docx ドキュメントから結果が返されます。このドキュメントは、プロジェクトのルートにある 顧客ドキュメント フォルダーでも使用できます。

コードの探索

ヒント

Visual Studio Code を使用している場合は、次を選択してファイルを直接開くことができます。

Windows/Linux: Ctrl + P
Mac: Cmd + P

次に、開くファイルの名前を入力します。

Visual Studio Code でプロジェクトのソースコードに戻ります。

サーバー/apiRoutes.ts ファイルを開き、completeBYOD ルートを見つけます。この API は、[チャットヘルプ] ダイアログで [ ヘルプの取得 ] ボタンが選択されている場合に呼び出されます。要求本文からユーザープロンプトを取得し、completeBYOD() ファイルの関数に渡します。その後、結果がクライアントに返されます。

router.post('/completeBYOD', async (req, res) => {
    const { prompt } = req.body;

    if (!prompt) {
        return res.status(400).json({ 
            status: false, 
            error: 'The prompt parameter must be provided.' 
        });
    }

    let result;
    try {
        // Call OpenAI to get custom "bring your own data" completion
    result = await completeBYOD(prompt);
    }
    catch (e: unknown) {
        console.error('Error parsing JSON:', e);
    }

    res.json(result);
});

サーバー/openAI.ts ファイルを開き、completeBYOD()関数を見つけます。
```
async function completeBYOD(userPrompt: string): Promise<string> {
    const systemPrompt = 'You are an AI assistant that helps people find information in documents.';
    return await callOpenAI(systemPrompt, userPrompt, 0, true);
}
```
この関数には、次の機能があります。
- userPrompt パラメーターには、ユーザーがチャットヘルプダイアログに入力した情報が含まれます。
- systemPrompt変数は、ユーザーが情報を見つけられるように設計された AI アシスタントが使用されることを定義します。
- callOpenAI() は、Azure OpenAI API を呼び出して結果を返すために使用されます。 systemPromptとuserPromptの値と、次のパラメーターが渡されます。
  - temperature - 応答に含める創造性の量。この場合、ユーザーは一貫性のある (あまりクリエイティブではない) 回答を必要とするため、値は 0 に設定されます。
  - useBYOD - AZURE OpenAI と共に AI Search を使用するかどうかを示すブール値。この場合、AI 検索機能が使用されるように、 true に設定されます。

callOpenAI()関数は、呼び出す OpenAI 関数を決定するために使用されるuseBYOD パラメーターを受け取ります。この場合、useBYOD関数が呼び出されるように、trueをgetAzureOpenAIBYODCompletion()に設定します。

function callOpenAI(systemPrompt: string, userPrompt: string, temperature = 0, useBYOD = false) {
    const isAzureOpenAI = OPENAI_API_KEY && OPENAI_ENDPOINT && OPENAI_MODEL;

    if (isAzureOpenAI) {
        if (useBYOD) {
            return getAzureOpenAIBYODCompletion(systemPrompt, userPrompt, temperature);
        }
        return getAzureOpenAICompletion(systemPrompt, userPrompt, temperature);
    }

    return getOpenAICompletion(systemPrompt, userPrompt, temperature);
}

getAzureOpenAIBYODCompletion()で関数を見つけます。これは、前に調べた getAzureOpenAICompletion() 関数とよく似ていますが、Azure OpenAI で使用できる "Azure OpenAI on your data" シナリオに固有のいくつかの主な違いを強調するための別の関数として示されています。
```
async function getAzureOpenAIBYODCompletion(systemPrompt: string, userPrompt: string, temperature: number): Promise<string> {
    const dataSources = [
        {
            type: 'azure_search',
            parameters: {
                authentication: {
                    type: 'api_key',
                    key: AZURE_AI_SEARCH_KEY
                },
                endpoint: AZURE_AI_SEARCH_ENDPOINT,
                index_name: AZURE_AI_SEARCH_INDEX
            }
        }
    ];

    const completion = await createAzureOpenAICompletion(systemPrompt, userPrompt, temperature, dataSources) as AzureOpenAIYourDataResponse;
    console.log('Azure OpenAI Add Your Own Data Output: \n', completion.choices[0]?.message);
    for (let citation of completion.choices[0]?.message?.context?.citations ?? []) {
        console.log('Citation Path:', citation.filepath);
    }
    return completion.choices[0]?.message?.content?.trim() ?? '';
}
```
getAzureOpenAIBYODCompletion()関数の次の機能に注意してください。
- この演習の前半でdataSources ファイルに追加された AI Search リソースのkey、endpoint、index_nameの値を含む.env プロパティが作成されます。
- createAzureOpenAICompletion()関数は、systemPrompt、userPrompt、temperature、およびdataSourcesの値で呼び出されます。この関数は、Azure OpenAI API を呼び出して結果を返すために使用されます。
- 応答が返されると、ドキュメントの引用文献がコンソールに記録されます。その後、完了メッセージの内容が呼び出し元に返されます。
次の演習に進む前に、いくつかの最後の点を考慮する必要があります。
- サンプルアプリケーションでは、Azure AI Search で 1 つのインデックスを使用します。 Azure OpenAI では、複数のインデックスとデータソースを使用できます。 dataSources関数の getAzureOpenAIBYODCompletion() プロパティは、必要に応じて複数のデータソースを含むように更新できます。
- セキュリティは、この種のシナリオで慎重に評価する必要があります。ユーザーは質問をしたり、アクセスできないドキュメントから結果を取得したりすることはできません。
Azure OpenAI、プロンプト、入力候補、独自のデータの使用方法について学習したので、次の演習に進み、通信機能を使用してアプリケーションを強化する方法を学習しましょう。 Azure OpenAI の詳細については、「Azure OpenAI Service の概要」トレーニングコンテンツを参照してください。 Azure OpenAI で独自のデータを使用する方法の詳細については、データドキュメントの Azure OpenAI を参照してください。

次の手順

通信: Azure Communication Services リソースの作成

次の方法で共有

AI: あなたのデータに対する Azure OpenAI

Azure AI Foundry へのカスタム データ ソースの追加

チャット プレイグラウンドでのカスタム データ ソースの使用

アプリケーションで Bring Your Own Data Feature を使用する

コードの探索

次の手順

フィードバック

その他のリソース

Azure AI Foundry へのカスタムデータソースの追加

チャットプレイグラウンドでのカスタムデータソースの使用