Azure OpenAI を使用して埋め込みを生成する方法を学習する

埋め込みは、機械学習モデルとアルゴリズムで簡単に利用できる特別な形式のデータ表現です。 埋め込みは、テキストの意味論的意味の情報密度の高い表現です。 各埋め込みは浮動小数点数のベクトルであり、ベクトル空間内の 2 つの埋め込み間の距離は、元の形式の 2 つの入力間のセマンティック類似性と相関します。 たとえば、2 つのテキストが似ている場合、それらのベクトル表現も似ているはずです。 Azure Cosmos DB for MongoDB vCore または Azure Database for PostgreSQL - フレキシブル サーバーなど、Azure データベースにパワー ベクターの類似性検索を埋め込みます。

埋め込みを取得する方法

テキストの埋め込みベクトルを取得するには、次のコード スニペットに示すように、埋め込みエンドポイントに対して要求を行います。

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

ベスト プラクティス

入力が最大長を超えていないことを確認する

  • 最新の埋め込みモデルの入力テキストの最大長は 8,192 トークンです。 要求を行う前に、入力がこの制限を超えていないことを確認する必要があります。
  • 1 回の埋め込み要求で入力の配列を送信する場合、最大配列サイズは 2048 です。

制限事項とリスク

埋め込みモデルは、信頼性が低い場合や、特定のケースにおいて社会的リスクを引き起こす可能性があります。また、軽減策がない場合は損害を引き起こす可能性があります。 責任を持って使用する方法の詳細については、責任ある AI コンテンツを確認してください。

次の手順