プロンプト モデルは、単語や文字をテキストの単位として操作するのではなく、その中間のトークンを使用します。
- トークンは、1 文字、単語の一部、または単語全体にすることができます。
- 多くの一般的な単語は 1 つのトークンで表されます。
- あまり一般的でない単語は、複数のトークンで表されます。
- プロンプト指示に画像やドキュメントが含まれる場合、それらは 変換ルール に従ってトークンに変換されます。
プロンプトによって消費されるトークン
プロンプト命令を作成して実行すると、次のことが起こります。
- プロンプト命令は、入力トークン と呼ばれる一連のトークンに分解されます。
- このモデルは、回答を生成します 出力トークン と呼ばれる一連のトークンとして。
入力トークンは、次のトークンの合計です。
- Microsoft からのシステム メタプロンプト。 このシステム プロンプトは表示されませんが、プロンプト応答の安全性のために不可欠です。 これは数百のトークンを表します。
- プロンプトの指示。
- 存在する場合は、入力値。
- 存在する場合は、取得されたナレッジ データ。
出力トークンは、モデル応答からのトークンです。
トークンがライセンスに与える影響
入力トークン、出力トークン、およびモデル バージョンの組み合わせにより、プロンプト実行のコストを計算できます。 詳細については、ダウンロード可能な PFD ファイル、Microsoft Power Platform ライセンスガイド の AI Builder レートカード セクションをご覧ください。
プロンプトを含むソリューションを構築する場合、プロンプトの平均コストを評価することが重要な場合があります。 この目標を達成するための 2 つの可能性については、次のセクションで説明します。
プロンプト ビルダーのクレジットカウント
Power Automate または Power Apps ポータル内の AI ハブでプロンプトをテストすると、プロンプトによって消費されたクレジットを表示できます。 テストは無料であるため、予測値です。
Power Automate フローからのトークン数
フローでプロンプト アクションを呼び出すと、数式を使用して関連する入力とトークンを取得できます。
入力トークン
outputs('Create_text_with_GPT_using_a_prompt')?['body/responsev2/predictionOutput/promptTokens']
出力トークン
outputs('Create_text_with_GPT_using_a_prompt')?['body/responsev2/predictionOutput/completionTokens']
画像やドキュメントをトークンに変換する方法
プロンプトに画像を渡すと、トークンに変換されます。
PDF ドキュメントをプロンプトに渡すと、まず 1 ページにつき 1 つの画像で画像に変換され、次にトークンに変換されます。
トークンから画像への変換は、Azure OpenAI ロジック を完全に適用します。
画像を Azure OpenAI にイメージを渡すときは、自動 設定を使用します。 つまり、画像のトークンコストは、その初期解像度によって異なります。
低解像度画像
解像度が 512 x 512 ピクセル未満の画像の変換レートは、サイズに関係なく、画像あたり 85 トークンの均一です。
高解像度画像
解像度が 512 x 512 ピクセルを超える画像の場合、トークンの変換は 2 つの手順で行われます。 このステップに、その状態を示します。
手順 | プロパティ | 会話プロセス |
---|---|---|
6 | 画像をサイズ変更する | 画像は、2048 x 2048 ピクセルの正方形に収まるようにサイズ変更されます。 最短辺が 768 ピクセルより大きい場合、短辺の長さが 768 ピクセルになるように画像のサイズがさらに変更されます。 縦横比は、サイズ変更時に保持されます。 |
2 | トークンの変換 | サイズ変更された画像は、512 x 512 ピクセルのタイルに分割されます。 部分的なタイルは、完全なタイルに切り上げられます。 タイルの数によってトークンの総コストが決まり、512 x 512ピクセルのタイルごとに170トークンのコストがかかります。 さらに85個の基本トークンが合計に追加されます。 |