Azure Open AI Serivceのgpt-4o（2024-8-6）モデルのmax_tokensが上限まで設定できない

Question

Azure Open AI Serivceのgpt-4o（2024-8-6）モデルのmax_tokensが上限まで設定できない

大西 0

Azure Open AIのgpt-4o（2024-8-6）出力トークンは16,384まで可能な仕様ですが、max_tokensは半分の8,192までしか設定できず、それを超えるとエラーが返ってきます。原因と対処法をご教示いただけますでしょうか。

■設定したいmax_tokensの値

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/concepts/models?tabs=python-secure%2Cglobal-standard%2Cstandard-chat-completions#gpt-4o-and-gpt-4-turbo

→gpt-4o（2024-8-6）出力トークンは16,384まで設定できる想定です。

■失敗したリクエスト

→max_tokensが8192（期待する上限値の半分）までは正常に終了しますが、8193以上を設定するとエラーメッセージが返ってきます。

try {

const response = await fetch('https://xxxxxx.openai.azure.com/openai/deployments/gpt-4o/chat/completions?api-version=2024-08-01-preview', {

    method: 'POST',

    headers: {

        'Content-Type': 'application/json',

        'api-key': 'xxxxxx'

    },

    body: JSON.stringify({

        model: 'gpt-4o',

        "messages": [

            { "role": "user", "content": promptText }

        ],

        max_tokens: 16384

    })

});

■エラーメッセージ

エラーが発生しました: HTTP error! status: 429, response: {"error":{"code":"429","message": "Requests to the ChatCompletions_Create Operation under Azure OpenAI API version 2024-08-01-preview have exceeded token rate limit of your current OpenAI S0 pricing tier. Please retry after 17 seconds. Please go here: https://aka.ms/oai/quotaincrease if you would like to further increase the default rate limit."}}

simo-k 11,220 評価のポイントボランティアモデレーター

2025-06-07T16:13:02.2533333+00:00

必要に応じて、タグ"Azure Open AI"がサポートされているMicrosoft Q&A(en-us)にて英語で質問投稿して下さい。
Microsoft Q&A (en-us版)
※ 質問内容によっては、閲覧者・回答者が多い海外コミュニティをお勧めします。
　 Microsoft Q&A(en-us)では、英語で質問して下さい。
　（英語以外で質問した場合は質問削除されるケース有り。
　　適切なタグを付与していないと無視されるケースもあります。）
※ アドバイスが重複して混乱する事を避ける為に、質問されたスレッドURLを付記しておく事を推奨します。

お客様の回答

simo-k 11,220 評価のポイントボランティアモデレーター

2025-06-07T16:13:02.2533333+00:00

必要に応じて、タグ"Azure Open AI"がサポートされているMicrosoft Q&A(en-us)にて英語で質問投稿して下さい。
Microsoft Q&A (en-us版)
※ 質問内容によっては、閲覧者・回答者が多い海外コミュニティをお勧めします。
　 Microsoft Q&A(en-us)では、英語で質問して下さい。
　（英語以外で質問した場合は質問削除されるケース有り。
　　適切なタグを付与していないと無視されるケースもあります。）
※ アドバイスが重複して混乱する事を避ける為に、質問されたスレッドURLを付記しておく事を推奨します。

次の方法で共有

Azure Open AI Serivceのgpt-4o（2024-8-6）モデルのmax_tokensが上限まで設定できない

お客様の回答