DALL-E モデルを使用する方法を学ぶ
OpenAI の DALL-E モデルは、ユーザーが指定したテキスト プロンプトに基づいて画像を生成します。 このガイドでは、DALL-E モデルの使用方法と、REST API 呼び出しを使ってそのオプションを構成する方法について説明します。
前提条件
- Azure サブスクリプション。 無料で作成できます。
SwedenCentral
リージョンに作成された Azure OpenAI リソース。- 次に、Azure リソースを使用して
dalle3
モデルをデプロイする必要があります。 詳細については、「Azure OpenAI を使用してリソースを作成し、モデルをデプロイする」を参照してください。
画像生成 API を呼び出す
次のコマンドは、コードで DALL-E を使う最も基本的な方法を示しています。 これらのモデルをプログラムで初めて使う場合は、DALL-E のクイックスタートから始めることをお勧めします。
POST 要求を次の宛先に送信します。
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
どこで:
<your_resource_name>
は、Azure OpenAI リソースの名前です。<your_deployment_name>
は、DALL-E 3 モデル デプロイの名前です。<api_version>
は、使う API のバージョンです。 たとえば、2024-02-01
のようにします。
必須のヘッダー:
Content-Type
:application/json
api-key
:<your_API_key>
本文は次のようになります。
要求本文の例を次に示します。 いくつかのオプションを指定します。これらについては、後のセクションで定義します。
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
出力
成功した画像生成 API 呼び出しからの出力は次の例のようになります。 url
フィールドには、生成画像をダウンロードできる URL が含まれています。 URL は 24 時間アクティブなままです。
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
API 呼び出しの拒否
プロンプトと画像は、コンテンツ ポリシーに基づいてフィルター処理され、プロンプトまたは画像にフラグが設定されるとエラーが返されます。
プロンプトにフラグが設定されている場合、メッセージの error.code
値は contentFilter
に設定されます。 次に例を示します。
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
生成画像自体がフィルター処理される可能性もあります。 この場合、エラー メッセージは Generated image was filtered as a result of our safety system.
に設定されます。 次に例を示します。
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
画像プロンプトの書き込み
画像プロンプトでは、画像に表示するコンテンツと、画像の視覚的なスタイルを記述する必要があります。
プロンプトを記述するときは、画像生成 API には、コンテンツ モデレーション フィルターが付属していることを考慮します。 サービスがプロンプトを有害なコンテンツとして認識した場合、画像は生成されません。 詳細については、「コンテンツ フィルター」を参照してください。
ヒント
テキスト プロンプトを調整してさまざまな種類の画像を生成する方法については、イメージ プロンプト エンジニアリング ガイドを参照してください。
API オプションを指定する
DALL-E 画像の生成には、次の API 本文パラメーターを使えます。
サイズ
生成される画像のサイズを指定します。 DALL-E 3 モデルの 1024x1024
、1792x1024
、または 1024x1792
のいずれかである必要があります。 正方形の画像は生成が速くなります。
スタイル
DALL-E 3 には、natural
と vivid
の 2 つのスタイル オプションが導入されています。 natural
スタイルは DALL-E 2 の既定のスタイルに似ていますが、vivid
スタイルでは、よりリアルで映画的な画像が生成されます。
natural
スタイルは、よりシンプルで、落ち着いた、またはリアルであることを意図した主題が、DALL-E 3 で誇張または混同される場合に役立ちます。
既定値は vivid
です。
Quality
画質には、hd
と standard
の 2 つのオプションがあります。 hd
は、より詳細で、全体の一貫性が高い画像を作成します。 standard
の画像は、より高速に生成できます。
既定値は standard
です。
番号
DALL-E 3 では、1 つの API 呼び出しで複数の画像を生成することはできません。n パラメーターを 1
に設定する必要があります。 一度に複数の画像を生成する必要がある場合は、並列要求を実行します。
応答形式
生成された画像が返される形式です。 url
(画像を指す URL) または b64_json
(JSON 形式の Base 64 バイト コード) のいずれかである必要があります。 既定値は、url
です。
次のステップ
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示