Sdílet prostřednictvím


Modely Azure OpenAI Service

Služba Azure OpenAI Service využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelu se liší podle oblastí a cloudu. Dostupnost modelu Azure Government najdete ve službě Azure Government OpenAI.

Modely Popis
o1-preview a o1-mini Modely s omezeným přístupem, které jsou speciálně navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností.
GPT-4o & GPT-4o mini & GPT-4 Turbo Nejnovější modely Azure OpenAI s vícemodálními verzemi, které můžou jako vstup přijímat text i obrázky.
GPT-4o audio Model GPT-4o, který podporuje konverzační interakce s nízkou latencí , "řeč v řeči".
GPT-4 Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód.
GPT-3.5 Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód.
Vkládání Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu.
DALL-E Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka.
Šeptat Řada modelů ve verzi Preview, která dokáže přepisovat a překládat řeč na text.
Převod textu na řeč (Preview) Řada modelů ve verzi Preview, která dokáže syntetizovat text na řeč.

omezený přístup k modelům o1-preview a o1-mini

Azure OpenAI o1-preview a o1-mini modely jsou speciálně navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako jsou věda, kódování a matematika v porovnání s předchozími iteracemi.

ID modelu Popis Max Request (tokeny) Trénovací data (až do)
o1-preview (2024-09-12) Nejschopnější model v řadě o1, který nabízí vylepšené schopnosti zdůvodnění. Vstup: 128 000
Výstup: 32 768
Října 2023
o1-mini (2024-09-12) Rychlejší a nákladově efektivnější možnost v řadě o1, která je ideální pro psaní úkolů vyžadujících rychlost a nižší spotřebu prostředků. Vstup: 128 000
Výstup: 65 536
Října 2023

Dostupnost

o1-mini K dispozici jsou teď modely o1-preview pro přístup k rozhraní API a nasazení modelu. Registrace je povinná a přístup se udělí na základě kritérií způsobilosti microsoftu.

Vyžádání přístupu: aplikace modelu omezeného přístupu

Po udělení přístupu budete muset vytvořit nasazení pro každý model.

Podpora rozhraní API

Podpora modelů řady o1 byla přidána ve verzi 2024-09-01-previewrozhraní API .

Parametr max_tokens je zastaralý a nahrazen novým max_completion_tokens parametrem. Modely řad o1 budou fungovat pouze s parametrem max_completion_tokens .

Využití

Tyto modely v současné době nepodporují stejnou sadu parametrů jako jiné modely, které používají rozhraní API pro dokončování chatu. V současné době se podporuje pouze velmi omezená podmnožina, takže běžné parametry jako temperature, top_pnejsou k dispozici a jejich zahrnutí způsobí selhání vaší žádosti. o1-preview a o1-mini modely také nepřijímají roli systémových zpráv jako součást pole zpráv.

Možná budete muset upgradovat svoji verzi knihovny OpenAI Python, abyste mohli využít výhod nového max_completion_tokens parametru.

pip install openai --upgrade

Pokud s ověřováním začínáte používat Microsoft Entra ID, přečtěte si téma Konfigurace služby Azure OpenAI s ověřováním Microsoft Entra ID.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Regionální dostupnost

K dispozici pro standardní a globální standardní nasazení v oblasti USA – východ 2 a Švédsko – střed pro schválené zákazníky.

GPT-4o audio

Model gpt-4o-realtime-preview je součástí řady modelů GPT-4o a podporuje nízko latenci a konverzační interakce "řeč v řeči". GPT-4o zvuk je navržený tak, aby zpracovával konverzační interakce v reálném čase, s nízkou latencí a skvěle se hodí pro agenty podpory, asistenty, překladatele a další případy použití, které potřebují vysoce responzivní back-and-forth s uživatelem.

Zvuk GPT-4o je k dispozici v oblastech USA – východ 2 (eastus2) a Švédsko – střed (swedencentral). Pokud chcete použít zvuk GPT-4o, musíte vytvořit nebo použít existující prostředek v jedné z podporovaných oblastí.

Po vytvoření prostředku můžete nasadit zvukový model GPT-4o. Pokud provádíte programové nasazení, název modelu je gpt-4o-realtime-preview. Další informace o tom, jak používat zvuk GPT-4o, najdete v dokumentaci k zvuku GPT-4o.

Podrobnosti o maximálních tokenech žádostí a trénovacích datech jsou k dispozici v následující tabulce.

ID modelu Popis Max Request (tokeny) Trénovací data (až do)
gpt-4o-realtime-preview (10. 10. 2024 ve verzi Preview)
GPT-4o audio
Zvukový model pro zpracování zvuku v reálném čase Vstup: 128 000
Výstup: 4 096
Října 2023

GPT-4o a GPT-4 Turbo

GPT-4o integruje text a obrázky v jednom modelu a umožňuje zpracovávat více datových typů současně. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače. GPT-4o odpovídá GPT-4 Turbo v anglickém textu a programovacím úlohám a nabízí vynikající výkon v neanglických jazycích a vizuálních úkolech, nastavení nových srovnávacích testů pro funkce AI.

Návody přistupovat k minimodelům GPT-4o a GPT-4o?

GPT-4o a GPT-4o mini jsou k dispozici pro standardní a globální nasazení modelu.

Potřebujete vytvořit nebo použít existující prostředek v podporované standardní nebo globální standardní oblasti, ve které je model dostupný.

Po vytvoření prostředku můžete nasadit modely GPT-4o. Pokud provádíte programové nasazení, názvy modelů jsou:

  • gpt-4oVerze 2024-08-06
  • gpt-4o, Verze 2024-05-13
  • gpt-4o-miniVerze 2024-07-18

GPT-4 Turbo

GPT-4 Turbo je velký multimodální model (přijímá textové nebo obrazové vstupy a generuje text), který dokáže řešit obtížné problémy s větší přesností než kterýkoli z předchozích modelů OpenAI. Stejně jako GPT-3.5 Turbo a starší modely GPT-4 GPT-4 Turbo jsou optimalizované pro chat a fungují dobře pro tradiční úkoly dokončení.

Nejnovější verze GA GPT-4 Turbo je:

  • gpt-4Verze: turbo-2024-04-09

Toto je náhrada následujících modelů Preview:

  • gpt-4Verze: 1106-Preview
  • gpt-4Verze: 0125-Preview
  • gpt-4Verze: vision-preview

Rozdíly mezi modely OpenAI a Azure OpenAI GPT-4 Turbo GA

  • Verze nejnovějšího 0409 modelu Turbo OpenAI podporuje režim JSON a volání funkcí pro všechny žádosti o odvozování.
  • Verze nejnovější turbo-2024-04-09 verze Azure OpenAI v současné době nepodporuje použití režimu JSON a volání funkcí při odvozování požadavků na odvozování pomocí vstupu obrázku (vision). Textové vstupní požadavky (požadavky bez image_url a vložené obrázky) podporují režim JSON a volání funkcí.

Rozdíly od gpt-4 vision-preview

  • Integrace vylepšení zpracování obrazu specifické pro Azure AI s GPT-4 Turbo s vision není pro gpt-4 verzi podporovaná: turbo-2024-04-09 Patří sem optické rozpoznávání znaků (OCR), uzemnění objektů, výzvy k videu a vylepšené zpracování dat pomocí obrázků.

Spravovaná dostupnost zřízená pomocí GPT-4 Turbo

  • gpt-4Verze: turbo-2024-04-09 je k dispozici pro standardní i zřízená nasazení. V současné době zřízená verze tohoto modelu nepodporuje požadavky na odvozování obrázků a obrazu. Zřízená nasazení tohoto modelu přijímají pouze textové zadání. Nasazení standardního modelu přijímají požadavky na odvozování textu i obrazu a obrazu.

Nasazení GPT-4 Turbo s ga vision

Pokud chcete nasadit model GA z uživatelského rozhraní sady Studio, vyberte GPT-4 a pak v rozevírací nabídce zvolte turbo-2024-04-09 verzi. Výchozí kvóta modelu gpt-4-turbo-2024-04-09 bude stejná jako aktuální kvóta pro GPT-4-Turbo. Podívejte se na limity kvót v jednotlivých oblastech.

GPT-4

GPT-4 je předchůdcem GPT-4 Turbo. Modely GPT-4 a GPT-4 Turbo mají základní název gpt-4modelu . Modely GPT-4 a Turbo můžete rozlišit prozkoumáním verze modelu.

  • gpt-4Verze 0314
  • gpt-4Verze 0613
  • gpt-4-32kVerze 0613

V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.

Modely GPT-4 a GPT-4 Turbo

  • Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.

Podívejte se na verze modelu, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu nasazení GPT-4.

ID modelu Popis Max Request (tokeny) Trénovací data (až do)
gpt-4o (2024-08-06)
GPT-4o (Omni)
Nejnovější velký model GA
- Strukturované výstupy
- Zpracování textu, obrázku
– Režim JSON
– paralelní volání funkce
- Vyšší přesnost a rychlost odezvy
- Parita s anglickým textem a kódovacími úkoly v porovnání s GPT-4 Turbo s vision
- Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu
Vstup: 128 000
Výstup: 16 384
Října 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
Nejnovější malý model GA
- Rychlý, levný a schopný model ideální pro nahrazení modelů SÉRIE GPT-3.5 Turbo.
- Zpracování textu, obrázku
– Režim JSON
– paralelní volání funkce
Vstup: 128 000
Výstup: 16 384
Října 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Zpracování textu, obrázku
– Režim JSON
– paralelní volání funkce
- Vyšší přesnost a rychlost odezvy
- Parita s anglickým textem a kódovacími úkoly v porovnání s GPT-4 Turbo s vision
- Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu
Vstup: 128 000
Výstup: 4 096
Října 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo s vision
Nový model GA
- Náhrada za všechny předchozí modely GPT-4 Preview (vision-preview, 1106-Preview, 0125-Preview).
- Dostupnost funkcí se v současné době liší v závislosti na metodě vstupu a typu nasazení.
Vstup: 128 000
Výstup: 4 096
Prosinec 2023
gpt-4 (0125-Preview)*
GPT-4 Turbo Preview
Náhled modelu
-Nahrazuje 1106-Preview
- Lepší výkon generování kódu
– Snižuje případy, kdy model nedokončí úlohu.
– Režim JSON
– paralelní volání funkce
- reprodukovatelný výstup (Preview)
Vstup: 128 000
Výstup: 4 096
Prosinec 2023
gpt-4 (vision-preview)
GPT-4 Turbo s vision Preview
Model Preview
- Přijímá text a vstup obrázku.
- Podporuje vylepšení
– Režim JSON
– paralelní volání funkce
- reprodukovatelný výstup (Preview)
Vstup: 128 000
Výstup: 4 096
Duben 2023
gpt-4 (1106-Preview)
GPT-4 Turbo Preview
Náhled modelu
– Režim JSON
– paralelní volání funkce
- reprodukovatelný výstup (Preview)
Vstup: 128 000
Výstup: 4 096
Duben 2023
gpt-4-32k (0613) Starší model GA
- Základní volání funkcí pomocí nástrojů
32,768 Zář 2021
gpt-4 (0613) Starší model GA
- Základní volání funkcí pomocí nástrojů
8,192 Zář 2021
gpt-4-32k(0314) Starší model GA
- Informace o vyřazení
32,768 Zář 2021
gpt-4 (0314) Starší model GA
- Informace o vyřazení
8,192 Zář 2021

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely označené ve verzi Preview nedodržují standardní životní cyklus modelu Azure OpenAI.

  • GPT-4 verze 0125-preview je aktualizovaná verze GPT-4 Turbo Preview, která byla dříve vydána jako verze 1106-preview.
  • GPT-4 verze 0125-preview dokončí úlohy, jako je generování kódu, v porovnání s gpt-4-1106-preview. Z tohoto důvodu můžou zákazníci v závislosti na úloze zjistit, že GPT-4-0125-preview generuje ve srovnání s gpt-4-1106-preview další výstup. Doporučujeme zákazníkům porovnat výstupy nového modelu. GPT-4-0125-preview také řeší chyby v gpt-4-1106-preview se zpracováním UTF-8 pro neanglické jazyky.
  • GPT-4 verze turbo-2024-04-09 je nejnovější verze GA a nahrazuje 0125-Preview, 1106-previewa vision-preview.

Důležité

Verze 1106-Preview0125-PreviewGPT-4 (gpt-4) a vision-preview budou upgradovány stabilní verzí gpt-4 v budoucnu.

  • gpt-4 Po vydání stabilní verze se spustí nasazení verzí 1106-Preview0125-Preview, a vision-preview nastavte možnost Automatické aktualizace na výchozí a Upgrade po vypršení platnosti. Pro každé nasazení probíhá upgrade verze modelu bez přerušení služby pro volání rozhraní API. Upgrady jsou fázované podle oblasti a očekává se, že celý proces upgradu bude trvat 2 týdny.
  • Nasazení verzí 1106-Preview0125-Previewa vision-preview nastavená na Možnost Bez automatického gpt-4 upgradu se neupgraduje a při upgradu verze Preview v oblasti přestane fungovat. Další informace o načasování upgradu najdete v části Vyřazení a vyřazení modelu Azure OpenAI.

GPT-3.5

Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře i pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné možnosti jako text-davinci-003 použití rozhraní API pro dokončování místo rozhraní API pro dokončování chatu. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Pokyny pro starší modely GPT-3.5 a GPT-3.

ID modelu Popis Max Request (tokeny) Trénovací data (až do)
gpt-35-turbo (0125) NOVÝ Nejnovější model GA
– Režim JSON
– paralelní volání funkce
- reprodukovatelný výstup (Preview)
- Vyšší přesnost při odpovídání v požadovaných formátech.
- Oprava chyby, která způsobila problém s kódováním textu pro volání jiných než anglické jazykové funkce.
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo (1106) Starší model GA
– Režim JSON
– paralelní volání funkce
- reprodukovatelný výstup (Preview)
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo-instruct (0914) Pouze koncový bod dokončení
- Nahrazení modelů starších dokončení
4,097 Zář 2021
gpt-35-turbo-16k (0613) Starší model GA
- Základní volání funkcí pomocí nástrojů
16,384 Zář 2021
gpt-35-turbo (0613) Starší model GA
- Základní volání funkcí pomocí nástrojů
4,096 Zář 2021
gpt-35-turbo1 (0301) Starší model GA
- Informace o vyřazení
4,096 Zář 2021

Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našich podrobných návodech.

1 Tento model přijme požadavky > 4 096 tokenů. Nedoporučuje se překročit limit vstupního tokenu 4 096, protože novější verze modelu je omezena na 4 096 tokenů. Pokud při překročení 4 096 vstupních tokenů s tímto modelem narazíte na problémy, tato konfigurace se oficiálně nepodporuje.

Vkládání

text-embedding-3-large je nejnovější a nejschopnější model vkládání. Upgrade mezi modely vkládání není možný. Aby bylo možné přejít z použití text-embedding-ada-002 na text-embedding-3-large , budete muset vygenerovat nové vkládání.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Při testování nabízí OpenAI sestavy velkých i malých modelů vkládání třetí generace lepší průměrný výkon načítání ve více jazycích pomocí srovnávacího testu MIRACL a přitom stále zachovává výkon pro anglické úlohy s srovnávacím testem MTEB .

Srovnávací test vyhodnocení text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Průměr MIRACL 31.4 44.0 54.9
Průměr MTEB 61.0 62.3 64.6

Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade

Srovnávací testy MTEB OpenAI zjistily, že i když jsou dimenze modelu třetí generace sníženy na méně než text-embeddings-ada-002 1 536 dimenzí, zůstává mírně lepší.

DALL-E

Modely DALL-E generují obrázky z textových výzev, které uživatel poskytuje. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.

Šeptat

Modely Šeptání lze použít pro převod řeči na text.

Model Whisper můžete použít také prostřednictvím rozhraní API pro dávkové přepisy služby Azure AI Speech. Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.

Převod textu na řeč (Preview)

Text OpenAI na řečové modely, které jsou aktuálně ve verzi Preview, je možné použít k syntetizaci textu na řeč.

Text OpenAI můžete také použít k hlasovým hlasovým hovorům přes Azure AI Speech. Další informace najdete v tématu OpenAI text na hlasové hlasy prostřednictvím služby Azure OpenAI nebo průvodce službou Azure AI Speech .

Souhrnná tabulka modelů a dostupnost oblastí

Poznámka:

Tento článek se primárně zabývá dostupností modelů a oblastí, která platí pro všechny zákazníky Azure OpenAI s typy nasazení standardu. Někteří výběroví zákazníci mají přístup k kombinacím modelů a oblastí, které nejsou uvedené v následující sjednocené tabulce. Další informace o zřízených nasazeních najdete v našich doprovodných materiálech ke zřízení.

Dostupnost modelu nasazení úrovně Standard

Oblast o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 dall-e-2, 2.0 dall-e-3, 3.0 babbage-002, 1 davinci-002, 1 tts, 001 tts-hd, 001 šeptání, 001
australiaeast - - - - - - - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - -
Norsko – východ - - - - - - - - - - - - - - - - - - - - - - - -
Jižní Afrika – sever - - - - - - - - - - - - - - - - - - - - - - - - - - -
Střed USA – jih - - - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Tato tabulka neobsahuje podrobné informace o dostupnosti v jednotlivých oblastech. Informace najdete v části s vyladěním.

Informace o výchozí kvótě najdete v článku o kvótách a omezeních.

Dostupnost zřízeného modelu nasazení

Oblast gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast -
brazilsouth - - -
canadacentral - - - - - - -
canadaeast - - - -
eastus
eastus2
francecentral - - -
Německo – středozápad - - -
japaneast - - - -
koreacentral - - - -
northcentralus
Norsko – východ - - - - - - -
polskocentral - -
Jižní Afrika – sever - - - - -
Střed USA – jih - -
southindia - -
swedencentral
switzerlandnorth -
switzerlandwest - - - - - - - - -
uksouth - -
westus -
westus3 - -

Poznámka:

Zřízená verze gpt-4 : turbo-2024-04-09 v současné době je omezena pouze na text.

Další informace o zřízených nasazeních najdete v našich doprovodných materiálech ke zřízení.

Globální standardní dostupnost modelu

Oblast o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01
australiaeast - - - -
brazilsouth - - - -
canadaeast - - - -
eastus - - -
eastus2
francecentral - - - -
Německo – středozápad - - - -
japaneast - - - -
koreacentral - - - -
northcentralus - - -
Norsko – východ - - - -
polskocentral - - - -
Jižní Afrika – sever - - - -
Střed USA – jih - - -
southindia - - - -
španělskocentral - - - -
swedencentral
switzerlandnorth - - - -
uksouth - - - -
westeurope - - - -
westus - - -
westus3 - - -

Dostupnost globálního zřízeného spravovaného modelu

Oblast gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18
australiaeast
brazilsouth
canadacentral
canadaeast
eastus
eastus2
francecentral
Německo – středozápad
japaneast
koreacentral
northcentralus
Norsko – východ
polskocentral
Jižní Afrika – sever
Střed USA – jih
southindia
španělskocentral
swedencentral
switzerlandnorth
switzerlandwest
uksouth
westeurope
westus
westus3

Globální dostupnost dávkového modelu

Oblast gpt-4, 0613 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
eastus
swedencentral
westus

Dostupnost modelu GPT-4 a GPT-4 Turbo

Oblasti veřejného cloudu

Oblast gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613
australiaeast - - - - -
canadaeast - - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - -
northcentralus - - - -
Norsko – východ - - - - - - - -
Střed USA – jih - - - -
southindia - - - - - - - -
swedencentral -
switzerlandnorth - - - - - -
uksouth - - - - - - -
westus - - -
westus3 - - - -

Výběr přístupu zákazníka

Kromě výše uvedených oblastí, které jsou dostupné všem zákazníkům Azure OpenAI, byly některým vybraným stávajícím zákazníkům udělen přístup k verzím GPT-4 v dalších oblastech:

Model Oblast
gpt-4 (0314)
gpt-4-32k (0314)
USA – východ
Francie – střed
USA – středojižní
Velká Británie – jih
gpt-4 (0613)
gpt-4-32k (0613)
USA – východ
USA – východ 2
Japonsko – východ
Velká Británie – jih

Modely GPT-3.5

Důležité

gpt-35-turbo (0125) Nový model má různá vylepšení, včetně vyšší přesnosti při odpovídání v požadovaných formátech a opravy chyby, která způsobovala problém s kódováním textu pro volání funkcí jiného jazyka než v angličtině.

GPT-3.5 Turbo se používá s rozhraním API Chat Completion. GPT-3.5 Turbo verze 0301 lze také použít s rozhraním API pro dokončování, i když se to nedoporučuje. GPT-3.5 Turbo verze 0613 a 1106 podporují pouze rozhraní API pro dokončování chatu.

GPT-3.5 Turbo verze 0301 je první verze vydaného modelu. Verze 0613 je druhá verze modelu a přidává podporu volání funkcí.

Podívejte se na verze modelů, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu vašich nasazení GPT-3.5 Turbo.

Dostupnost modelu GPT-3.5-Turbo

Oblasti veřejného cloudu

Oblast gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus -
eastus2 - - -
francecentral - -
japaneast - - - -
northcentralus - - -
Střed USA – jih - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - -
westus3 - - - - -

Vložené modely

Tyto modely lze použít pouze s požadavky rozhraní API pro vložení.

Poznámka:

text-embedding-3-large je nejnovější a nejschopnější model vkládání. Upgrade mezi vloženým modelem není možný. Aby bylo možné migrovat z používání text-embedding-ada-002 na text-embedding-3-large , budete muset vygenerovat nové vkládání.

ID modelu Max Request (tokeny) Výstupní dimenze Trénovací data (up-to)
text-embedding-ada-002 (verze 2) 8,191 1 536 Zář 2021
text-embedding-ada-002 (verze 1) 2,046 1 536 Zář 2021
text-embedding-3-large 8,191 3 072 Zář 2021
text-embedding-3-small 8,191 1 536 Zář 2021

Poznámka:

Při odesílání pole vstupů pro vložení je maximální počet vstupních položek v poli na volání koncového bodu vkládání 2048.

Oblasti veřejného cloudu

Oblast text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - -
japaneast - -
northcentralus - - -
Norsko – východ - -
Jižní Afrika – sever - - -
Střed USA – jih - -
southindia - -
swedencentral - -
switzerlandnorth - - -
uksouth - -
westeurope - - -
westus - - -
westus3 - -

Modely DALL-E

ID modelu Dostupnost funkcí Maximální počet požadavků (znaků)
dalle2 (Preview) USA – východ 1000
dall-e-3 USA – východ, Austrálie – východ, Švédsko – střed 4 000

Jemně dolaďovací modely

babbage-002 a davinci-002 nejsou vytrénovány tak, aby dodržovaly pokyny. Dotazování na tyto základní modely by mělo být provedeno pouze jako odkaz na jemně vyladěnou verzi, aby bylo možné vyhodnotit průběh trénování.

gpt-35-turbo – vyladění tohoto modelu je omezené na podmnožinu oblastí a není k dispozici v každé oblasti, ve které je základní model k dispozici.

ID modelu Vyladění oblastí Max Request (tokeny) Trénovací data (až do)
babbage-002 USA – středosever
Švédsko – střed
Švýcarsko – západ
16,384 Zář 2021
davinci-002 USA – středosever
Švédsko – střed
Švýcarsko – západ
16,384 Zář 2021
gpt-35-turbo (0613) USA – východ 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
4,096 Zář 2021
gpt-35-turbo (1106) USA – východ 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo (0125) USA – východ 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
16,385 Zář 2021
gpt-4 (0613) 1 USA – středosever
Švédsko – střed
8192 Zář 2021
gpt-4o-mini1 (2024-07-18) USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 64 536
Října 2023
gpt-4o1 (2024-08-06) USA – východ 2
USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 64 536
Října 2023

V současné době je ve verzi Public Preview 1 GPT-4, GPT-4o a mini-tuning GPT-4o. Další informace najdete v našich pokynech k vyhodnocení bezpečnosti GPT-4, GPT-4o a GPT-4o.

Šeptající modely

ID modelu Dostupnost modelu Maximální počet požadavků (velikost zvukového souboru)
whisper USA – východ 2
USA – středosever
Norsko – východ
Indie – jih
Švédsko – střed
Západní Evropa
25 MB

Převod textu na řečové modely (Preview)

ID modelu Dostupnost modelu
tts-1 USA – středosever
Švédsko – střed
tts-1-hd USA – středosever
Švédsko – střed

Asistenti (Preview)

Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK, Azure AI Studiu a Azure OpenAI Studiu. Následující tabulka je určená pro průběžné platby. Informace o dostupnosti zřízené jednotky propustnosti (PTU) najdete v tématu Zřízená propustnost. Uvedené modely a oblasti je možné použít s asistenty v1 i v2. Globální standardní modely můžete použít, pokud jsou podporované v následujících oblastech.

Oblast gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Austrálie – východ
East US
USA – východ 2
Francie – střed
Japonsko – východ
Norsko – východ
Švédsko – střed
Velká Británie – jih
USA – západ
USA – západ 3

Vyřazení modelu

Nejnovější informace o vyřazení modelu najdete v průvodci vyřazením modelu.

Další kroky