Modely Azure OpenAI Service

Služba Azure OpenAI Service využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelů se liší podle oblasti. Informace o vyřazení GPT-3 a dalších modelů v červenci 2024 najdete v tématu Starší modely Azure OpenAI Service.

Modely Popis
GPT-4 Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód.
GPT-3.5 Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód.
Vkládání Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu.
DALL-E Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka.
Šepot Řada modelů ve verzi Preview, která dokáže přepisovat a překládat řeč na text.
Převod textu na řeč (Preview) Řada modelů ve verzi Preview, která dokáže syntetizovat text na řeč.

GPT-4 a GPT-4 Turbo Preview

GPT-4 je velký multimodální model (příjem vstupů textu nebo obrázků a generování textu), který dokáže vyřešit obtížné problémy s větší přesností než kterýkoli z předchozích modelů OpenAI. Stejně jako GPT-3.5 Turbo je GPT-4 optimalizovaný pro chat a funguje dobře pro tradiční úkoly dokončení. K používání GPT-4 použijte rozhraní API pro dokončování chatu. Další informace o interakci s rozhraním GPT-4 a rozhraním API pro dokončování chatu najdete v našich podrobných návodech.

GPT-4 Turbo s vision je verze GPT-4, která přijímá vstupy obrázků. Je k dispozici jako vision-preview model gpt-4.

  • gpt-4
  • gpt-4-32k

V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.

GPT-3.5

Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře i pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné možnosti jako text-davinci-003 použití rozhraní API pro dokončování místo rozhraní API pro dokončování chatu. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Pokyny pro starší modely GPT-3.5 a GPT-3.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.

Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našich podrobných návodech.

Vkládání

text-embedding-3-large je nejnovější a nejschopnější model vkládání. Upgrade mezi modely vkládání není možný. Aby bylo možné přejít z použití text-embedding-ada-002 na text-embedding-3-large , budete muset vygenerovat nové vkládání.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Při testování nabízí OpenAI sestavy velkých i malých modelů vkládání třetí generace lepší průměrný výkon načítání ve více jazycích pomocí srovnávacího testu MIRACL a přitom stále zachovává výkon pro anglické úlohy s srovnávacím testem MTEB .

Srovnávací test vyhodnocení text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Průměr MIRACL 31.4 44.0 54.9
Průměr MTEB 61.0 62.3 64.6

Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade

Srovnávací testy MTEB OpenAI zjistily, že i když jsou dimenze modelu třetí generace sníženy na méně než text-embeddings-ada-002 1 536 dimenzí, zůstává mírně lepší.

DALL-E

Modely DALL-E generují obrázky z textových výzev, které uživatel poskytuje. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.

Šepot

Modely Šeptání lze použít pro převod řeči na text.

Model Whisper můžete použít také prostřednictvím rozhraní API pro dávkové přepisy služby Azure AI Speech. Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.

Převod textu na řeč (Preview)

Text OpenAI na řečové modely, které jsou aktuálně ve verzi Preview, je možné použít k syntetizaci textu na řeč.

Text OpenAI můžete také použít k hlasovým hlasovým hovorům přes Azure AI Speech. Další informace najdete v tématu OpenAI text na hlasové hlasy prostřednictvím služby Azure OpenAI nebo průvodce službou Azure AI Speech .

Souhrnná tabulka modelů a dostupnost oblastí

Poznámka:

Tento článek se zabývá pouze dostupností modelů a oblastí, které platí jenom pro všechny zákazníky Azure OpenAI s typy nasazení standardu. Někteří výběroví zákazníci mají přístup k kombinacím modelů a oblastí, které nejsou uvedené v následující sjednocené tabulce. Tyto tabulky se také nevztahují na zákazníky používající pouze typy zřízeného nasazení, které mají vlastní jedinečnou matici dostupnosti modelu nebo oblasti. Další informace o zřízených nasazeních najdete v našich doprovodných materiálech.

Dostupnost modelu nasazení úrovně Standard

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
australiaeast - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - -
Norsko – východ - - - - - - - - - - - - - - - - - -
Jižní Afrika – sever - - - - - - - - - - - - - - - - - - - -
Střed USA – jih - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Standardní kvóta modelu nasazení

Výchozí kvóta pro modely se liší podle modelu a oblasti. Výchozí limity kvót se můžou změnit.

Kvóta pro standardní nasazení je popsaná z hlediska tokenů za minutu (TPM).

Oblast GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - jemné ladění Davinci-002 Davinci-002 - jemné ladění GPT-35-Turbo - jemné ladění GPT-35-Turbo-1106 - jemné ladění GPT-35-Turbo-0125 - jemné ladění
australiaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 tis. 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
Norsko – východ - - 150 K - - - 350 K - - - - - - - - -
Jižní Afrika – sever - - - - - - 350 K - - - - - - - - -
Střed USA – jih - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - - - - - 350 K - - - - - - - - -

1 K = 1000 tokenů za minutu (TPM). Vztah mezi čipem TPM a žádostmi za minutu (RPM) je aktuálně definován jako 6 RPM na 1000 TPM.

Modely GPT-4 a GPT-4 Turbo Preview

GpT-4, GPT-4-32k a GPT-4 Turbo s obrazem jsou nyní k dispozici všem zákazníkům služeb Azure OpenAI. Dostupnost se liší podle oblasti. Pokud GPT-4 v oblasti nevidíte, zkuste to znovu později.

Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.

GPT-4 verze 0314 je první vydaná verze modelu. Verze 0613 je druhá verze modelu a přidává podporu volání funkcí.

Podívejte se na verze modelu, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu nasazení GPT-4.

Poznámka:

gpt-4 Verze 0314 a gpt-4-32k bude vyřazena dříve než 5. července 2024. gpt-4 Verze 0613 a gpt-4-32k bude vyřazena dříve než 30. září 2024. Podívejte se na aktualizace modelů pro chování při upgradu modelu.

GPT-4 verze 0125-preview je aktualizovaná verze GPT-4 Turbo Preview, která byla dříve vydána jako verze 1106-preview. GPT-4 verze 0125-preview dokončí úlohy, jako je generování kódu, v porovnání s gpt-4-1106-preview. Z tohoto důvodu můžou zákazníci v závislosti na úloze zjistit, že GPT-4-0125-preview generuje ve srovnání s gpt-4-1106-preview další výstup. Doporučujeme zákazníkům porovnat výstupy nového modelu. GPT-4-0125-preview také řeší chyby v gpt-4-1106-preview se zpracováním UTF-8 pro neanglické jazyky.

Důležité

  • gpt-4 verze 1106-Preview a 0125-Preview budou upgradovány se stabilní verzí gpt-4 v budoucnu. Upgrade nasazení verze gpt-4 1106-Preview na gpt-4 verzi 0125-Preview naplánovaný na 8. března 2024 už neprobíhá. gpt-4 Po vydání stabilní verze se nasazení verze 1106-Preview a 0125-Preview nastaví na "Automatické aktualizace na výchozí" a po vypršení platnosti se upgrade spustí. Pro každé nasazení probíhá upgrade verze modelu bez přerušení služby pro volání rozhraní API. Upgrady jsou fázované podle oblasti a očekává se, že celý proces upgradu bude trvat 2 týdny. gpt-4 Nasazení verzí 1106-Preview a 0125-Preview nastavená na Možnost Bez automatického upgradu se neupgraduje a při upgradu verze Preview v dané oblasti přestane fungovat.
ID modelu Max Request (tokeny) Trénovací data (až do)
gpt-4 (0314) 8,192 Zář 2021
gpt-4-32k(0314) 32,768 Zář 2021
gpt-4 (0613) 8,192 Zář 2021
gpt-4-32k (0613) 32,768 Zář 2021
gpt-4 (1106-Preview)1
GPT-4 Turbo Preview
Vstup: 128 000
Výstup: 4 096
Duben 2023
gpt-4 (0125-Preview)1
GPT-4 Turbo Preview
Vstup: 128 000
Výstup: 4 096
Prosinec 2023
gpt-4 (vision-preview)2
GPT-4 Turbo s vision Preview
Vstup: 128 000
Výstup: 4 096
Duben 2023

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) nebo gpt-4 (1106-Preview). Pokud chcete tento model nasadit, vyberte v části Nasazení model gpt-4. V části Verze vyberte (0125-Preview) nebo (1106-Preview).

2 GPT-4 Turbo s vision Preview = gpt-4 (vision-preview). Pokud chcete tento model nasadit, vyberte v části Nasazení model gpt-4. V případě verze modelu vyberte vision-preview.

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview a stabilní verzi. Modely označené ve verzi Preview nedodržují standardní životní cyklus modelu Azure OpenAI.

Poznámka:

Oblasti, kde jsou uvedené oblasti GPT-4 (0314) a (0613), mají přístup k 8K i 32K verzím modelu.

Dostupnost modelu GPT-4 a GPT-4 Turbo Preview

Oblasti veřejného cloudu

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613
australiaeast -
canadaeast - -
eastus - - - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - - -
Norsko – východ - - - -
Střed USA – jih - - - -
southindia - - - -
swedencentral -
switzerlandnorth - -
uksouth - - - -
westus - - -

Výběr přístupu zákazníka

Kromě výše uvedených oblastí, které jsou dostupné všem zákazníkům Azure OpenAI, byly některým vybraným stávajícím zákazníkům udělen přístup k verzím GPT-4 v dalších oblastech:

Model Oblast
gpt-4 (0314) USA – východ
Francie – střed
USA – středojižní
Velká Británie – jih
gpt-4 (0613) USA – východ
USA – východ 2
Japonsko – východ
Velká Británie – jih

Oblasti Azure Government

Azure Government nabízí následující modely GPT-4:

ID modelu Dostupnost modelu
gpt-4 (1106-Preview) US Gov – Virginie
US Gov – Arizona

Modely GPT-3.5

Důležité

gpt-35-turbo (0125) Nový model má různá vylepšení, včetně vyšší přesnosti při odpovídání v požadovaných formátech a opravy chyby, která způsobovala problém s kódováním textu pro volání funkcí jiného jazyka než v angličtině.

GPT-3.5 Turbo se používá s rozhraním API Chat Completion. GPT-3.5 Turbo verze 0301 lze také použít s rozhraním API pro dokončování. GPT-3.5 Turbo verze 0613 a 1106 podporují pouze rozhraní API pro dokončování chatu.

GPT-3.5 Turbo verze 0301 je první verze vydaného modelu. Verze 0613 je druhá verze modelu a přidává podporu volání funkcí.

Podívejte se na verze modelů, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu vašich nasazení GPT-3.5 Turbo.

Poznámka:

gpt-35-turbo Verze 0613 a gpt-35-turbo-16k bude vyřazena dříve než 13. července 2024. gpt-35-turbo Verze 0301 bude vyřazena dříve než 13. června 2024. Podívejte se na aktualizace modelů pro chování při upgradu modelu.

ID modelu Max Request (tokeny) Trénovací data (až do)
gpt-35-turbo1 (0301) 4,096 Zář 2021
gpt-35-turbo (0613) 4,096 Zář 2021
gpt-35-turbo-16k (0613) 16,384 Zář 2021
gpt-35-turbo-instruct (0914) 4,097 Zář 2021
gpt-35-turbo (1106) Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo (0125) NOVÝ 16,385 Zář 2021

Dostupnost modelu GPT-3.5-Turbo

Oblasti veřejného cloudu

Region gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
Střed USA – jih - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 Tento model přijme požadavky > 4 096 tokenů. Nedoporučuje se překročit limit vstupního tokenu 4 096, protože novější verze modelu je omezena na 4 096 tokenů. Pokud při překročení 4 096 vstupních tokenů s tímto modelem narazíte na problémy, tato konfigurace se oficiálně nepodporuje.

Oblasti Azure Government

Azure Government nabízí následující modely GPT-3.5 turbo:

ID modelu Dostupnost modelu
gpt-35-turbo (1106-Preview) US Gov – Virginie

Vložené modely

Tyto modely lze použít pouze s požadavky rozhraní API pro vložení.

Poznámka:

text-embedding-3-large je nejnovější a nejschopnější model vkládání. Upgrade mezi vloženým modelem není možný. Aby bylo možné migrovat z používání text-embedding-ada-002 na text-embedding-3-large , budete muset vygenerovat nové vkládání.

ID modelu Max Request (tokeny) Výstupní dimenze Trénovací data (up-to)
text-embedding-ada-002 (verze 2) 8,191 1 536 Zář 2021
text-embedding-ada-002 (verze 1) 2,046 1 536 Zář 2021
text-embedding-3-large 8,191 3 072 Zář 2021
text-embedding-3-small 8,191 1 536 Zář 2021

Poznámka:

Při odesílání pole vstupů pro vložení je maximální počet vstupních položek v poli na volání koncového bodu vkládání 2048.

Oblasti veřejného cloudu

Region text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
Norsko – východ - - -
Jižní Afrika – sever - - -
Střed USA – jih - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Oblasti Azure Government

Azure Government nabízí následující modely vkládání:

ID modelu Dostupnost modelu
text-embedding-ada-002 (verze 2) US Gov – Virginie
US Gov – Arizona

Modely DALL-E

ID modelu Dostupnost funkcí Maximální počet požadavků (znaků)
dalle2 (Preview) USA – východ 1000
dall-e-3 USA – východ, Austrálie – východ, Švédsko – střed 4 000

Jemně dolaďovací modely

babbage-002 a davinci-002 nejsou vytrénovány tak, aby dodržovaly pokyny. Dotazování na tyto základní modely by mělo být provedeno pouze jako odkaz na jemně vyladěnou verzi, aby bylo možné vyhodnotit průběh trénování.

gpt-35-turbo-0613 – vyladění tohoto modelu je omezené na podmnožinu oblastí a není k dispozici v každé oblasti, ve které je základní model k dispozici.

ID modelu Vyladění oblastí Max Request (tokeny) Trénovací data (až do)
babbage-002 USA – středosever
Švédsko – střed
16,384 Zář 2021
davinci-002 USA – středosever
Švédsko – střed
16,384 Zář 2021
gpt-35-turbo (0613) USA – východ 2
USA – středosever
Švédsko – střed
4,096 Zář 2021
gpt-35-turbo (1106) USA – východ 2
USA – středosever
Švédsko – střed
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo (0125) USA – východ 2
USA – středosever
Švédsko – střed
16,385 Zář 2021

Šeptající modely

ID modelu Dostupnost modelu Maximální počet požadavků (velikost zvukového souboru)
whisper USA – východ 2
USA – středosever
Norsko – východ
Indie – jih
Švédsko – střed
Západní Evropa
25 MB

Převod textu na řečové modely (Preview)

ID modelu Dostupnost modelu
tts-1 USA – středosever
Švédsko – střed
tts-1-hd USA – středosever
Švédsko – střed

Asistenti (Preview)

Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK, Azure AI Studiu a Azure OpenAI Studiu. Následující tabulka je určená pro průběžné platby. Informace o dostupnosti zřízené jednotky propustnosti (PTU) najdete v tématu Zřízená propustnost.

Oblast gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Austrálie – východ
East US
USA – východ 2
Francie – střed
Norsko – východ
Švédsko – střed
Velká Británie – jih

Další kroky