Modely Azure OpenAI Service
Služba Azure OpenAI Service využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelů se liší podle oblasti. Informace o vyřazení GPT-3 a dalších modelů v červenci 2024 najdete v tématu Starší modely Azure OpenAI Service.
Modely | Popis |
---|---|
GPT-4 Turbo 🆕 | Nejnovější modely Azure OpenAI s vícemodálními verzemi, které můžou jako vstup přijímat text i obrázky. |
GPT-4 | Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód. |
GPT-3.5 | Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód. |
Vkládání | Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu. |
DALL-E | Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka. |
Šepot | Řada modelů ve verzi Preview, která dokáže přepisovat a překládat řeč na text. |
Převod textu na řeč (Preview) | Řada modelů ve verzi Preview, která dokáže syntetizovat text na řeč. |
GPT-4 Turbo
GPT-4 Turbo je velký multimodální model (přijímá textové nebo obrazové vstupy a generuje text), který dokáže řešit obtížné problémy s větší přesností než kterýkoli z předchozích modelů OpenAI. Stejně jako GPT-3.5 Turbo a starší modely GPT-4 GPT-4 Turbo jsou optimalizované pro chat a fungují dobře pro tradiční úkoly dokončení.
Nejnovější verze GA GPT-4 Turbo je:
gpt-4
Verze:turbo-2024-04-09
Toto je náhrada následujících modelů Preview:
gpt-4
Verze:1106-Preview
gpt-4
Verze:0125-Preview
gpt-4
Verze:vision-preview
Rozdíly mezi modely OpenAI a Azure OpenAI GPT-4 Turbo GA
- Verze nejnovějšího
0409
modelu Turbo OpenAI podporuje režim JSON a volání funkcí pro všechny žádosti o odvozování. - Verze nejnovější
turbo-2024-04-09
verze Azure OpenAI v současné době nepodporuje použití režimu JSON a volání funkcí při odvozování požadavků na odvozování pomocí vstupu obrázku (vision). Textové vstupní požadavky (požadavky bezimage_url
a vložené obrázky) podporují režim JSON a volání funkcí.
Rozdíly od gpt-4 vision-preview
- Integrace vylepšení zpracování obrazu specifická pro
gpt-4
Azure AI s GPT-4 Turbo s vision se pro verzi nepodporuje:turbo-2024-04-09
Patří sem optické rozpoznávání znaků (OCR), uzemnění objektů, výzvy k videu a vylepšené zpracování dat pomocí obrázků.
Spravovaná dostupnost zřízená pomocí GPT-4 Turbo
gpt-4
Verze:turbo-2024-04-09
je k dispozici pro standardní i zřízená nasazení. V současné době zřízená verze tohoto modelu nepodporuje požadavky na odvozování obrázků a obrazu. Zřízená nasazení tohoto modelu přijímají pouze textové zadání. Nasazení standardního modelu přijímají požadavky na odvozování textu i obrazu a obrazu.
Regionální dostupnost
Informace o regionální dostupnosti modelu najdete v matici modelu pro standardní a zřízená nasazení.
Nasazení GPT-4 Turbo s ga vision
Pokud chcete nasadit model GA z uživatelského rozhraní sady Studio, vyberte GPT-4
a pak v rozevírací nabídce zvolte turbo-2024-04-09
verzi. Výchozí kvóta modelu gpt-4-turbo-2024-04-09
bude stejná jako aktuální kvóta pro GPT-4-Turbo. Podívejte se na limity kvót v jednotlivých oblastech.
GPT-4
GPT-4 je předchůdcem GPT-4 Turbo. Modely GPT-4 a GPT-4 Turbo mají základní název gpt-4
modelu . Modely GPT-4 a Turbo můžete rozlišit prozkoumáním verze modelu.
gpt-4
Verze0314
gpt-4
Verze0613
gpt-4-32k
Verze0613
V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.
Modely GPT-4 a GPT-4 Turbo
- Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.
Podívejte se na verze modelu, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu nasazení GPT-4.
ID modelu | Max Request (tokeny) | Trénovací data (až do) |
---|---|---|
gpt-4 (0314) |
8,192 | Zář 2021 |
gpt-4-32k (0314) |
32,768 | Zář 2021 |
gpt-4 (0613) |
8,192 | Zář 2021 |
gpt-4-32k (0613) |
32,768 | Zář 2021 |
gpt-4 (1106-Preview)1GPT-4 Turbo Preview |
Vstup: 128 000 Výstup: 4 096 |
Duben 2023 |
gpt-4 (0125-Preview)1GPT-4 Turbo Preview |
Vstup: 128 000 Výstup: 4 096 |
Prosinec 2023 |
gpt-4 (vision-preview)2GPT-4 Turbo s vision Preview |
Vstup: 128 000 Výstup: 4 096 |
Duben 2023 |
gpt-4 (turbo-2024-04-09) 🆕 GPT-4 Turbo s ga vision |
Vstup: 128 000 Výstup: 4 096 |
Prosinec 2023 |
1 GPT-4 Turbo Preview = gpt-4
(0125-Preview) nebo gpt-4
(1106-Preview). Pokud chcete tento model nasadit, vyberte v části Nasazení model gpt-4. V části Verze vyberte (0125-Preview) nebo (1106-Preview).
2 GPT-4 Turbo s vision Preview = gpt-4
(vision-preview). Pokud chcete tento model nasadit, vyberte v části Nasazení model gpt-4. V případě verze modelu vyberte vision-preview.
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview a stabilní verzi. Modely označené ve verzi Preview nedodržují standardní životní cyklus modelu Azure OpenAI.
Poznámka:
gpt-4
Verze 0314
a gpt-4-32k
bude vyřazena dříve než 5. července 2024. gpt-4
Verze 0613
a gpt-4-32k
bude vyřazena dříve než 30. září 2024. Podívejte se na aktualizace modelů pro chování při upgradu modelu.
- GPT-4 verze 0125-preview je aktualizovaná verze GPT-4 Turbo Preview, která byla dříve vydána jako verze 1106-preview.
- GPT-4 verze 0125-preview dokončí úlohy, jako je generování kódu, v porovnání s gpt-4-1106-preview. Z tohoto důvodu můžou zákazníci v závislosti na úloze zjistit, že GPT-4-0125-preview generuje ve srovnání s gpt-4-1106-preview další výstup. Doporučujeme zákazníkům porovnat výstupy nového modelu. GPT-4-0125-preview také řeší chyby v gpt-4-1106-preview se zpracováním UTF-8 pro neanglické jazyky. GPT-4 verze
turbo-2024-04-09
je nejnovější verze GA a nahrazuje0125-Preview
,1106-preview
avision-preview
.
Důležité
gpt-4
verze 1106-Preview a 0125-Preview budou upgradovány se stabilní verzígpt-4
v budoucnu.gpt-4
Po vydání stabilní verze se nasazení verze 1106-Preview a 0125-Preview nastaví na "Automatické aktualizace na výchozí" a po vypršení platnosti se upgrade spustí. Pro každé nasazení probíhá upgrade verze modelu bez přerušení služby pro volání rozhraní API. Upgrady jsou fázované podle oblasti a očekává se, že celý proces upgradu bude trvat 2 týdny.gpt-4
Nasazení verzí 1106-Preview a 0125-Preview nastavená na Možnost Bez automatického upgradu se neupgraduje a při upgradu verze Preview v dané oblasti přestane fungovat. Další informace o načasování upgradu najdete v části Vyřazení a vyřazení modelu Azure OpenAI.
GPT-3.5
Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře i pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné možnosti jako text-davinci-003
použití rozhraní API pro dokončování místo rozhraní API pro dokončování chatu. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Pokyny pro starší modely GPT-3.5 a GPT-3.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.
Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našich podrobných návodech.
Vkládání
text-embedding-3-large
je nejnovější a nejschopnější model vkládání. Upgrade mezi modely vkládání není možný. Aby bylo možné přejít z použití text-embedding-ada-002
na text-embedding-3-large
, budete muset vygenerovat nové vkládání.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Při testování nabízí OpenAI sestavy velkých i malých modelů vkládání třetí generace lepší průměrný výkon načítání ve více jazycích pomocí srovnávacího testu MIRACL a přitom stále zachovává výkon pro anglické úlohy s srovnávacím testem MTEB .
Srovnávací test vyhodnocení | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Průměr MIRACL | 31.4 | 44.0 | 54.9 |
Průměr MTEB | 61.0 | 62.3 | 64.6 |
Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions
parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions
není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade
Srovnávací testy MTEB OpenAI zjistily, že i když jsou dimenze modelu třetí generace sníženy na méně než text-embeddings-ada-002
1 536 dimenzí, zůstává mírně lepší.
DALL-E
Modely DALL-E generují obrázky z textových výzev, které uživatel poskytuje. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.
Šepot
Modely Šeptání lze použít pro převod řeči na text.
Model Whisper můžete použít také prostřednictvím rozhraní API pro dávkové přepisy služby Azure AI Speech. Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.
Převod textu na řeč (Preview)
Text OpenAI na řečové modely, které jsou aktuálně ve verzi Preview, je možné použít k syntetizaci textu na řeč.
Text OpenAI můžete také použít k hlasovým hlasovým hovorům přes Azure AI Speech. Další informace najdete v tématu OpenAI text na hlasové hlasy prostřednictvím služby Azure OpenAI nebo průvodce službou Azure AI Speech .
Souhrnná tabulka modelů a dostupnost oblastí
Poznámka:
Tento článek se primárně zabývá dostupností modelů a oblastí, která platí pro všechny zákazníky Azure OpenAI s typy nasazení standardu. Někteří výběroví zákazníci mají přístup k kombinacím modelů a oblastí, které nejsou uvedené v následující sjednocené tabulce. Další informace o zřízených nasazeních najdete v našich doprovodných materiálech ke zřízení.
Dostupnost modelu nasazení úrovně Standard
Oblast | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | babbage-002, 1 | dall-e-3, 3.0 | davinci-002, 1 | tts, 001 | tts-hd, 001 | šeptání, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
Norsko – východ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
Jižní Afrika – sever | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Střed USA – jih | - | - | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Tato tabulka neobsahuje vyladění regionální dostupnosti. Informace najdete v části věnované podrobnému ladění.
Standardní kvóta modelu nasazení
Výchozí kvóta pro modely se liší podle modelu a oblasti. Výchozí limity kvót se můžou změnit.
Kvóta pro standardní nasazení je popsaná z hlediska tokenů za minutu (TPM).
Oblast | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - jemné ladění | Davinci-002 | Davinci-002 - jemné ladění | GPT-35-Turbo - jemné ladění | GPT-35-Turbo-1106 - jemné ladění | GPT-35-Turbo-0125 - jemné ladění |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | 250 K |
francecentral | 20 tis. | 60 K | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
Norsko – východ | - | - | 150 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
Jižní Afrika – sever | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
Střed USA – jih | - | - | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
swedencentral | 40 K | 80 K | 150 K | 30 K | 300 K | 240 K | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
switzerlandnorth | 40 K | 80 K | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K |
uksouth | - | - | 80 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
1 K = 1000 tokenů za minutu (TPM). Vztah mezi čipem TPM a žádostmi za minutu (RPM) je aktuálně definován jako 6 RPM na 1000 TPM.
Dostupnost zřízeného modelu nasazení
Oblast | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | - | - | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - | ✅ |
Německo – středozápad | ✅ | ✅ | ✅ | - | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | - | - | - | ✅ |
koreacentral | ✅ | - | - | - | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
Norsko – východ | ✅ | - | ✅ | - | ✅ | - | - |
polskocentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
Jižní Afrika – sever | ✅ | ✅ | - | - | ✅ | ✅ | - |
Střed USA – jih | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
switzerlandwest | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Poznámka:
Zřízená verze gpt-4
:turbo-2024-04-09
v současné době je omezena pouze na text.
Návody získat přístup ke zřízení?
Abyste získali zřízenou propustnost, musíte mluvit se svým prodejním týmem Nebo týmem účtů Microsoftu. Pokud nemáte prodejní nebo obchodní tým, bohužel v tuto chvíli nemůžete zakoupit zřízenou propustnost.
Další informace o zřízených nasazeních najdete v našich doprovodných materiálech ke zřízení.
Dostupnost modelu GPT-4 a GPT-4 Turbo
Oblasti veřejného cloudu
Oblast | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | ✅ |
eastus | - | - | ✅ | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - |
northcentralus | - | - | ✅ | - | - | - |
Norsko – východ | - | ✅ | - | - | - | - |
Střed USA – jih | - | - | ✅ | - | - | - |
southindia | - | ✅ | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - |
westus | - | ✅ | - | ✅ | - | - |
westus3 | - | ✅ | - | - | - | - |
Výběr přístupu zákazníka
Kromě výše uvedených oblastí, které jsou dostupné všem zákazníkům Azure OpenAI, byly některým vybraným stávajícím zákazníkům udělen přístup k verzím GPT-4 v dalších oblastech:
Model | Oblast |
---|---|
gpt-4 (0314) |
USA – východ Francie – střed USA – středojižní Velká Británie – jih |
gpt-4 (0613) |
USA – východ USA – východ 2 Japonsko – východ Velká Británie – jih |
Oblasti Azure Government
Azure Government nabízí následující modely GPT-4:
ID modelu | Dostupnost modelu |
---|---|
gpt-4 (1106-Preview) |
US Gov – Virginie US Gov – Arizona |
Modely GPT-3.5
Důležité
gpt-35-turbo (0125)
Nový model má různá vylepšení, včetně vyšší přesnosti při odpovídání v požadovaných formátech a opravy chyby, která způsobovala problém s kódováním textu pro volání funkcí jiného jazyka než v angličtině.
GPT-3.5 Turbo se používá s rozhraním API Chat Completion. GPT-3.5 Turbo verze 0301 lze také použít s rozhraním API pro dokončování, i když se to nedoporučuje. GPT-3.5 Turbo verze 0613 a 1106 podporují pouze rozhraní API pro dokončování chatu.
GPT-3.5 Turbo verze 0301 je první verze vydaného modelu. Verze 0613 je druhá verze modelu a přidává podporu volání funkcí.
Podívejte se na verze modelů, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu vašich nasazení GPT-3.5 Turbo.
Poznámka:
gpt-35-turbo
Verze 0613
a gpt-35-turbo-16k
bude vyřazena dříve než 1. srpna 2024. gpt-35-turbo
Verze 0301
bude vyřazena před 1. srpnem 2024. Podívejte se na aktualizace modelů pro chování při upgradu modelu.
ID modelu | Max Request (tokeny) | Trénovací data (až do) |
---|---|---|
gpt-35-turbo 1 (0301) |
4,096 | Zář 2021 |
gpt-35-turbo (0613) |
4,096 | Zář 2021 |
gpt-35-turbo-16k (0613) |
16,384 | Zář 2021 |
gpt-35-turbo-instruct (0914) |
4,097 | Zář 2021 |
gpt-35-turbo (1106) |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo (0125) NOVÝ |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
Dostupnost modelu GPT-3.5-Turbo
Oblasti veřejného cloudu
Oblast | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
Střed USA – jih | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Tento model přijme požadavky > 4 096 tokenů. Nedoporučuje se překročit limit vstupního tokenu 4 096, protože novější verze modelu je omezena na 4 096 tokenů. Pokud při překročení 4 096 vstupních tokenů s tímto modelem narazíte na problémy, tato konfigurace se oficiálně nepodporuje.
Oblasti Azure Government
Azure Government nabízí následující modely GPT-3.5 turbo:
ID modelu | Dostupnost modelu |
---|---|
gpt-35-turbo (1106-Preview) |
US Gov – Virginie |
Vložené modely
Tyto modely lze použít pouze s požadavky rozhraní API pro vložení.
Poznámka:
text-embedding-3-large
je nejnovější a nejschopnější model vkládání. Upgrade mezi vloženým modelem není možný. Aby bylo možné migrovat z používání text-embedding-ada-002
na text-embedding-3-large
, budete muset vygenerovat nové vkládání.
ID modelu | Max Request (tokeny) | Výstupní dimenze | Trénovací data (up-to) |
---|---|---|---|
text-embedding-ada-002 (verze 2) |
8,191 | 1 536 | Zář 2021 |
text-embedding-ada-002 (verze 1) |
2,046 | 1 536 | Zář 2021 |
text-embedding-3-large |
8,191 | 3 072 | Zář 2021 |
text-embedding-3-small |
8,191 | 1 536 | Zář 2021 |
Poznámka:
Při odesílání pole vstupů pro vložení je maximální počet vstupních položek v poli na volání koncového bodu vkládání 2048.
Oblasti veřejného cloudu
Oblast | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
Norsko – východ | - | ✅ | - | - |
Jižní Afrika – sever | - | ✅ | - | - |
Střed USA – jih | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
swedencentral | - | ✅ | - | - |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Oblasti Azure Government
Azure Government nabízí následující modely vkládání:
ID modelu | Dostupnost modelu |
---|---|
text-embedding-ada-002 (verze 2) |
US Gov – Virginie US Gov – Arizona |
Modely DALL-E
ID modelu | Dostupnost funkcí | Maximální počet požadavků (znaků) |
---|---|---|
dalle2 (Preview) | USA – východ | 1000 |
dall-e-3 | USA – východ, Austrálie – východ, Švédsko – střed | 4 000 |
Jemně dolaďovací modely
babbage-002
a davinci-002
nejsou vytrénovány tak, aby dodržovaly pokyny. Dotazování na tyto základní modely by mělo být provedeno pouze jako odkaz na jemně vyladěnou verzi, aby bylo možné vyhodnotit průběh trénování.
gpt-35-turbo
– vyladění tohoto modelu je omezené na podmnožinu oblastí a není k dispozici v každé oblasti, ve které je základní model k dispozici.
ID modelu | Vyladění oblastí | Max Request (tokeny) | Trénovací data (až do) |
---|---|---|---|
babbage-002 |
USA – středosever Švédsko – střed Švýcarsko – západ |
16,384 | Zář 2021 |
davinci-002 |
USA – středosever Švédsko – střed Švýcarsko – západ |
16,384 | Zář 2021 |
gpt-35-turbo (0613) |
USA – východ 2 USA – středosever Švédsko – střed Švýcarsko – západ |
4,096 | Zář 2021 |
gpt-35-turbo (1106) |
USA – východ 2 USA – středosever Švédsko – střed Švýcarsko – západ |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo (0125) |
USA – východ 2 USA – středosever Švédsko – střed Švýcarsko – západ |
16,385 | Zář 2021 |
Šeptající modely
ID modelu | Dostupnost modelu | Maximální počet požadavků (velikost zvukového souboru) |
---|---|---|
whisper |
USA – východ 2 USA – středosever Norsko – východ Indie – jih Švédsko – střed Západní Evropa |
25 MB |
Převod textu na řečové modely (Preview)
ID modelu | Dostupnost modelu |
---|---|
tts-1 |
USA – středosever Švédsko – střed |
tts-1-hd |
USA – středosever Švédsko – střed |
Asistenti (Preview)
Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK, Azure AI Studiu a Azure OpenAI Studiu. Následující tabulka je určená pro průběžné platby. Informace o dostupnosti zřízené jednotky propustnosti (PTU) najdete v tématu Zřízená propustnost.
Oblast | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Austrálie – východ | ✅ | ✅ | ✅ | ✅ | |
East US | ✅ | ✅ | |||
USA – východ 2 | ✅ | ✅ | ✅ | ||
Francie – střed | ✅ | ✅ | ✅ | ✅ | |
Norsko – východ | ✅ | ||||
Švédsko – střed | ✅ | ✅ | ✅ | ✅ | |
Velká Británie – jih | ✅ | ✅ | ✅ | ✅ |