Modele usługi Azure OpenAI Service

Artykuł
04/07/2024

Usługa Azure OpenAI Service jest obsługiwana przez zróżnicowany zestaw modeli z różnymi możliwościami i cenami. Dostępność różni się w zależności od regionu W przypadku modeli GPT-3 i innych wycofanych w lipcu 2024 r. zobacz Starsze modele usługi Azure OpenAI Service.

Modele	opis
GPT-4	Zestaw modeli ulepszających język GPT-3.5 i może zrozumieć i wygenerować język naturalny oraz kod.
GPT-3.5	Zestaw modeli, które ulepszają język GPT-3 i mogą zrozumieć i wygenerować język naturalny oraz kod.
Osadzanie	Zestaw modeli, które mogą konwertować tekst na postać wektorów liczbowych, aby ułatwić podobieństwo tekstu.
DALL-E	Seria modeli, które mogą generować oryginalne obrazy na podstawie języka naturalnego.
Szept	Seria modeli w wersji zapoznawczej, które mogą transkrybować i tłumaczyć mowę na tekst.
Zamiana tekstu na mowę (wersja zapoznawcza)	Seria modeli w wersji zapoznawczej, która może syntetyzować tekst na mowę.

GPT-4 i GPT-4 Turbo (wersja zapoznawcza)

GPT-4 to duży model wielomodalny (akceptowanie danych wejściowych tekstu lub obrazów i generowanie tekstu), który może rozwiązywać trudne problemy z większą dokładnością niż którykolwiek z poprzednich modeli openAI. Podobnie jak GPT-3.5 Turbo, GPT-4 jest zoptymalizowany pod kątem czatu i działa dobrze w przypadku tradycyjnych zadań wykonywanych. Użyj interfejsu API uzupełniania czatów, aby użyć biblioteki GPT-4. Aby dowiedzieć się więcej na temat interakcji z biblioteką GPT-4 i interfejsem API uzupełniania czatów, zapoznaj się z naszymi szczegółowymi instrukcjami.

GPT-4 Turbo with Vision to wersja GPT-4, która akceptuje dane wejściowe obrazu. Jest on dostępny jako vision-preview model .gpt-4

gpt-4
gpt-4-32k

Długość kontekstu tokenu obsługiwana przez poszczególne modele można zobaczyć w tabeli podsumowania modelu.

GPT-3.5

Modele GPT-3.5 mogą zrozumieć i wygenerować język naturalny lub kod. Najbardziej zdolny i ekonomiczny model w rodzinie GPT-3.5 to GPT-3.5 Turbo, który został zoptymalizowany pod kątem czatu i działa dobrze w przypadku tradycyjnych zadań wykonywanych, jak również. GPT-3.5 Turbo jest dostępny do użycia z interfejsem API uzupełniania czatów. GPT-3.5 Turbo Poinstruowanie ma podobne możliwości korzystania text-davinci-003 z interfejsu API uzupełniania zamiast interfejsu API uzupełniania czatów. Zalecamy używanie GPT-3.5 Turbo i GPT-3.5 Turbo Poinstruuj w starszych modelach GPT-3.5 i GPT-3.

gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct

Długość kontekstu tokenu obsługiwana przez poszczególne modele można zobaczyć w tabeli podsumowania modelu.

Aby dowiedzieć się więcej na temat interakcji z GPT-3.5 Turbo i interfejsem API uzupełniania czatów, zapoznaj się z naszymi szczegółowymi instrukcjami.

Osadzanie

text-embedding-3-large jest najnowszym i najbardziej zdolnym modelem osadzania. Uaktualnianie między modelami osadzania nie jest możliwe. Aby przejść z użycia text-embedding-ada-002 do text-embedding-3-large , należy wygenerować nowe osadzanie.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Podczas testowania raporty OpenAI zarówno duże, jak i małe modele osadzania trzeciej generacji oferują lepszą średnią wydajność pobierania w wielu językach z testem porównawczym MIRACL , jednocześnie zachowując wydajność zadań angielskich z testem porównawczym MTEB .

Test porównawczy oceny	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Średnia MIRACL	31.4	44.0	54.9
Średnia MTEB	61,0	62.3	64.6

Modele osadzania trzeciej generacji obsługują zmniejszenie rozmiaru osadzania za pomocą nowego dimensions parametru. Zazwyczaj większe osadzanie jest droższe z perspektywy zasobów obliczeniowych, pamięci i magazynu. Możliwość dostosowania liczby wymiarów umożliwia większą kontrolę nad ogólnym kosztem i wydajnością. Parametr dimensions nie jest obsługiwany we wszystkich wersjach biblioteki języka Python OpenAI 1.x, aby skorzystać z tego parametru, zalecamy uaktualnienie do najnowszej wersji: pip install openai --upgrade.

Testy porównawcze MTEB openAI wykazały, że nawet wtedy, gdy wymiary modelu trzeciej generacji są zmniejszone do mniej niż text-embeddings-ada-002 1536 wymiarów, pozostają nieco lepsze.

DALL-E

Modele DALL-E generują obrazy na podstawie monitów tekstowych wyświetlanych przez użytkownika. Język DALL-E 3 jest ogólnie dostępny do użycia z interfejsami API REST. Zestawy DALL-E 2 i DALL-E 3 z zestawami SDK klienta są w wersji zapoznawczej.

Szept

Modele Szeptu mogą służyć do zamiany mowy na tekst.

Możesz również użyć modelu Whisper za pośrednictwem interfejsu API transkrypcji wsadowej usługi Azure AI Speech. Zapoznaj się z tematem Co to jest model Szeptu? aby dowiedzieć się więcej o tym, kiedy używać usługi Azure AI Speech a Azure OpenAI Service.

Zamiana tekstu na mowę (wersja zapoznawcza)

Tekst OpenAI do modeli mowy, obecnie w wersji zapoznawczej, może służyć do syntezowania tekstu na mowę.

Możesz również użyć tekstu OpenAI do mowy głosów za pośrednictwem usługi Azure AI Speech. Aby dowiedzieć się więcej, zobacz OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide (Przewodnik po zamianie mowy za pośrednictwem usługi Azure OpenAI Lub Azure AI Speech ).

Tabela podsumowania modelu i dostępność regionów

Uwaga

W tym artykule opisano tylko dostępność modelu/regionu, która ma zastosowanie do wszystkich klientów usługi Azure OpenAI z typami wdrożenia w warstwie Standardowa. Niektórzy klienci mają dostęp do kombinacji modelu/regionu, które nie są wymienione w poniższej ujednoliconej tabeli. Te tabele nie mają również zastosowania do klientów korzystających tylko z aprowizowania typów wdrożeń, które mają własną unikatową macierz dostępności modelu/regionu. Aby uzyskać więcej informacji na temat aprowizowania wdrożeń, zapoznaj się z naszymi wskazówkami dotyczącymi aprowizowania.

Dostępność modelu wdrażania w warstwie Standardowa

`Region`	`gpt-4`, `0613`	`gpt-4`, `1106-Preview`	`gpt-4`, `0125-Preview`	`gpt-4`, `vision-preview`	`gpt-4-32k`, `0613`	`gpt-35-turbo`, `0301`	`gpt-35-turbo`, `0613`	`gpt-35-turbo`, `1106`	`gpt-35-turbo`, `0125`	`gpt-35-turbo-16k`, `0613`	`gpt-35-turbo-instruct`, `0914`	`text-embedding-ada-002`, `1`	`text-embedding-ada-002`, `2`	`text-embedding-3-small`, `1`	`text-embedding-3-large`, `1`	`babbage-002`, `1`	`dall-e-3`, `3.0`	`davinci-002`, `1`	`tts`, `001`	`tts-hd`, `001`	`whisper`, `001`
australiaeast	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	-	✅	-	-	-	✅	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
canadaeast	✅	✅	-	-	✅	-	✅	✅	✅	✅	-	-	✅	✅	✅	-	-	-	-	-	-
eastus	-	-	✅	-	-	✅	✅	-	-	✅	✅	✅	✅	✅	✅	-	✅	-	-	-	-
eastus2	-	✅	-	-	-	-	✅	-	-	✅	-	-	✅	✅	✅	-	-	-	-	-	✅
francecentral	✅	✅	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
japaneast	-	-	-	✅	-	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
northcentralus	-	-	✅	-	-	-	✅	-	✅	✅	-	-	✅	-	-	✅	-	✅	✅	✅	✅
norwayeast	-	✅	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-
southcentralus	-	-	✅	-	-	✅	-	-	✅	-	-	✅	✅	-	-	-	-	-	-	-	-
southindia	-	✅	-	-	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	✅
swedencentral	✅	✅	-	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	-	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	-	-	✅	✅	-	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-	-
uksouth	-	✅	-	-	-	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	✅
westus	-	✅	-	✅	-	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	-	-

Standardowy limit przydziału modelu wdrażania

Domyślny limit przydziału dla modeli różni się w zależności od modelu i regionu. Domyślne limity przydziału mogą ulec zmianie.

Limit przydziału dla wdrożeń standardowych jest opisany w zakresie tokenów na minutę (TPM).

Region (Region)	GPT-4	GPT-4-32K	GPT-4-Turbo	GPT-4-Turbo-V	GPT-35-Turbo	GPT-35-Turbo-Poinstruuj	Osadzanie tekstu-Ada-002	osadzanie tekstu — 3 małe	osadzanie tekstu —3 — duże	Babbage-002	Babbage-002 - finetune	Davinci-002	Davinci-002 - finetune	GPT-35-Turbo - dostrajanie	GPT-35-Turbo-1106 - grzywna	GPT-35-Turbo-0125 - grzywna
australiaeast	40 K	80 K	80 K	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-
canadaeast	40 K	80 K	80 K	-	300 K	-	350 K	350 K	350 K	-	-	-	-	-	-	-
eastus	-	-	80 K	-	240 K	240 K	240 K	350 K	350 K	-	-	-	-	-	-	-
eastus2	-	80 K	80 K	-	300 K	-	350 K	350 K	350 K	-	-	-	-	250 K	250 K	250 K
francecentral	20 tys.	60 K	80 K	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
japaneast	-	-	-	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
northcentralus	-	-	80 K	-	300 K	-	350 K	-	-	240 K	250 K	240 K	250 K	250 K	250 K	250 K
norwayeast	-	-	150 K	-	-	-	350 K	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	350 K	-	-	-	-	-	-	-	-	-
southcentralus	-	-	80 K	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
southindia	-	-	150 K	-	300 K	-	350 K	-	-	-	-	-	-	-	-	-
swedencentral	40 K	80 K	150 K	30 K	300 K	240 K	350 K	-	-	240 K	250 K	240 K	250 K	250 K	250 K	250 K
switzerlandnorth	40 K	80 K	-	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-
uksouth	-	-	80 K	-	240 K	-	350 K	-	-	-	-	-	-	-	-	-
westeurope	-	-	-	-	240 K	-	240 K	-	-	-	-	-	-	-	-	-
westus	-	-	80 K	30 K	300 K	-	350 K	-	-	-	-	-	-	-	-	-

1 K = 1000 tokenów na minutę (TPM). Relacja między modułem TPM a żądaniami na minutę (RPM) jest obecnie zdefiniowana jako 6 obr./min na 1000 modułów TPM.

Modele GPT-4 i GPT-4 Turbo Preview

GPT-4, GPT-4-32k i GPT-4 Turbo z usługą Vision są teraz dostępne dla wszystkich klientów usługi Azure OpenAI Service. Dostępność różni się w zależności od regionu. Jeśli GPT-4 nie jest widoczny w Twoim regionie, sprawdź ponownie później.

Te modele mogą być używane tylko z interfejsem API uzupełniania czatów.

GPT-4 w wersji 0314 jest pierwszą wersją wydanego modelu. Wersja 0613 jest drugą wersją modelu i dodaje obsługę wywołań funkcji.

Zobacz wersje modelu, aby dowiedzieć się, jak usługa Azure OpenAI Obsługuje uaktualnienia wersji modelu i współpracuje z modelami , aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu wdrożeń GPT-4.

Uwaga

gpt-4 Wersja 0314 i gpt-4-32k zostanie wycofana nie wcześniej niż 5 lipca 2024 r. gpt-4 Wersja 0613 i gpt-4-32k zostanie wycofana nie wcześniej niż 30 września 2024 r. Zobacz Aktualizacje modelu dotyczące zachowania uaktualniania modelu.

GPT-4 w wersji 0125-preview to zaktualizowana wersja wersji zapoznawczej GPT-4 Turbo wydana wcześniej jako wersja 1106-preview. GPT-4 w wersji 0125-preview wykonuje zadania, takie jak generowanie kodu bardziej całkowicie w porównaniu z gpt-4-1106-preview. W związku z tym, w zależności od zadania, klienci mogą stwierdzić, że GPT-4-0125-preview generuje więcej danych wyjściowych w porównaniu z gpt-4-1106-preview. Zalecamy klientom porównanie danych wyjściowych nowego modelu. GPT-4-0125-preview dotyczy również usterek w gpt-4-1106-preview z obsługą utF-8 dla języków innych niż angielski.

Ważne

gpt-4 Wersje 1106-Preview i 0125-Preview zostaną uaktualnione ze stabilną wersją gpt-4 w przyszłości. Uaktualnienie gpt-4 wdrożenia wersji 1106-Preview do gpt-4 wersji 0125-Preview zaplanowanej na 8 marca 2024 r. nie jest już planowane. gpt-4 Wdrożenia wersji 1106-Preview i 0125-Preview mają wartość "Automatyczna aktualizacja do wartości domyślnej" i "Uaktualnij po wygaśnięciu" rozpocznie się uaktualnianie po wydaniu stabilnej wersji. W przypadku każdego wdrożenia uaktualnienie wersji modelu odbywa się bez przerw w działaniu usługi dla wywołań interfejsu API. Uaktualnienia są etapowane według regionu, a pełny proces uaktualniania powinien potrwać 2 tygodnie. gpt-4 Wdrożenia wersji 1106-Preview i 0125-Preview ustawione na wartość "Brak automatycznego uaktualniania" nie zostaną uaktualnione i przestaną działać po uaktualnieniu wersji zapoznawczej w regionie.

Model ID	Maksymalne żądanie (tokeny)	Dane szkoleniowe (maksymalnie)
`gpt-4` (0314)	8,192	Wrzesień 2021 r.
`gpt-4-32k`(0314)	32,768	Wrzesień 2021 r.
`gpt-4` (0613)	8,192	Wrzesień 2021 r.
`gpt-4-32k` (0613)	32,768	Wrzesień 2021 r.
`gpt-4` (1106-Preview)¹ GPT-4 Turbo (wersja zapoznawcza)	Dane wejściowe: 128 000 Dane wyjściowe: 4096	Kwiecień 2023 r.
`gpt-4` (0125-Preview)¹ GPT-4 Turbo (wersja zapoznawcza)	Dane wejściowe: 128 000 Dane wyjściowe: 4096	Grudzień 2023 r.
`gpt-4` (vision-preview)² GPT-4 Turbo z usługą Vision Preview	Dane wejściowe: 128 000 Dane wyjściowe: 4096	Kwiecień 2023 r.

¹ GPT-4 Turbo Preview = gpt-4 (0125-Preview) lub gpt-4 (1106-Preview). Aby wdrożyć ten model, w obszarze Wdrożenia wybierz model gpt-4. W obszarze version select (0125-Preview) lub (1106-Preview).

² GPT-4 Turbo with Vision Preview = gpt-4 (vision-preview). Aby wdrożyć ten model, w obszarze Wdrożenia wybierz model gpt-4. W obszarze Wersja modelu wybierz pozycję vision-preview.

Uwaga

Nie zalecamy używania modeli w wersji zapoznawczej w środowisku produkcyjnym. Uaktualnimy wszystkie wdrożenia modeli w wersji zapoznawczej do przyszłych wersji zapoznawczych i stabilnej wersji. Modele wyznaczone w wersji zapoznawczej nie są zgodne ze standardowym cyklem życia modelu Usługi Azure OpenAI.

Uwaga

Regiony, w których lista GPT-4 (0314) i (0613) jest dostępna, mają dostęp zarówno do wersji 8K, jak i 32K modelu

Dostępność modelu GPT-4 i GPT-4 Turbo Preview

Regiony chmury publicznej

`Region`	`gpt-4`, `0613`	`gpt-4`, `1106-Preview`	`gpt-4`, `0125-Preview`	`gpt-4`, `vision-preview`	`gpt-4-32k`, `0613`
australiaeast	✅	✅	-	✅	✅
canadaeast	✅	✅	-	-	✅
eastus	-	-	✅	-	-
eastus2	-	✅	-	-	-
francecentral	✅	✅	-	-	✅
japaneast	-	-	-	✅	-
northcentralus	-	-	✅	-	-
norwayeast	-	✅	-	-	-
southcentralus	-	-	✅	-	-
southindia	-	✅	-	-	-
swedencentral	✅	✅	-	✅	✅
switzerlandnorth	✅	-	-	✅	✅
uksouth	-	✅	-	-	-
westus	-	✅	-	✅	-

Wybieranie dostępu klienta

Oprócz powyższych regionów, które są dostępne dla wszystkich klientów usługi Azure OpenAI, niektóre z wybranych wcześniej klientów otrzymały dostęp do wersji GPT-4 w dodatkowych regionach:

Model	Region (Region)
`gpt-4` (0314)	Wschodnie stany USA Francja Środkowa Południowo-środkowe stany USA Południowe Zjednoczone Królestwo
`gpt-4` (0613)	Wschodnie stany USA Wschodnie stany USA 2 Japonia Wschodnia Południowe Zjednoczone Królestwo

Regiony Azure Government

Następujące modele GPT-4 są dostępne w usłudze Azure Government:

Model ID	Dostępność modelu
`gpt-4` (1106-Preview)	US Gov Wirginia US Gov Arizona

Modele GPT-3.5

Ważne

Nowy gpt-35-turbo (0125) model ma różne ulepszenia, w tym większą dokładność reagowania w żądanych formatach i poprawkę dla usterki, która spowodowała problem z kodowaniem tekstu dla wywołań funkcji języka innego niż angielski.

GPT-3.5 Turbo jest używany z interfejsem API uzupełniania czatu. GPT-3.5 Turbo w wersji 0301 można również używać z interfejsem API uzupełniania. GPT-3.5 Turbo w wersji 0613 i 1106 obsługują tylko interfejs API uzupełniania czatów.

GPT-3.5 Turbo w wersji 0301 jest pierwszą wersją wydanego modelu. Wersja 0613 jest drugą wersją modelu i dodaje obsługę wywołań funkcji.

Uwaga

gpt-35-turbo Wersja 0613 i gpt-35-turbo-16k zostanie wycofana nie wcześniej niż 13 lipca 2024 r. gpt-35-turbo Wersja 0301 programu zostanie wycofana nie wcześniej niż 13 czerwca 2024 r. Zobacz Aktualizacje modelu dotyczące zachowania uaktualniania modelu.

Model ID	Maksymalne żądanie (tokeny)	Dane szkoleniowe (maksymalnie)
`gpt-35-turbo`¹ (0301)	4,096	Wrzesień 2021 r.
`gpt-35-turbo` (0613)	4,096	Wrzesień 2021 r.
`gpt-35-turbo-16k` (0613)	16,384	Wrzesień 2021 r.
`gpt-35-turbo-instruct` (0914)	4,097	Wrzesień 2021 r.
`gpt-35-turbo` (1106)	Dane wejściowe: 16 385 Dane wyjściowe: 4096	Wrzesień 2021 r.
`gpt-35-turbo` (0125) NOWY	16,385	Wrzesień 2021 r.

Dostępność modelu GPT-3.5-Turbo

Regiony chmury publicznej

`Region`	`gpt-35-turbo`, `0301`	`gpt-35-turbo`, `0613`	`gpt-35-turbo`, `1106`	`gpt-35-turbo`, `0125`	`gpt-35-turbo-16k`, `0613`	`gpt-35-turbo-instruct`, `0914`
australiaeast	-	✅	✅	-	✅	-
canadaeast	-	✅	✅	✅	✅	-
eastus	✅	✅	-	-	✅	✅
eastus2	-	✅	-	-	✅	-
francecentral	✅	✅	✅	-	✅	-
japaneast	-	✅	-	-	✅	-
northcentralus	-	✅	-	✅	✅	-
southcentralus	✅	-	-	✅	-	-
southindia	-	-	✅	-	-	-
swedencentral	-	✅	✅	-	✅	✅
switzerlandnorth	-	✅	-	-	✅	-
uksouth	✅	✅	✅	-	✅	-
westeurope	✅	-	-	-	-	-
westus	-	-	✅	-	-	-

¹ Ten model będzie akceptować żądania > 4096 tokenów. Nie zaleca się przekraczania limitu tokenu wejściowego 4096, ponieważ nowsza wersja modelu jest ograniczona do 4096 tokenów. Jeśli wystąpią problemy podczas przekraczania 4096 tokenów wejściowych w tym modelu, ta konfiguracja nie jest oficjalnie obsługiwana.

Regiony Azure Government

Następujące modele GPT-3.5 turbo są dostępne w usłudze Azure Government:

Model ID	Dostępność modelu
`gpt-35-turbo` (1106-Preview)	US Gov Wirginia

Osadzanie modeli

Te modele mogą być używane tylko z żądaniami interfejsu API osadzania.

Uwaga

text-embedding-3-large jest najnowszym i najbardziej zdolnym modelem osadzania. Uaktualnianie między modelami osadzania nie jest możliwe. Aby przeprowadzić migrację z funkcji using text-embedding-ada-002 do text-embedding-3-large , należy wygenerować nowe osadzanie.

Model ID	Maksymalne żądanie (tokeny)	Wymiary wyjściowe	Dane szkoleniowe (do)
`text-embedding-ada-002` (wersja 2)	8,191	1536	Wrzesień 2021 r.
`text-embedding-ada-002` (wersja 1)	2,046	1536	Wrzesień 2021 r.
`text-embedding-3-large`	8,191	3072	Wrzesień 2021 r.
`text-embedding-3-small`	8,191	1536	Wrzesień 2021 r.

Uwaga

Podczas wysyłania tablicy danych wejściowych do osadzania maksymalna liczba elementów wejściowych w tablicy na wywołanie punktu końcowego osadzania wynosi 2048.

Regiony chmury publicznej

`Region`	`text-embedding-ada-002`, `1`	`text-embedding-ada-002`, `2`	`text-embedding-3-small`, `1`	`text-embedding-3-large`, `1`
australiaeast	-	✅	-	-
brazilsouth	-	✅	-	-
canadaeast	-	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	-	✅	✅	✅
francecentral	-	✅	-	-
japaneast	-	✅	-	-
northcentralus	-	✅	-	-
norwayeast	-	✅	-	-
southafricanorth	-	✅	-	-
southcentralus	✅	✅	-	-
southindia	-	✅	-	-
swedencentral	-	✅	-	-
switzerlandnorth	-	✅	-	-
uksouth	-	✅	-	-
westeurope	-	✅	-	-
westus	-	✅	-	-

Regiony Azure Government

Następujące modele osadzania są dostępne w usłudze Azure Government:

Model ID	Dostępność modelu
`text-embedding-ada-002` (wersja 2)	US Gov Wirginia US Gov Arizona

Modele DALL-E

Model ID	Dostępność funkcji	Maksymalna liczba żądań (znaki)
dalle2 (wersja zapoznawcza)	Wschodnie stany USA	1000
dall-e-3	Wschodnie stany USA, Australia Wschodnia, Szwecja Środkowa	4000

Dostrajanie modeli

babbage-002 i davinci-002 nie są przeszkoleni, aby postępować zgodnie z instrukcjami. Wykonywanie zapytań dotyczących tych modeli podstawowych powinno odbywać się tylko jako punkt odniesienia do dostosowanej wersji, aby ocenić postęp trenowania.

gpt-35-turbo-0613 — dostrajanie tego modelu jest ograniczone do podzbioru regionów i nie jest dostępne w każdym regionie, w którym model podstawowy jest dostępny.

Model ID	Dostrajanie regionów	Maksymalne żądanie (tokeny)	Dane szkoleniowe (maksymalnie)
`babbage-002`	Północno-środkowe stany USA Szwecja Środkowa	16,384	Wrzesień 2021 r.
`davinci-002`	Północno-środkowe stany USA Szwecja Środkowa	16,384	Wrzesień 2021 r.
`gpt-35-turbo` (0613)	Wschodnie stany USA 2 Północno-środkowe stany USA Szwecja Środkowa	4,096	Wrzesień 2021 r.
`gpt-35-turbo` (1106)	Wschodnie stany USA 2 Północno-środkowe stany USA Szwecja Środkowa	Dane wejściowe: 16 385 Dane wyjściowe: 4096	Wrzesień 2021 r.
`gpt-35-turbo` (0125)	Wschodnie stany USA 2 Północno-środkowe stany USA Szwecja Środkowa	16,385	Wrzesień 2021 r.

Modele szeptu

Model ID	Dostępność modelu	Maksymalna liczba żądań (rozmiar pliku audio)
`whisper`	Wschodnie stany USA 2 Północno-środkowe stany USA Norwegia Wschodnia Indie Szwecja Środkowa West Europe	25 MB

Modele zamiany tekstu na mowę (wersja zapoznawcza)

Model ID	Dostępność modelu
`tts-1`	Północno-środkowe stany USA Szwecja Środkowa
`tts-1-hd`	Północno-środkowe stany USA Szwecja Środkowa

Asystenci (wersja zapoznawcza)

W przypadku asystentów potrzebujesz kombinacji obsługiwanego modelu i obsługiwanego regionu. Niektóre narzędzia i możliwości wymagają najnowszych modeli. Poniższe modele są dostępne w interfejsie API Asystentów, zestawie SDK, programie Azure AI Studio i narzędziu Azure OpenAI Studio. Poniższa tabela dotyczy płatności zgodnie z rzeczywistym użyciem. Aby uzyskać informacje na temat dostępności jednostki przepływności aprowizowanej (PTU), zobacz aprowizowanie przepływności.

Region (Region)	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`
Australia Wschodnia	✅	✅	✅	✅
East US	✅				✅
Wschodnie stany USA 2	✅		✅	✅
Francja Środkowa	✅	✅	✅	✅
Norwegia Wschodnia				✅
Szwecja Środkowa	✅	✅	✅	✅
Południowe Zjednoczone Królestwo	✅	✅	✅	✅

Modele usługi Azure OpenAI Service

GPT-4 i GPT-4 Turbo (wersja zapoznawcza)

GPT-3.5

Osadzanie

DALL-E

Szept

Zamiana tekstu na mowę (wersja zapoznawcza)

Tabela podsumowania modelu i dostępność regionów

Dostępność modelu wdrażania w warstwie Standardowa

Standardowy limit przydziału modelu wdrażania

Modele GPT-4 i GPT-4 Turbo Preview

Dostępność modelu GPT-4 i GPT-4 Turbo Preview

Regiony chmury publicznej

Wybieranie dostępu klienta

Regiony Azure Government

Modele GPT-3.5

Dostępność modelu GPT-3.5-Turbo

Regiony chmury publicznej

Regiony Azure Government

Osadzanie modeli

Regiony chmury publicznej

Regiony Azure Government

Modele DALL-E

Dostrajanie modeli

Modele szeptu

Modele zamiany tekstu na mowę (wersja zapoznawcza)

Asystenci (wersja zapoznawcza)

Następne kroki

Dodatkowe zasoby