Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Usługa Azure OpenAI jest obsługiwana przez zróżnicowany zestaw modeli z różnymi możliwościami i punktami cenowymi. Dostępność modelu różni się w zależności od regionu i chmury. Aby uzyskać informacje o dostępności modelu platformy Azure Government, zobacz Azure Government OpenAI Service.
Modele | Opis |
---|---|
codex-mini | Dostrojona wersja o4-mini. |
Seria GPT-4.1 | Najnowsze wydanie modelu od Azure OpenAI |
model-router | Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit. |
podgląd użytkowania komputera | Eksperymentalny model szkolony do użytku z narzędziem komputerowym Responses API. |
GPT-4.5 (wersja zapoznawcza) | Najnowszy model GPT, który wyróżnia się w różnorodnych zadaniach tekstowych i obrazowych. |
modele serii O | Modele rozumowania z zaawansowanym rozwiązywaniem problemów i zwiększeniem koncentracji uwagi i możliwości. |
GPT-4o & GPT-4o mini & GPT-4 Turbo | Najnowsze, najbardziej zaawansowane modele Azure OpenAI w wersjach multimodalnych, które mogą przyjmować zarówno tekst, jak i obrazy jako dane wejściowe. |
GPT-4 | Zestaw modeli, które ulepszają GPT-3.5 i potrafią rozumieć oraz generować język naturalny i kod. |
GPT-3.5 | Zestaw modeli, które poprawiają się względem GPT-3 i potrafią rozumieć oraz generować naturalny język i kod. |
Osadzanie | Zestaw modeli, które mogą przekształcać tekst w numeryczną formę wektora, aby ułatwić podobieństwo tekstu. |
Generowanie obrazu | Seria modeli, które mogą generować oryginalne obrazy z języka naturalnego. |
Dźwięk | Szereg modeli do zamiany mowy na tekst, tłumaczenia i zamiany tekstu na mowę. Modele audio GPT-4o obsługują niskie opóźnienia, "mowa jako wejście, mowa jako wyjście" dla interakcji konwersacyjnych lub generowanie dźwięku. |
Seria GPT 4.1
Dostępność w regionie
Model | Rejon |
---|---|
gpt-4.1 (2025-04-14) |
Zobacz tabelę modeli. |
gpt-4.1-nano (2025-04-14) |
Zobacz tabelę modeli. |
gpt-4.1-mini (2025-04-14) |
Zobacz tabelę modeli. |
Możliwości
Identyfikator modelu | Opis | Okno kontekstu | Maksymalna liczba tokenów wyjściowych | Dane treningowe (do) |
---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- Wprowadzanie tekstu i obrazów - Wyjście tekstowe - API ukończeń czatu Interfejs API dla odpowiedzi -Przesyłanie strumieniowe - Wywołanie funkcji Ustrukturyzowane dane wyjściowe (ukończone rozmowy) |
- 1,047,576 - 128 000 (aprowizowania wdrożeń zarządzanych) - 300 000 (batchowe wdrożenia) |
32,768 | 31 maja 2024 r. |
gpt-4.1-nano (2025-04-14) |
- Wprowadzanie tekstu i obrazów - Wyjście tekstowe - API ukończeń czatu Interfejs API dla odpowiedzi -Przesyłanie strumieniowe - Wywołanie funkcji Ustrukturyzowane dane wyjściowe (ukończone rozmowy) |
- 1,047,576 - 128 000 (aprowizowania wdrożeń zarządzanych) - 300 000 (batchowe wdrożenia) |
32,768 | 31 maja 2024 r. |
gpt-4.1-mini (2025-04-14) |
- Wprowadzanie tekstu i obrazów - Wyjście tekstowe - API ukończeń czatu Interfejs API dla odpowiedzi -Przesyłanie strumieniowe - Wywołanie funkcji Ustrukturyzowane dane wyjściowe (ukończone rozmowy) |
- 1,047,576 - 128 000 (aprowizowania wdrożeń zarządzanych) - 300 000 (batchowe wdrożenia) |
32,768 | 31 maja 2024 r. |
model routera
Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit.
Dostępność w regionie
Model | Rejon |
---|---|
model-router (2025-05-19) |
Wschodnie USA 2 (Globalny standard), Szwecja Centralna (Globalny standard) |
Możliwości
Identyfikator modelu | Opis | Okno kontekstu | Maksymalna liczba tokenów wyjściowych | Dane treningowe (do) |
---|---|---|---|---|
model-router (2025-05-19) |
Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit. | 200,000* | 32768 (seria GPT 4.1) 100 K (o4-mini) |
31 maja 2024 r. |
*Większe okna kontekstowe są zgodne z niektórymi podstawowymi modelami, co oznacza, że wywołanie interfejsu API z większym kontekstem powiedzie się tylko wtedy, gdy monit zostanie skierowany do odpowiedniego modelu, w przeciwnym razie wywołanie zakończy się niepowodzeniem.
podgląd użycia komputera
Eksperymentalny model opracowany do użytku z narzędziem komputerowym API odpowiedzi. Może być używany w połączeniu z bibliotekami stron trzecich, aby umożliwić modelowi kontrolowanie wejścia z klawiatury i myszy przy jednoczesnym uzyskiwaniu kontekstu z zrzutów ekranu bieżącego środowiska.
Uwaga
Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.
Dostępność
computer-use-preview
Klienci, którzy mają dostęp do innych modeli ograniczonego dostępu, nadal będą musieli zażądać dostępu dla tego modelu.
Żądanie dostępu: computer-use-preview
aplikacja modelu ograniczonego dostępu
Po udzieleniu dostępu należy utworzyć wdrożenie dla modelu.
Dostępność w regionie
Model | Rejon |
---|---|
computer-use-preview |
Zobacz tabelę modeli. |
Możliwości
Identyfikator modelu | Opis | Okno kontekstu | Maksymalna liczba tokenów wyjściowych | Dane treningowe (do) |
---|---|---|---|---|
computer-use-preview (2025-03-11) |
Wyspecjalizowany model do użycia z narzędziem związanym z interfejsem API odpowiedzi -Narzędzia -Transmisja strumieniowa -Tekst (wejście/wyjście) - Obraz(wejście) |
8,192 | 1,024 | październik 2023 |
GPT-4.5 (wersja zapoznawcza)
Dostępność w regionie
Model | Rejon |
---|---|
gpt-4.5-preview |
Zobacz tabelę modeli. |
Możliwości
Identyfikator modelu | Opis | Okno kontekstu | Maksymalna liczba tokenów wyjściowych | Dane treningowe (do) |
---|---|---|---|---|
gpt-4.5-preview (2025-02-27) GPT-4.5 (wersja zapoznawcza) |
GPT 4.1 jest zalecanym zamiennikiem tego modelu. Doskonale radzi sobie z różnorodnymi zadaniami związanymi z tekstem i obrazami. - Dane wyjściowe ze strukturą — Buforowanie monitów -Narzędzia -Streamowanie - Tekst(input/output) - Obraz(wejście) |
128,000 | 16,384 | październik 2023 |
Uwaga
To normalne, że model nie potrafi odpowiadać na pytania dotyczące samego siebie. Jeśli chcesz wiedzieć, kiedy dane treningowe modelu zostały zaktualizowane, lub poznać inne szczegóły dotyczące modelu, powinieneś zapoznać się z dokumentacją modelu powyżej.
modele o-serii
Modele z serii Azure OpenAI o* są specjalnie zaprojektowane do rozwiązywania zadań związanych z rozumowaniem i rozwiązywaniem problemów, zapewniając zwiększoną koncentrację i zdolności. Te modele spędzają więcej czasu na przetwarzaniu i zrozumieniu zapytania użytkownika, co sprawia, że są wyjątkowo silne w dziedzinach takich jak nauka, kodowanie i matematyka, w porównaniu z poprzednimi iteracjami.
Identyfikator modelu | Opis | Maksymalna liczba żądań (tokeny) | Dane treningowe (do) |
---|---|---|---|
codex-mini (2025-05-16) |
Dostrojona wersja o4-mini. - API odpowiedzi - Strukturalne wyniki - Tekst, przetwarzanie obrazów - Funkcje/Narzędzia Pełne podsumowanie możliwości |
Input: 200 000 Wynik: 100 000 |
31 maja 2024 r. |
o3-pro (2025-06-10) |
-
API odpowiedzi - Strukturalne wyniki - Tekst, przetwarzanie obrazów - Funkcje/Narzędzia Pełne podsumowanie możliwości |
Input: 200 000 Wynik: 100 000 |
31 maja 2024 r. |
o4-mini (2025-04-16) |
-
NOWY model rozumowania, oferując ulepszone możliwości rozumowania. API uzupełniania konwersacji - API odpowiedzi - Strukturalne wyniki - Tekst, przetwarzanie obrazów - Funkcje/Narzędzia Pełne podsumowanie możliwości |
Input: 200 000 Wynik: 100 000 |
31 maja 2024 r. |
o3 (2025-04-16) |
-
NOWY model rozumowania, oferując ulepszone możliwości rozumowania. API uzupełniania konwersacji - API odpowiedzi - Strukturalne wyniki - Tekst, przetwarzanie obrazów - Funkcje/Narzędzia/Wywoływanie narzędzi równoległych Pełne podsumowanie możliwości |
Input: 200 000 Wynik: 100 000 |
31 maja 2024 r. |
o3-mini (2025-01-31) |
-
Ulepszone możliwości rozumowania. - Strukturalne wyniki - Przetwarzanie tylko tekstu - Funkcje/Narzędzia |
Input: 200 000 Wynik: 100 000 |
październik 2023 |
o1 (2024-12-17) |
-
Ulepszone możliwości rozumowania. - Strukturalne wyniki - Tekst, przetwarzanie obrazów - Funkcje/Narzędzia |
Input: 200 000 Wynik: 100 000 |
październik 2023 |
o1-preview (2024-09-12) |
Starsza wersja podglądowa | Input: 128 000 Dane wyjściowe: 32 768 |
październik 2023 |
o1-mini (2024-09-12) |
Szybsza i bardziej opłacalna opcja z serii o1, idealna do zadań programistycznych wymagających szybkości i niższego zużycia zasobów. Globalne wdrożenie standardowe dostępne domyślnie. Standardowe (regionalne) wdrożenia są obecnie dostępne tylko dla wybranych klientów, którzy otrzymali dostęp w ramach limitowanego wydania o1-preview . |
Input: 128 000 Dane wyjściowe: 65 536 |
październik 2023 |
Dostępność
Aby dowiedzieć się więcej o zaawansowanych o-series
modelach, zobacz Wprowadzenie do modeli rozumowania.
Dostępność w regionie
Model | Rejon |
---|---|
codex-mini |
Wschodnie stany USA2 i Szwecja Środkowa (Standardowa globalna) |
o3-pro |
Wschodnie stany USA2 i Szwecja Środkowa (Standardowa globalna) |
o4-mini |
Zobacz tabelę modeli. |
o3 |
Zobacz tabelę modeli. |
o3-mini |
Zobacz tabelę modeli. |
o1 |
Zobacz tabelę modeli. |
o1-preview |
Zobacz tabelę modeli. Ten model jest dostępny tylko dla klientów, którym przyznano dostęp w ramach oryginalnego ograniczonego dostępu. |
o1-mini |
Zobacz tabelę modeli. |
GPT-4o i GPT-4 Turbo
GPT-4o integruje tekst i obrazy w jednym modelu, co umożliwia mu jednoczesne przetwarzanie wielu typów danych. To podejście multimodalne zwiększa dokładność i szybkość reakcji w interakcjach człowiek-komputer. GPT-4o dorównuje GPT-4 Turbo w zadaniach związanych z tekstem angielskim i kodowaniem, oferując jednocześnie lepszą wydajność w językach innych niż angielski oraz w zadaniach związanych z wizją, wyznaczając nowe standardy dla możliwości AI.
Jak uzyskać dostęp do modeli GPT-4o i GPT-4o mini?
GPT-4o i GPT-4o mini są dostępne dla standardowego i globalnego standardu wdrożenia modelu.
Musisz utworzyć lub użyć istniejącego zasobu w obsługiwanym regionie standardowym lub globalnym, w którym jest dostępny model.
Po utworzeniu zasobu można wdrożyć modele GPT-4o. Jeśli przeprowadzasz wdrożenie programowe, nazwy modelu to:
-
gpt-4o
Wersja2024-11-20
-
gpt-4o
Wersja2024-08-06
-
gpt-4o
Wersja2024-05-13
-
gpt-4o-mini
Wersja2024-07-18
GPT-4 Turbo
GPT-4 Turbo to duży model multimodalny, który przyjmuje dane wejściowe w postaci tekstu lub obrazu i generuje tekst, potrafiący rozwiązywać trudne problemy z większą dokładnością niż jakiekolwiek poprzednie modele OpenAI. Podobnie jak GPT-3.5 Turbo i starsze modele GPT-4, GPT-4 Turbo jest zoptymalizowany do rozmów i dobrze sprawdza się w tradycyjnych zadaniach ukończenia.
GPT-4
GPT-4 jest poprzednikiem GPT-4 Turbo. Zarówno modele GPT-4, jak i GPT-4 Turbo mają nazwę modelu bazowego gpt-4
. Możesz odróżnić modele GPT-4 od Turbo, sprawdzając wersję modelu.
-
gpt-4
Wersja0314
-
gpt-4
Wersja0613
-
gpt-4-32k
Wersja0613
Długość kontekstu tokenu obsługiwana przez poszczególne modele można zobaczyć w tabeli podsumowania modelu.
GPT-4 i GPT-4 Turbo modele
- Te modele można używać tylko z Chat Completion API.
Zobacz wersje modelu aby dowiedzieć się, jak usługa Azure OpenAI obsługuje uaktualnienia wersji modelu, i zobacz współpracę z modelami, aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu dla wdrożeń GPT-4.
Identyfikator modelu | Opis | Maksymalna liczba żądań (tokeny) | Dane treningowe (do) |
---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
Najnowszy duży model algorytmu genetycznego - Strukturalne wyniki - Tekst, przetwarzanie obrazów - tryb JSON - równoległe wywoływanie funkcji - Zwiększona dokładność i responsywność - Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision - Wyjątkowa wydajność w językach nieromance oraz w zadaniach związanych z wizją. - Ulepszona umiejętność pisania twórczego |
Input: 128 000 Wynik: 16 384 |
październik 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
- Strukturalne wyniki - Tekst, przetwarzanie obrazów - tryb JSON - równoległe wywoływanie funkcji - Zwiększona dokładność i responsywność - Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision - Wyjątkowa wydajność w językach innych niż angielski i w zadaniach związanych z widzeniem |
Input: 128 000 Wynik: 16 384 |
październik 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Najnowszy mały model GA - Szybki, niedrogi i wydajny model idealny do zastąpienia modeli serii GPT-3.5 Turbo. - Tekst, przetwarzanie obrazów - tryb JSON - równoległe wywoływanie funkcji |
Input: 128 000 Wynik: 16 384 |
październik 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Przetwarzanie tekstu, obrazu - tryb JSON - równoległe wywoływanie funkcji - Zwiększona dokładność i responsywność - Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision - Wyjątkowa wydajność w językach innych niż angielski i w zadaniach związanych z widzeniem |
Input: 128 000 Wyjście: 4,096 |
październik 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo z wizją |
Nowy model GA - Zastąpienie wszystkich poprzednich modelów podglądu GPT-4 ( vision-preview , 1106-Preview , 0125-Preview ). - Dostępność funkcji jest obecnie różna w zależności od metody danych wejściowych i typu wdrożenia. |
Input: 128 000 Wyjście: 4,096 |
grudzień 2023 |
gpt-4-32k (0613) |
Starszy model GA - Podstawowe wywoływanie funkcji z narzędziami |
32,768 | Wrzesień 2021 r. |
gpt-4 (0613) |
Starszy model GA - Podstawowe wywoływanie funkcji z narzędziami |
8,192 | Wrzesień 2021 r. |
gpt-4-32k (0314) |
Starszy model GA - Informacje o wycofaniu |
32,768 | Wrzesień 2021 r. |
gpt-4 (0314) |
Starszy model GA - Informacje o wycofaniu |
8,192 | Wrzesień 2021 r. |
Uwaga
Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.
GPT-3.5
Modele GPT-3.5 potrafią rozumieć i generować tekst w języku naturalnym lub kod. Najbardziej zdolnym i ekonomicznym modelem w rodzinie GPT-3.5 jest GPT-3.5 Turbo, który został zoptymalizowany do rozmów i równie dobrze radzi sobie z zadaniami tradycyjnego dopełniania. GPT-3.5 Turbo jest dostępny do użytku z Chat Completions API. GPT-3.5 Turbo Instruct ma podobne możliwości jak text-davinci-003
, korzystając z interfejsu API ukończeń, zamiast interfejsu API czatowych ukończeń. Zalecamy używanie GPT-3.5 Turbo i GPT-3.5 Turbo Instruct zamiast starszych modeli GPT-3.5 i GPT-3.
Identyfikator modelu | Opis | Maksymalna liczba żądań (tokeny) | Dane treningowe (do) |
---|---|---|---|
gpt-35-turbo (0125) NOWY |
Najnowszy model GA - tryb JSON - równoległe wywoływanie funkcji - powtarzalny wynik (podgląd) - Wyższa dokładność w odpowiadaniu w żądanych formatach. - Poprawka błędu, który powodował problem z kodowaniem tekstu dla wywołań funkcji w językach innych niż angielski. |
Wejście: 16,385 Wyjście: 4,096 |
Wrzesień 2021 r. |
gpt-35-turbo (1106) |
Starszy model ga - tryb JSON - równoległe wywoływanie funkcji - powtarzalny wynik (podgląd) |
Wejście: 16,385 Wyjście: 4,096 |
Wrzesień 2021 r. |
gpt-35-turbo-instruct (0914) |
Tylko punkt końcowy uzupełniania — Zastępowanie starszych modeli uzupełniania |
4,097 | Wrzesień 2021 r. |
Aby dowiedzieć się więcej o interakcji z GPT-3.5 Turbo i API Chat Completions, zapoznaj się z naszym szczegółowym przewodnikiem.
1 Ten model będzie akceptować żądania > 4096 tokenów. Nie zaleca się przekraczania limitu 4,096 tokenów wejściowych, ponieważ nowsza wersja modelu jest ograniczona do 4,096 tokenów. Jeśli napotkasz problemy po przekroczeniu 4,096 tokenów wejściowych w tym modelu, ta konfiguracja nie jest oficjalnie wspierana.
Zakotwiczenia
text-embedding-3-large
jest najnowszym i najbardziej zaawansowanym modelem osadzania. Aktualizacja między modelami osadzeń jest niemożliwa. Aby przejść od korzystania z text-embedding-ada-002
do text-embedding-3-large
, musisz wygenerować nowe osadzenia.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Podczas testowania raporty OpenAI wskazują, że zarówno duże, jak i małe modele osadzania trzeciej generacji oferują lepszą średnią wydajność w zakresie wyszukiwania wielojęzykowego z benchmarkiem MIRACL, z jednoczesnym utrzymaniem wydajności dla zadań w języku angielskim z benchmarkiem MTEB.
Kryteria oceny | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL średnia | 31,4 | 44.0 | 54.9 |
MTEB średnia | 61.0 | 62.3 | 64.6 |
Modele osadzeń trzeciej generacji wspierają zmniejszanie rozmiaru osadzenia za pomocą nowego parametru dimensions
. Zazwyczaj większe osadzenia są droższe z punktu widzenia obliczeń, pamięci i przechowywania. Możliwość dostosowania liczby wymiarów pozwala na lepszą kontrolę całkowitych kosztów i wydajności. Parametr dimensions
nie jest obsługiwany we wszystkich wersjach biblioteki OpenAI 1.x dla Pythona. Aby skorzystać z tego parametru, zalecamy uaktualnienie do najnowszej wersji: pip install openai --upgrade
.
Testy benchmarkowe OpenAI MTEB wykazały, że nawet gdy wymiary modelu trzeciej generacji zostaną zredukowane do mniej niż text-embeddings-ada-002
1,536, jego wydajność pozostaje nieco lepsza.
Modele generowania obrazów
Modele generowania obrazów generują obrazy z monitów tekstowych wyświetlanych przez użytkownika. GPT-image-1 ma ograniczony dostęp do publicznej wersji zapoznawczej. DALL-E 3 jest ogólnie dostępny do użytku z interfejsami API REST. DALL-E 2 i DALL-E 3 z SDK dla klientów są w wersji zapoznawczej.
Dostępność
gpt-image-1
Klienci, którzy mają dostęp do innych modeli ograniczonego dostępu, nadal będą musieli zażądać dostępu dla tego modelu.
Żądanie dostępu: gpt-image-1
aplikacja modelu ograniczonego dostępu
Po udzieleniu dostępu należy utworzyć wdrożenie dla modelu.
Dostępność w regionie
Model | Rejon |
---|---|
dall-e-3 |
Wschodnie USA Australia Wschodnia Szwecja Środkowa |
gpt-image-1 |
Zachodnie USA 3 (Globalny standard) Północne Zjednoczone Emiraty Arabskie (globalny standard) |
Modele generowania wideo
Sora to model sztucznej inteligencji z platformy OpenAI, który może tworzyć realistyczne i pomysłowe sceny wideo na podstawie instrukcji tekstowych. Sora jest dostępna w publicznej wersji zapoznawczej.
Dostępność w regionie
Model | Rejon |
---|---|
sora |
Wschodnie stany USA 2 |
Modele audio
Modele audio w usłudze Azure OpenAI są dostępne za pośrednictwem realtime
, completions
i audio
interfejsów API.
Modele audio GPT-4o
Modele audio GPT 4o są częścią rodziny modeli GPT-4o i obsługują interakcje konwersacyjne z niskimi opóźnieniami, typu "mowa na wejściu, mowa na wyjściu" oraz generowanie dźwięku.
Uwaga
Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.
Szczegóły dotyczące maksymalnej liczby żądań tokenów i danych treningowych znajdują się w poniższej tabeli.
Identyfikator modelu | Opis | Maksymalna liczba żądań (tokeny) | Dane treningowe (do) |
---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) Dźwięk GPT-4o |
Model audio na potrzeby generowania dźwięku i tekstu. | Input: 128 000 Wyjście: 4,096 |
październik 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) Dźwięk GPT-4o |
Model audio do przetwarzania dźwięku w czasie rzeczywistym. | Input: 128 000 Wyjście: 4,096 |
październik 2023 |
gpt-4o-audio-preview (2024-12-17) Dźwięk GPT-4o |
Model audio na potrzeby generowania dźwięku i tekstu. | Input: 128 000 Wyjście: 4,096 |
październik 2023 |
gpt-4o-realtime-preview (2024-12-17) Dźwięk GPT-4o |
Model audio do przetwarzania dźwięku w czasie rzeczywistym. | Input: 128 000 Wyjście: 4,096 |
październik 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) Dźwięk GPT-4o |
Model audio do przetwarzania dźwięku w czasie rzeczywistym. | Input: 128 000 Wyjście: 4,096 |
październik 2023 |
Aby porównać dostępność modeli audio GPT-4o we wszystkich regionach, zobacz tabelę modeli.
Audio API
Modele audio za pośrednictwem interfejsu /audio
API mogą służyć do zamiany mowy na tekst, tłumaczenie i zamianę tekstu na mowę.
Modele zamiany mowy na tekst
Identyfikator modelu | Opis | Maksymalna prośba (rozmiar pliku audio) |
---|---|---|
whisper |
Model rozpoznawania mowy ogólnego przeznaczenia. | 25 MB |
gpt-4o-transcribe |
Zamiana mowy na tekst napędzana przez GPT-4o. | 25 MB |
gpt-4o-mini-transcribe |
Przekształcanie mowy na tekst zasilane przez GPT-4o mini. | 25 MB |
Modele tłumaczenia mowy
Identyfikator modelu | Opis | Maksymalna prośba (rozmiar pliku audio) |
---|---|---|
whisper |
Model rozpoznawania mowy ogólnego przeznaczenia. | 25 MB |
Modele przetwarzania tekstu na mowę (wersja zapoznawcza)
Identyfikator modelu | Opis |
---|---|
tts |
Tekst mowy zoptymalizowany pod kątem szybkości. |
tts-hd |
Optymalizacja jakości dla przetwarzania tekstu na mowę. |
gpt-4o-mini-tts |
Model zamiany tekstu na głos zasilany przez GPT-4o mini. Możesz kontrolować głos, aby mówił w pewnym stylu lub tonie. |
Aby uzyskać więcej informacji, zobacz Dostępność regionów modeli audio w tym artykule.
Tabela podsumowania modelu i dostępność regionu
Modele według typu wdrożenia
Azure OpenAI oferuje klientom wybór struktury hostingu, która odpowiada ich potrzebom biznesowym i wzorcowym użytkowania. Usługa oferuje dwa główne typy wdrożeń:
- Standard jest oferowany z opcją globalnego wdrażania, globalnie kierując ruchem, zapewniając większą przepustowość.
- Aprowizowanie jest również oferowane za pomocą globalnej opcji wdrażania, dzięki czemu klienci mogą kupować i wdrażać aprowizowane jednostki przepływności w globalnej infrastrukturze platformy Azure.
Wszystkie wdrożenia mogą wykonywać dokładnie te same operacje wnioskowania, jednak rozliczenia, skala i wydajność są znacznie różne. Aby dowiedzieć się więcej na temat typów wdrożeń usługi Azure OpenAI, zobacz przewodnik dotyczący typów wdrożeń.
- Standardowa globalna
- Globalnie przydzielone i zarządzane
- Globalna partia
- Strefa danych Standard
- Strefa danych zarządzana i aprowizowana
- Pakiet strefy danych
- Norma
- Zarządzane zaopatrzenie
Globalna dostępność standardowego modelu
Region | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | model-router, 2025-05-19 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | podgląd-użytkowania-komputera, 2025-03-11 | gpt-4.5-preview, 2025-02-27 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | ** text-embedding-3-small, 1 | Text Embedding 3 Large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transkrypcja, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transkrypcja, 2025-03-20 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
AustraliaEast | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Brazylia Południe | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Wschodnia Kanada | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Niemcy Zachodnio-Środkowe | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
północne Włochy | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Północno-Centralny | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Norwegia Wschód | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
polandcentral | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Republika Południowej Afrykipółnocny | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
southcentralus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Południowe Indie | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Hiszpania Centralna | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ |
Północ Szwajcarii | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uaenorth | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Południowa Anglia | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Europa Zachodnia | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Uwaga
o1-mini
jest obecnie dostępne dla wszystkich klientów do globalnego standardowego wdrożenia.
Wybrani klienci otrzymali standardowy (regionalny) dostęp do wdrożenia o1-mini
w ramach ograniczonego dostępu o1-preview
. W tej chwili dostęp do o1-mini
standardowych (regionalnych) wdrożeń nie jest rozszerzany.
Ta tabela nie zawiera informacji o dostępności regionalnej w ramach dostrajania. Aby uzyskać te informacje, zapoznaj się z sekcją dostrajania .
Standardowe modele wdrażania (regionalne) według punktu końcowego
Ukończenia czatu
Region | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|
AustraliaEast | - | - | - | ✅ | - | - | - | ✅ | ✅ |
Wschodnia Kanada | - | - | - | ✅ | - | - | - | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
francecentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
japaneast | - | - | - | ✅ | - | - | - | - | ✅ |
Północno-Centralny | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Norwegia Wschód | - | - | - | ✅ | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Południowe Indie | - | - | - | ✅ | - | - | - | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Północ Szwajcarii | - | - | - | ✅ | - | - | - | - | ✅ |
Południowa Anglia | - | - | - | ✅ | - | - | - | ✅ | ✅ |
Europa Zachodnia | - | - | - | - | - | - | - | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Uwaga
o1-mini
jest obecnie dostępne dla wszystkich klientów do globalnego standardowego wdrożenia.
Wybrani klienci otrzymali standardowy (regionalny) dostęp do wdrożenia o1-mini
w ramach ograniczonego dostępu o1-preview
. W tej chwili dostęp do o1-mini
standardowych (regionalnych) wdrożeń nie jest rozszerzany.
Dostępność modeli GPT-4 i GPT-4 Turbo
Wybierz dostęp klienta
Oprócz wspomnianych wyżej regionów, które są dostępne dla wszystkich klientów Azure OpenAI, niektórzy wybrani i już istniejący klienci otrzymali dostęp do wersji GPT-4 w dodatkowych regionach.
Model | Rejon |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
Wschodnie USA Francja Centralna Południowo-Centralne Stany Zjednoczone Południe Wielkiej Brytanii |
gpt-4 (0613) gpt-4-32k (0613) |
Wschodnie USA Wschód USA 2 Wschodnia Japonia Południe Wielkiej Brytanii |
modele GPT-3.5
Zobacz wersje modelu, aby dowiedzieć się, jak usługa Azure OpenAI obsługuje uaktualnienia wersji modelu, i pracę z modelami, aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu wdrożeń GPT-3.5 Turbo.
Dostrajanie modeli
Uwaga
gpt-35-turbo
- Dostrajanie tego modelu jest ograniczone do podzbioru regionów i nie jest dostępne we wszystkich regionach, w których dostępny jest model podstawowy.
Obsługiwane regiony dla dostrajania mogą się różnić, jeśli używasz modeli Azure OpenAI w projekcie Azure AI Foundry w porównaniu z używaniem ich poza projektem.
Identyfikator modelu | Standardowe regiony trenowania | Szkolenie globalne (wersja zapoznawcza) | Maksymalne żądanie (żetony) | Dane treningowe (do) | Modalność |
---|---|---|---|---|---|
gpt-35-turbo (1106) |
Wschodnie USA2 Północno-centralna część USA Szwecja Środkowa Szwajcaria Zachód |
- | Wejście: 16,385 Wyjście: 4,096 |
Wrzesień 2021 r. | Tekst do tekstu |
gpt-35-turbo (0125) |
Wschodnie USA2 Północno-centralna część USA Szwecja Środkowa Szwajcaria Zachód |
- | 16,385 | Wrzesień 2021 r. | Tekst do tekstu |
gpt-4o-mini (2024-07-18) |
Północno-centralna część USA Szwecja Środkowa |
- | Input: 128 000 Wynik: 16,384 Długość kontekstu przykładowego szkolenia: 65 536 |
październik 2023 | Tekst do tekstu |
gpt-4o (2024-08-06) |
Wschodnie USA2 Północno-centralna część USA Szwecja Środkowa |
- | Input: 128 000 Wynik: 16,384 Długość kontekstu przykładowego szkolenia: 65 536 |
październik 2023 | Tekst i obraz do tekstu |
gpt-4.1 (2025-04-14) |
Północno-centralna część USA Szwecja Środkowa |
✅ | Input: 128 000 Wynik: 16,384 Długość kontekstu przykładowego szkolenia: 65 536 |
maj 2024 | Tekst i obraz do tekstu |
gpt-4.1-mini (2025-04-14) |
Północno-centralna część USA Szwecja Środkowa |
✅ | Input: 128 000 Wynik: 16,384 Długość kontekstu przykładowego szkolenia: 65 536 |
maj 2024 | Tekst do tekstu |
gpt-4.1-nano (2025-04-14) |
Północno-centralna część USA Szwecja Środkowa |
- | Input: 128 000 Wynik: 16,384 Długość kontekstu przykładowego szkolenia: 32 768 |
maj 2024 | Tekst do tekstu |
o4-mini (2025-04-16) |
Wschodnie USA2 Szwecja Środkowa |
- | Input: 128 000 Wynik: 16,384 Długość kontekstu przykładowego szkolenia: 65 536 |
maj 2024 | Tekst do tekstu |
Uwaga
Globalne szkolenie (w publicznej wersji zapoznawczej) zapewnia bardziej przystępne cenowo szkolenie na token, ale nie oferuje miejsca przechowywania danych. Obecnie jest ona dostępna dla zasobów usługi Azure OpenAI w następujących regionach, a wkrótce pojawi się więcej regionów:
- Australia Wschodnia
- Brazylia Południe
- Wschodnie USA
- Wschodnie stany USA 2
- Francja Środkowa
- Niemcy Zachodnio-środkowe
- Włochy Północne
- Japonia Wschodnia (brak wsparcia widzenia)
- Korea Środkowa
- Północno-środkowe stany USA
- Norwegia Wschodnia
- Polska Środkowa
- Azja Południowo-Wschodnia
- Północna część Republiki Południowej Afryki
- Południowo-centralna część USA
- Hiszpania Środkowa
- Szwecja Środkowa
- Szwajcaria Zachód
- Szwajcaria Północna
- Południe Wielkiej Brytanii
- Zachodnia Europa
- Zachodnie USA
- Zachód USA 3
Asystenci (Podgląd)
Aby korzystać z Asystentów, potrzebujesz połączenia obsługiwanego modelu i obsługiwanego regionu. Niektóre narzędzia i funkcje wymagają najnowszych modeli. Następujące modele są dostępne w Assistants API, SDK i Azure AI Foundry. Poniższa tabela dotyczy standardowego wdrożenia. Aby uzyskać informacje na temat dostępności jednostki przepływności aprowizowanej (PTU), zobacz aprowizowanie przepływności. Wymienione modele i regiony mogą być używane z obydwoma Asystentami v1 i v2. Możesz użyć globalnych modeli standardowych , jeśli są one obsługiwane w regionach wymienionych poniżej.
Region | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
AustraliaEast | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
Norwegia Wschód | - | - | - | - | ✅ | - | - | - | - | - | - | - |
Południowe Indie | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Południowa Anglia | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Emerytura modelowa
Aby uzyskać najnowsze informacje na temat wycofywania modelu, zapoznaj się z przewodnikiem po wycofaniu modelu.