Udostępnij za pośrednictwem


Azure OpenAI w modelach rozwiązania Azure AI Foundry

Usługa Azure OpenAI jest obsługiwana przez zróżnicowany zestaw modeli z różnymi możliwościami i punktami cenowymi. Dostępność modelu różni się w zależności od regionu i chmury. Aby uzyskać informacje o dostępności modelu platformy Azure Government, zobacz Azure Government OpenAI Service.

Modele Opis
codex-mini Dostrojona wersja o4-mini.
Seria GPT-4.1 Najnowsze wydanie modelu od Azure OpenAI
model-router Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit.
podgląd użytkowania komputera Eksperymentalny model szkolony do użytku z narzędziem komputerowym Responses API.
GPT-4.5 (wersja zapoznawcza) Najnowszy model GPT, który wyróżnia się w różnorodnych zadaniach tekstowych i obrazowych.
modele Serii O Modele rozumowania z zaawansowanym rozwiązywaniem problemów i zwiększeniem koncentracji uwagi i możliwości.
GPT-4o & GPT-4o mini & GPT-4 Turbo Najnowsze, najbardziej zaawansowane modele Azure OpenAI w wersjach multimodalnych, które mogą przyjmować zarówno tekst, jak i obrazy jako dane wejściowe.
GPT-4 Zestaw modeli, które ulepszają GPT-3.5 i potrafią rozumieć oraz generować język naturalny i kod.
GPT-3.5 Zestaw modeli, które poprawiają się względem GPT-3 i potrafią rozumieć oraz generować naturalny język i kod.
Embeddings Zestaw modeli, które mogą przekształcać tekst w numeryczną formę wektora, aby ułatwić podobieństwo tekstu.
Generowanie obrazu Seria modeli, które mogą generować oryginalne obrazy z języka naturalnego.
Dźwięk Szereg modeli do zamiany mowy na tekst, tłumaczenia i zamiany tekstu na mowę. Modele audio GPT-4o obsługują niskie opóźnienia, "mowa jako wejście, mowa jako wyjście" dla interakcji konwersacyjnych lub generowanie dźwięku.

Seria GPT 4.1

Dostępność regionu

Model Rejon
gpt-4.1 (2025-04-14) Zobacz tabelę modeli.
gpt-4.1-nano (2025-04-14) Zobacz tabelę modeli.
gpt-4.1-mini (2025-04-14) Zobacz tabelę modeli.

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
gpt-4.1 (2025-04-14) - Wprowadzanie tekstu i obrazów
- Wyjście tekstowe
- API ukończeń czatu
Interfejs API dla odpowiedzi
-Przesyłanie strumieniowe
- Wywołanie funkcji
Ustrukturyzowane dane wyjściowe (ukończone rozmowy)
- 1,047,576
- 128 000 (aprowizowania wdrożeń zarządzanych)
- 300 000 (batchowe wdrożenia)
32,768 31 maja 2024 r.
gpt-4.1-nano (2025-04-14) - Wprowadzanie tekstu i obrazów
- Wyjście tekstowe
- API ukończeń czatu
Interfejs API dla odpowiedzi
-Przesyłanie strumieniowe
- Wywołanie funkcji
Ustrukturyzowane dane wyjściowe (ukończone rozmowy)
- 1,047,576
- 128 000 (aprowizowania wdrożeń zarządzanych)
- 300 000 (batchowe wdrożenia)
32,768 31 maja 2024 r.
gpt-4.1-mini (2025-04-14) - Wprowadzanie tekstu i obrazów
- Wyjście tekstowe
- API ukończeń czatu
Interfejs API dla odpowiedzi
-Przesyłanie strumieniowe
- Wywołanie funkcji
Ustrukturyzowane dane wyjściowe (ukończone rozmowy)
- 1,047,576
- 128 000 (aprowizowania wdrożeń zarządzanych)
- 300 000 (batchowe wdrożenia)
32,768 31 maja 2024 r.

model routera

Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit.

Dostępność regionu

Model Rejon
model-router (2025-05-19) Wschodnie USA 2 (Globalny standard), Szwecja Centralna (Globalny standard)

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
model-router (2025-05-19) Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit. 200,000* 32768 (seria GPT 4.1)
100 K (o4-mini)
31 maja 2024 r.

*Większe okna kontekstowe są zgodne z niektórymi podstawowymi modelami, co oznacza, że wywołanie interfejsu API z większym kontekstem powiedzie się tylko wtedy, gdy monit zostanie skierowany do odpowiedniego modelu, w przeciwnym razie wywołanie zakończy się niepowodzeniem.

podgląd użycia komputera

Eksperymentalny model wyszkolony do użycia z narzędziem komputerowym Responses API. Może być używany w połączeniu z bibliotekami stron trzecich, aby umożliwić modelowi kontrolowanie wejścia z klawiatury i myszy przy jednoczesnym uzyskiwaniu kontekstu z zrzutów ekranu bieżącego środowiska.

Ostrzeżenie

Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.

Dostępność

computer-use-preview Klienci, którzy mają dostęp do innych modeli ograniczonego dostępu, nadal będą musieli zażądać dostępu dla tego modelu.

Żądanie dostępu: computer-use-preview aplikacja modelu ograniczonego dostępu

Po udzieleniu dostępu należy utworzyć wdrożenie dla modelu.

Dostępność regionu

Model Rejon
computer-use-preview Zobacz tabelę modeli.

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
computer-use-preview (2025-03-11) Specjalistyczny model do użytku z narzędziem Responses API do użytku komputerowego

-Narzędzia
-Transmisja strumieniowa
-Tekst (wejście/wyjście)
- Obraz(wejście)
8,192 1,024 październik 2023

GPT-4.5 (wersja zapoznawcza)

Dostępność regionu

Model Rejon
gpt-4.5-preview Zobacz tabelę modeli.

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
gpt-4.5-preview (2025-02-27)
GPT-4.5 (wersja zapoznawcza)
GPT 4.1 jest zalecanym zamiennikiem tego modelu. Doskonale radzi sobie z różnorodnymi zadaniami związanymi z tekstem i obrazami.
- Dane wyjściowe ze strukturą
— Buforowanie monitów
-Narzędzia
-Streamowanie
- Tekst(input/output)
- Obraz(wejście)
128,000 16,384 październik 2023

Uwaga / Notatka

To normalne, że model nie potrafi odpowiadać na pytania dotyczące samego siebie. Jeśli chcesz wiedzieć, kiedy dane treningowe modelu zostały zaktualizowane, lub poznać inne szczegóły dotyczące modelu, powinieneś zapoznać się z dokumentacją modelu powyżej.

modele o-serii

Modele z serii Azure OpenAI o* są specjalnie zaprojektowane do rozwiązywania zadań związanych z rozumowaniem i rozwiązywaniem problemów, zapewniając zwiększoną koncentrację i zdolności. Modele te poświęcają więcej czasu na przetwarzanie i zrozumienie żądania użytkownika, co czyni je wyjątkowo silnymi w obszarach takich jak nauka, kodowanie i matematyka w porównaniu z poprzednimi iteracjami.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
codex-mini (2025-05-16) Dostrojona wersja o4-mini.
- API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Pełne podsumowanie możliwości
Dane wejściowe: 200 000
Wynik: 100 000
31 maja 2024 r.
o3-pro (2025-06-10) - API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Pełne podsumowanie możliwości
Dane wejściowe: 200 000
Wynik: 100 000
31 maja 2024 r.
o4-mini (2025-04-16) - NOWY model rozumowania, oferując ulepszone możliwości rozumowania.

API uzupełniania konwersacji
- API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Pełne podsumowanie możliwości
Dane wejściowe: 200 000
Wynik: 100 000
31 maja 2024 r.
o3 (2025-04-16) - NOWY model rozumowania, oferując ulepszone możliwości rozumowania.

API uzupełniania konwersacji
- API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia/Wywoływanie narzędzi równoległych
Pełne podsumowanie możliwości
Dane wejściowe: 200 000
Wynik: 100 000
31 maja 2024 r.
o3-mini (2025-01-31) - Ulepszone możliwości rozumowania.
- Strukturalne wyniki
- Przetwarzanie tylko tekstu
- Funkcje/Narzędzia
Dane wejściowe: 200 000
Wynik: 100 000
październik 2023
o1 (2024-12-17) - Ulepszone możliwości rozumowania.
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Dane wejściowe: 200 000
Wynik: 100 000
październik 2023
o1-preview (2024-09-12) Starsza wersja podglądowa Dane wejściowe: 128 000
Dane wyjściowe: 32 768
październik 2023
o1-mini (2024-09-12) Szybsza i bardziej opłacalna opcja z serii o1, idealna do zadań programistycznych wymagających szybkości i niższego zużycia zasobów.

Globalne wdrożenie standardowe dostępne domyślnie.

Standardowe (regionalne) wdrożenia są obecnie dostępne tylko dla wybranych klientów, którzy otrzymali dostęp w ramach limitowanego wydania o1-preview.
Dane wejściowe: 128 000
Dane wyjściowe: 65 536
październik 2023

Dostępność

Aby dowiedzieć się więcej o zaawansowanych o-series modelach, zobacz Wprowadzenie do modeli rozumowania.

Dostępność regionu

Model Rejon
codex-mini Wschodnie stany USA2 i Szwecja Środkowa (Standardowa globalna)
o3-pro Wschodnie stany USA2 i Szwecja Środkowa (Standardowa globalna)
o4-mini Zobacz tabelę modeli.
o3 Zobacz tabelę modeli.
o3-mini Zobacz tabelę modeli.
o1 Zobacz tabelę modeli.
o1-preview Zobacz tabelę modeli. Ten model jest dostępny tylko dla klientów, którym przyznano dostęp w ramach oryginalnego ograniczonego dostępu.
o1-mini Zobacz tabelę modeli.

GPT-4o i GPT-4 Turbo

GPT-4o integruje tekst i obrazy w jednym modelu, co umożliwia mu jednoczesne przetwarzanie wielu typów danych. To podejście multimodalne zwiększa dokładność i szybkość reakcji w interakcjach człowiek-komputer. GPT-4o dorównuje GPT-4 Turbo w zadaniach związanych z tekstem angielskim i kodowaniem, oferując jednocześnie lepszą wydajność w językach innych niż angielski oraz w zadaniach związanych z wizją, wyznaczając nowe standardy dla możliwości AI.

Jak uzyskać dostęp do modeli GPT-4o i GPT-4o mini?

GPT-4o i GPT-4o mini są dostępne do wdrażania modeli w wersji standardowej i globalnej standardowej.

Musisz utworzyć lub użyć istniejącego zasobu w regionie zgodnym ze wsparciem standardu lub standardem globalnym, w którym model jest dostępny.

Po utworzeniu zasobu można wdrożyć modele GPT-4o. Jeśli przeprowadzasz wdrożenie programowe, nazwy modelu to:

  • gpt-4o Wersja2024-11-20
  • gpt-4o Wersja2024-08-06
  • gpt-4o Wersja2024-05-13
  • gpt-4o-mini Wersja2024-07-18

GPT-4 Turbo

GPT-4 Turbo to duży model multimodalny, który przyjmuje dane wejściowe w postaci tekstu lub obrazu i generuje tekst, potrafiący rozwiązywać trudne problemy z większą dokładnością niż jakiekolwiek poprzednie modele OpenAI. Podobnie jak GPT-3.5 Turbo i starsze modele GPT-4, GPT-4 Turbo jest zoptymalizowany do rozmów i dobrze sprawdza się w tradycyjnych zadaniach ukończenia.

GPT-4

GPT-4 jest poprzednikiem GPT-4 Turbo. Zarówno modele GPT-4, jak i GPT-4 Turbo mają nazwę modelu bazowego gpt-4. Możesz odróżnić modele GPT-4 od Turbo, sprawdzając wersję modelu.

  • gpt-4 Wersja0314
  • gpt-4 Wersja0613
  • gpt-4-32k Wersja0613

Możesz zobaczyć obsługiwaną przez każdy model długość kontekstu tokena w tabeli podsumowań modelu.

GPT-4 i GPT-4 Turbo modele

  • Te modele można używać tylko z Chat Completion API.

Zobacz wersje modelu aby dowiedzieć się, jak usługa Azure OpenAI obsługuje uaktualnienia wersji modelu, i zobacz współpracę z modelami, aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu dla wdrożeń GPT-4.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Najnowszy duży model GA
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- tryb JSON
- równoległe wywoływanie funkcji
- Zwiększona dokładność i responsywność
- Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision
- Wyjątkowa wydajność w językach nieromance oraz w zadaniach związanych z wizją.
- Ulepszona umiejętność pisania twórczego
Dane wejściowe: 128 000
Wynik: 16 384
październik 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- tryb JSON
- równoległe wywoływanie funkcji
- Zwiększona dokładność i responsywność
- Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision
- Wyjątkowa wydajność w językach innych niż angielski i w zadaniach związanych z widzeniem
Dane wejściowe: 128 000
Wynik: 16 384
październik 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
Najnowszy mały model GA
- Szybki, niedrogi i wydajny model idealny do zastąpienia modeli serii GPT-3.5 Turbo.
- Tekst, przetwarzanie obrazów
- tryb JSON
- równoległe wywoływanie funkcji
Dane wejściowe: 128 000
Wynik: 16 384
październik 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Przetwarzanie tekstu, obrazu
- tryb JSON
- równoległe wywoływanie funkcji
- Zwiększona dokładność i responsywność
- Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision
- Wyjątkowa wydajność w językach innych niż angielski i w zadaniach związanych z widzeniem
Dane wejściowe: 128 000
Wyjście: 4,096
październik 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo z wizją
Nowy model GA
- Zastąpienie wszystkich poprzednich modelów podglądu GPT-4 (vision-preview, 1106-Preview, 0125-Preview).
- Dostępność funkcji jest obecnie różna w zależności od metody wprowadzania i typu wdrożenia.
Dane wejściowe: 128 000
Wyjście: 4,096
grudzień 2023
gpt-4-32k (0613) Starszy model GA
- Podstawowe wywoływanie funkcji z narzędziami
32,768 Wrzesień 2021 r.
gpt-4 (0613) Starszy model GA
- Podstawowe wywoływanie funkcji z narzędziami
8,192 Wrzesień 2021 r.
gpt-4-32k(0314) Starszy model GA
- Informacje o wycofaniu
32,768 Wrzesień 2021 r.
gpt-4 (0314) Starszy model GA
- Informacje o wycofaniu
8,192 Wrzesień 2021 r.

Ostrzeżenie

Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.

GPT-3.5

Modele GPT-3.5 potrafią rozumieć i generować tekst w języku naturalnym lub kod. Najbardziej zdolnym i ekonomicznym modelem w rodzinie GPT-3.5 jest GPT-3.5 Turbo, który został zoptymalizowany do rozmów i równie dobrze radzi sobie z zadaniami tradycyjnego dopełniania. GPT-3.5 Turbo jest dostępny do użytku z Chat Completions API. GPT-3.5 Turbo Instruct ma podobne możliwości jak text-davinci-003, korzystając z interfejsu API ukończeń, zamiast interfejsu API czatowych ukończeń. Zalecamy używanie GPT-3.5 Turbo i GPT-3.5 Turbo Instruct zamiast starszych modeli GPT-3.5 i GPT-3.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
gpt-35-turbo (0125) NOWY Najnowszy model GA
- tryb JSON
- równoległe wywoływanie funkcji
- powtarzalny wynik (podgląd)
- Wyższa dokładność w odpowiadaniu w żądanych formatach.
- Poprawka błędu, który powodował problem z kodowaniem tekstu dla wywołań funkcji w językach innych niż angielski.
Wejście: 16,385
Wyjście: 4,096
Wrzesień 2021 r.
gpt-35-turbo (1106) Starszy model GA
- tryb JSON
- równoległe wywoływanie funkcji
- powtarzalny wynik (podgląd)
Wejście: 16,385
Wyjście: 4,096
Wrzesień 2021 r.
gpt-35-turbo-instruct (0914) Tylko punkt końcowy uzupełniania
— Zastępowanie tradycyjnych modeli uzupełniania
4,097 Wrzesień 2021 r.

Aby dowiedzieć się więcej o interakcji z GPT-3.5 Turbo i API Chat Completions, zapoznaj się z naszym szczegółowym przewodnikiem.

1 Ten model będzie akceptować żądania > 4096 tokenów. Nie zaleca się przekraczania limitu 4,096 tokenów wejściowych, ponieważ nowsza wersja modelu jest ograniczona do 4,096 tokenów. Jeśli napotkasz problemy po przekroczeniu 4,096 tokenów wejściowych w tym modelu, ta konfiguracja nie jest oficjalnie wspierana.

Osadzanie

text-embedding-3-large jest najnowszym i najbardziej zaawansowanym modelem osadzania. Aktualizacja między modelami osadzeń jest niemożliwa. Aby przejść od korzystania z text-embedding-ada-002 do text-embedding-3-large, musisz wygenerować nowe osadzenia.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Podczas testów OpenAI informuje, że zarówno duże, jak i małe modele osadzeń trzeciej generacji oferują lepszą średnią wydajność w wielojęzycznym wyszukiwaniu, zgodnie z benchmarkiem MIRACL, jednocześnie utrzymując wydajność dla zadań w języku angielskim przy użyciu benchmarku MTEB.

Kryteria oceny text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL średnia 31,4 44.0 54.9
MTEB średnia 61.0 62.3 64.6

Modele osadzeń trzeciej generacji wspierają zmniejszanie rozmiaru osadzenia za pomocą nowego parametru dimensions. Zazwyczaj większe osadzanie jest droższe z perspektywy zasobów obliczeniowych, pamięci i magazynu. Możliwość dostosowania liczby wymiarów pozwala na lepszą kontrolę całkowitych kosztów i wydajności. Parametr dimensions nie jest obsługiwany we wszystkich wersjach biblioteki OpenAI 1.x dla Pythona. Aby skorzystać z tego parametru, zalecamy uaktualnienie do najnowszej wersji: pip install openai --upgrade.

Testy benchmarkowe OpenAI MTEB wykazały, że nawet gdy wymiary modelu trzeciej generacji zostaną zredukowane do mniej niż text-embeddings-ada-002 1,536, jego wydajność pozostaje nieco lepsza.

Modele generowania obrazów

Modele generowania obrazów generują obrazy z monitów tekstowych wyświetlanych przez użytkownika. GPT-image-1 ma ograniczony dostęp do publicznej wersji zapoznawczej. DALL-E 3 jest ogólnie dostępny do użytku z interfejsami API REST. DALL-E 2 i DALL-E 3 z SDK dla klientów są w wersji zapoznawczej.

Dostępność

gpt-image-1 Klienci, którzy mają dostęp do innych modeli ograniczonego dostępu, nadal będą musieli zażądać dostępu dla tego modelu.

Żądanie dostępu: gpt-image-1 aplikacja modelu ograniczonego dostępu

Po udzieleniu dostępu należy utworzyć wdrożenie dla modelu.

Dostępność regionu

Model Rejon
dall-e-3 Wschodnie stany USA
Australia Wschodnia
Szwecja Środkowa
gpt-image-1 Zachodnie USA 3 (Globalny standard)
Zjednoczone Emiraty Arabskie Północ (globalny standard)
Polska Środkowa (Globalny Standard)

Modele generowania wideo

Sora to model sztucznej inteligencji z platformy OpenAI, który może tworzyć realistyczne i pomysłowe sceny wideo na podstawie instrukcji tekstowych. Sora jest dostępna w publicznej wersji zapoznawczej.

Dostępność regionu

Model Rejon
sora Wschodnie stany USA 2

Modele audio

Modele audio w usłudze Azure OpenAI są dostępne za pośrednictwem realtime, completions i audio interfejsów API.

Modele audio GPT-4o

Modele audio GPT 4o są częścią rodziny modeli GPT-4o i obsługują interakcje konwersacyjne z niskimi opóźnieniami, typu "mowa na wejściu, mowa na wyjściu" oraz generowanie dźwięku.

Ostrzeżenie

Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.

Szczegóły dotyczące maksymalnej liczby żądań tokenów i danych treningowych znajdują się w poniższej tabeli.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
gpt-4o-mini-audio-preview (2024-12-17)
Dźwięk GPT-4o
Model audio do generowania dźwięku i tekstu. Dane wejściowe: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Dźwięk GPT-4o
Model audio do przetwarzania dźwięku w czasie rzeczywistym. Dane wejściowe: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-audio-preview (2024-12-17)
GPT-4o audio
Model audio do generowania dźwięku i tekstu. Dane wejściowe: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-realtime-preview (2024-12-17)
Dźwięk GPT-4o
Model audio do przetwarzania dźwięku w czasie rzeczywistym. Dane wejściowe: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Dźwięk GPT-4o
Model audio do przetwarzania dźwięku w czasie rzeczywistym. Dane wejściowe: 128 000
Wyjście: 4,096
październik 2023

Aby porównać dostępność modeli audio GPT-4o we wszystkich regionach, zobacz tabelę modeli.

Audio API

Modele audio za pośrednictwem interfejsu /audio API mogą służyć do zamiany mowy na tekst, tłumaczenie i zamianę tekstu na mowę.

Modele zamiany mowy na tekst

Identyfikator modelu Opis Maksymalna prośba (rozmiar pliku audio)
whisper Model rozpoznawania mowy ogólnego przeznaczenia. 25 MB
gpt-4o-transcribe Zamiana mowy na tekst napędzana przez GPT-4o. 25 MB
gpt-4o-mini-transcribe Przekształcanie mowy na tekst zasilane przez GPT-4o mini. 25 MB

Modele tłumaczenia mowy

Identyfikator modelu Opis Maksymalna prośba (rozmiar pliku audio)
whisper Model rozpoznawania mowy ogólnego przeznaczenia. 25 MB

Modele przetwarzania tekstu na mowę (wersja zapoznawcza)

Identyfikator modelu Opis
tts Tekst mowy zoptymalizowany pod kątem szybkości.
tts-hd Optymalizacja jakości dla przetwarzania tekstu na mowę.
gpt-4o-mini-tts Model zamiany tekstu na głos zasilany przez GPT-4o mini.

Możesz kontrolować głos, aby mówił w pewnym stylu lub tonie.

Aby uzyskać więcej informacji, zobacz Dostępność regionów modeli audio w tym artykule.

Tabela podsumowania modelu i dostępność regionu

Modele według typu wdrożenia

Azure OpenAI oferuje klientom wybór struktury hostingu, która odpowiada ich potrzebom biznesowym i wzorcowym użytkowania. Usługa oferuje dwa główne typy wdrożeń:

  • Standard jest oferowany z opcją globalnego wdrożenia, kierując ruch globalnie w celu zapewnienia wyższej przepustowości.
  • Provisioned jest również oferowane z opcją wdrażania na skalę globalną, dzięki czemu klienci mogą kupować i wdrażać przydzielone jednostki przepustowości w globalnej infrastrukturze Azure.

Wszystkie wdrożenia mogą wykonywać dokładnie te same operacje predykcyjne, jednak rozliczenia, skala i wydajność są znacznie odmienne. Aby dowiedzieć się więcej o typach wdrożeń Azure OpenAI, zobacz nasz przewodnik po typach wdrożeń.

Globalna dostępność standardowego modelu

Region o3-pro, 2025-06-10 codex-mini, 2025-05-16 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 podgląd-użytkowania-komputera, 2025-03-11 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transkrypcja, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transkrypcja, 2025-03-20
AustraliaEast - - - - - - - - - - - - - - - - - -
Brazylia Południe - - - - - - - - - - - - - - - - -
wschód Kanady - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - -
Niemcy Zachodnio-Środkowe - - - - - - - - - - - - - - - - -
północne Włochy - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - - -
Norwegia Wschód - - - - - - - - - - - - - - - - - -
polandcentral - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
południowe Indie - - - - - - - - - - - - - - - - -
Hiszpania Centralna - - - - - - - - - - - - - - - - -
swedencentral - - -
Szwajcaria Północ - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - -
Europa Zachodnia - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - -

Uwaga / Notatka

o1-mini jest obecnie dostępne dla wszystkich klientów do globalnego standardowego wdrożenia.

Wybrani klienci otrzymali standardowy (regionalny) dostęp do wdrożenia o1-mini w ramach ograniczonego dostępu o1-preview. W tej chwili dostęp do o1-mini standardowych (regionalnych) wdrożeń nie jest rozszerzany.

Ta tabela nie zawiera informacji o dostępności regionalnej w ramach dostrajania. Aby uzyskać te informacje, zapoznaj się z sekcją dostrajania .

Standardowe modele wdrażania (regionalne) według punktu końcowego

Ukończenie czatu

Region o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
AustraliaEast - - - - - -
wschód Kanady - - - - - -
eastus -
eastus2 -
francecentral - - - - - -
japaneast - - - - - - -
northcentralus -
Norwegia Wschód - - - - - - - -
southcentralus -
południowe Indie - - - - - -
swedencentral
Szwajcaria Północ - - - - - - -
uksouth - - - - - -
Europa Zachodnia - - - - - - - -
westus
westus3 -

Uwaga / Notatka

o1-mini jest obecnie dostępne dla wszystkich klientów do globalnego standardowego wdrożenia.

Wybrani klienci otrzymali standardowy (regionalny) dostęp do wdrożenia o1-mini w ramach ograniczonego dostępu o1-preview. W tej chwili dostęp do o1-mini standardowych (regionalnych) wdrożeń nie jest rozszerzany.

Dostępność modeli GPT-4 i GPT-4 Turbo

Wybierz dostęp klienta

Oprócz wspomnianych wyżej regionów, które są dostępne dla wszystkich klientów Azure OpenAI, niektórzy wybrani i już istniejący klienci otrzymali dostęp do wersji GPT-4 w dodatkowych regionach.

Model Rejon
gpt-4 (0314)
gpt-4-32k (0314)
Wschodnie USA
Francja Środkowa
Południowo-Centralne Stany Zjednoczone
Południowe Zjednoczone Królestwo
gpt-4 (0613)
gpt-4-32k (0613)
Wschodnie USA
Wschodnie stany USA 2
Japonia Wschodnia
Południowe Zjednoczone Królestwo

modele GPT-3.5

Zobacz wersje modelu, aby dowiedzieć się, jak usługa Azure OpenAI obsługuje uaktualnienia wersji modelu, i pracę z modelami, aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu wdrożeń GPT-3.5 Turbo.

Dostrajanie modeli

Uwaga / Notatka

gpt-35-turbo - Dostrajanie tego modelu jest ograniczone do podzbioru regionów i nie jest dostępne we wszystkich regionach, w których dostępny jest model podstawowy.

Obsługiwane regiony dla dostrajania mogą się różnić, jeśli używasz modeli Azure OpenAI w projekcie Azure AI Foundry w porównaniu z używaniem ich poza projektem.

Identyfikator modelu Standardowe regiony trenowania Szkolenie globalne (wersja zapoznawcza) Maksymalne żądanie (żetony) Dane treningowe (do) Modalność
gpt-35-turbo (1106) Wschodnie USA2
Północno-centralna część USA
Szwecja Środkowa
Szwajcaria Zachodnia
- Wejście: 16,385
Wyjście: 4,096
Wrzesień 2021 r. Tekst do tekstu
gpt-35-turbo (0125) Wschodnie USA2
Północno-centralna część USA
Szwecja Środkowa
Szwajcaria Zachodnia
- 16,385 Wrzesień 2021 r. Tekst do tekstu
gpt-4o-mini (2024-07-18) Północno-centralna część USA
Szwecja Środkowa
- Dane wejściowe: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
październik 2023 Tekst do tekstu
gpt-4o (2024-08-06) Wschodnie USA2
Północno-centralna część USA
Szwecja Środkowa
- Dane wejściowe: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
październik 2023 Tekst i obraz do tekstu
gpt-4.1 (2025-04-14) Północno-centralna część USA
Szwecja Środkowa
Dane wejściowe: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
maj 2024 Tekst i obraz do tekstu
gpt-4.1-mini (2025-04-14) Północno-centralna część USA
Szwecja Środkowa
Dane wejściowe: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
maj 2024 Tekst do tekstu
gpt-4.1-nano (2025-04-14) Północno-centralna część USA
Szwecja Środkowa
- Dane wejściowe: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 32 768
maj 2024 Tekst do tekstu
o4-mini (2025-04-16) Wschodnie USA2
Szwecja Środkowa
- Dane wejściowe: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
maj 2024 Tekst do tekstu

Uwaga / Notatka

Globalne szkolenie (w publicznej wersji zapoznawczej) zapewnia bardziej przystępne cenowo szkolenie na token, ale nie oferuje miejsca przechowywania danych. Obecnie jest ona dostępna dla zasobów usługi Azure OpenAI w następujących regionach, a wkrótce pojawi się więcej regionów:

  • Australia Wschodnia
  • Brazylia Południowa
  • Wschodnie stany USA
  • Wschodnie stany USA 2
  • Francja Środkowa
  • Niemcy Środkowo-Zachodnie
  • Włochy Północne
  • Japonia Wschodnia (brak wsparcia widzenia)
  • Korea Środkowa
  • Północno-środkowe stany USA
  • Norwegia Wschodnia
  • Polska Środkowa
  • Azja Południowo-Wschodnia
  • Północna Republika Południowej Afryki
  • Południowo-środkowe stany USA
  • Hiszpania Środkowa
  • Szwecja Środkowa
  • Szwajcaria Zachodnia
  • Szwajcaria Północna
  • Południowe Zjednoczone Królestwo
  • Europa Zachodnia
  • Zachodnie stany USA
  • Zachód USA 3

Asystenci (Podgląd)

Aby korzystać z Asystentów, potrzebujesz połączenia obsługiwanego modelu i obsługiwanego regionu. Niektóre narzędzia i możliwości wymagają najnowszych modeli. Następujące modele są dostępne w Assistants API, SDK i Azure AI Foundry. Poniższa tabela dotyczy standardowego wdrożenia. Aby uzyskać informacje na temat dostępności aprowizowanych jednostek przepływności (PTU), zobacz przepływność aprowizowana. Wymienione modele i regiony mogą być używane z obydwoma Asystentami v1 i v2. Możesz używać globalnych modeli standardowych, jeśli są obsługiwane w wymienionych poniżej regionach.

Region gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
AustraliaEast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Norwegia Wschód - - - - - - - - - - -
południowe Indie - - - - - - - - -
swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Emerytura modelowa

Aby uzyskać najnowsze informacje na temat wycofywania modeli, zapoznaj się z przewodnikiem dotyczącym wycofywania modeli.

Dalsze kroki