Udostępnij za pośrednictwem


Azure OpenAI w modelach rozwiązania Azure AI Foundry

Usługa Azure OpenAI jest obsługiwana przez zróżnicowany zestaw modeli z różnymi możliwościami i punktami cenowymi. Dostępność modelu różni się w zależności od regionu i chmury. Aby uzyskać informacje o dostępności modelu platformy Azure Government, zobacz Azure Government OpenAI Service.

Modele Opis
codex-mini Dostrojona wersja o4-mini.
Seria GPT-4.1 Najnowsze wydanie modelu od Azure OpenAI
model-router Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit.
podgląd użytkowania komputera Eksperymentalny model szkolony do użytku z narzędziem komputerowym Responses API.
GPT-4.5 (wersja zapoznawcza) Najnowszy model GPT, który wyróżnia się w różnorodnych zadaniach tekstowych i obrazowych.
modele serii O Modele rozumowania z zaawansowanym rozwiązywaniem problemów i zwiększeniem koncentracji uwagi i możliwości.
GPT-4o & GPT-4o mini & GPT-4 Turbo Najnowsze, najbardziej zaawansowane modele Azure OpenAI w wersjach multimodalnych, które mogą przyjmować zarówno tekst, jak i obrazy jako dane wejściowe.
GPT-4 Zestaw modeli, które ulepszają GPT-3.5 i potrafią rozumieć oraz generować język naturalny i kod.
GPT-3.5 Zestaw modeli, które poprawiają się względem GPT-3 i potrafią rozumieć oraz generować naturalny język i kod.
Osadzanie Zestaw modeli, które mogą przekształcać tekst w numeryczną formę wektora, aby ułatwić podobieństwo tekstu.
Generowanie obrazu Seria modeli, które mogą generować oryginalne obrazy z języka naturalnego.
Dźwięk Szereg modeli do zamiany mowy na tekst, tłumaczenia i zamiany tekstu na mowę. Modele audio GPT-4o obsługują niskie opóźnienia, "mowa jako wejście, mowa jako wyjście" dla interakcji konwersacyjnych lub generowanie dźwięku.

Seria GPT 4.1

Dostępność w regionie

Model Rejon
gpt-4.1 (2025-04-14) Zobacz tabelę modeli.
gpt-4.1-nano (2025-04-14) Zobacz tabelę modeli.
gpt-4.1-mini (2025-04-14) Zobacz tabelę modeli.

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
gpt-4.1 (2025-04-14) - Wprowadzanie tekstu i obrazów
- Wyjście tekstowe
- API ukończeń czatu
Interfejs API dla odpowiedzi
-Przesyłanie strumieniowe
- Wywołanie funkcji
Ustrukturyzowane dane wyjściowe (ukończone rozmowy)
- 1,047,576
- 128 000 (aprowizowania wdrożeń zarządzanych)
- 300 000 (batchowe wdrożenia)
32,768 31 maja 2024 r.
gpt-4.1-nano (2025-04-14) - Wprowadzanie tekstu i obrazów
- Wyjście tekstowe
- API ukończeń czatu
Interfejs API dla odpowiedzi
-Przesyłanie strumieniowe
- Wywołanie funkcji
Ustrukturyzowane dane wyjściowe (ukończone rozmowy)
- 1,047,576
- 128 000 (aprowizowania wdrożeń zarządzanych)
- 300 000 (batchowe wdrożenia)
32,768 31 maja 2024 r.
gpt-4.1-mini (2025-04-14) - Wprowadzanie tekstu i obrazów
- Wyjście tekstowe
- API ukończeń czatu
Interfejs API dla odpowiedzi
-Przesyłanie strumieniowe
- Wywołanie funkcji
Ustrukturyzowane dane wyjściowe (ukończone rozmowy)
- 1,047,576
- 128 000 (aprowizowania wdrożeń zarządzanych)
- 300 000 (batchowe wdrożenia)
32,768 31 maja 2024 r.

model routera

Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit.

Dostępność w regionie

Model Rejon
model-router (2025-05-19) Wschodnie USA 2 (Globalny standard), Szwecja Centralna (Globalny standard)

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
model-router (2025-05-19) Model, który inteligentnie wybiera zestaw podstawowych modeli czatów, aby reagować na dany monit. 200,000* 32768 (seria GPT 4.1)
100 K (o4-mini)
31 maja 2024 r.

*Większe okna kontekstowe są zgodne z niektórymi podstawowymi modelami, co oznacza, że wywołanie interfejsu API z większym kontekstem powiedzie się tylko wtedy, gdy monit zostanie skierowany do odpowiedniego modelu, w przeciwnym razie wywołanie zakończy się niepowodzeniem.

podgląd użycia komputera

Eksperymentalny model opracowany do użytku z narzędziem komputerowym API odpowiedzi. Może być używany w połączeniu z bibliotekami stron trzecich, aby umożliwić modelowi kontrolowanie wejścia z klawiatury i myszy przy jednoczesnym uzyskiwaniu kontekstu z zrzutów ekranu bieżącego środowiska.

Uwaga

Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.

Dostępność

computer-use-preview Klienci, którzy mają dostęp do innych modeli ograniczonego dostępu, nadal będą musieli zażądać dostępu dla tego modelu.

Żądanie dostępu: computer-use-preview aplikacja modelu ograniczonego dostępu

Po udzieleniu dostępu należy utworzyć wdrożenie dla modelu.

Dostępność w regionie

Model Rejon
computer-use-preview Zobacz tabelę modeli.

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
computer-use-preview (2025-03-11) Wyspecjalizowany model do użycia z narzędziem związanym z interfejsem API odpowiedzi

-Narzędzia
-Transmisja strumieniowa
-Tekst (wejście/wyjście)
- Obraz(wejście)
8,192 1,024 październik 2023

GPT-4.5 (wersja zapoznawcza)

Dostępność w regionie

Model Rejon
gpt-4.5-preview Zobacz tabelę modeli.

Możliwości

Identyfikator modelu Opis Okno kontekstu Maksymalna liczba tokenów wyjściowych Dane treningowe (do)
gpt-4.5-preview (2025-02-27)
GPT-4.5 (wersja zapoznawcza)
GPT 4.1 jest zalecanym zamiennikiem tego modelu. Doskonale radzi sobie z różnorodnymi zadaniami związanymi z tekstem i obrazami.
- Dane wyjściowe ze strukturą
— Buforowanie monitów
-Narzędzia
-Streamowanie
- Tekst(input/output)
- Obraz(wejście)
128,000 16,384 październik 2023

Uwaga

To normalne, że model nie potrafi odpowiadać na pytania dotyczące samego siebie. Jeśli chcesz wiedzieć, kiedy dane treningowe modelu zostały zaktualizowane, lub poznać inne szczegóły dotyczące modelu, powinieneś zapoznać się z dokumentacją modelu powyżej.

modele o-serii

Modele z serii Azure OpenAI o* są specjalnie zaprojektowane do rozwiązywania zadań związanych z rozumowaniem i rozwiązywaniem problemów, zapewniając zwiększoną koncentrację i zdolności. Te modele spędzają więcej czasu na przetwarzaniu i zrozumieniu zapytania użytkownika, co sprawia, że są wyjątkowo silne w dziedzinach takich jak nauka, kodowanie i matematyka, w porównaniu z poprzednimi iteracjami.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
codex-mini (2025-05-16) Dostrojona wersja o4-mini.
- API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Pełne podsumowanie możliwości
Input: 200 000
Wynik: 100 000
31 maja 2024 r.
o3-pro (2025-06-10) - API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Pełne podsumowanie możliwości
Input: 200 000
Wynik: 100 000
31 maja 2024 r.
o4-mini (2025-04-16) - NOWY model rozumowania, oferując ulepszone możliwości rozumowania.

API uzupełniania konwersacji
- API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Pełne podsumowanie możliwości
Input: 200 000
Wynik: 100 000
31 maja 2024 r.
o3 (2025-04-16) - NOWY model rozumowania, oferując ulepszone możliwości rozumowania.

API uzupełniania konwersacji
- API odpowiedzi
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia/Wywoływanie narzędzi równoległych
Pełne podsumowanie możliwości
Input: 200 000
Wynik: 100 000
31 maja 2024 r.
o3-mini (2025-01-31) - Ulepszone możliwości rozumowania.
- Strukturalne wyniki
- Przetwarzanie tylko tekstu
- Funkcje/Narzędzia
Input: 200 000
Wynik: 100 000
październik 2023
o1 (2024-12-17) - Ulepszone możliwości rozumowania.
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- Funkcje/Narzędzia
Input: 200 000
Wynik: 100 000
październik 2023
o1-preview (2024-09-12) Starsza wersja podglądowa Input: 128 000
Dane wyjściowe: 32 768
październik 2023
o1-mini (2024-09-12) Szybsza i bardziej opłacalna opcja z serii o1, idealna do zadań programistycznych wymagających szybkości i niższego zużycia zasobów.

Globalne wdrożenie standardowe dostępne domyślnie.

Standardowe (regionalne) wdrożenia są obecnie dostępne tylko dla wybranych klientów, którzy otrzymali dostęp w ramach limitowanego wydania o1-preview.
Input: 128 000
Dane wyjściowe: 65 536
październik 2023

Dostępność

Aby dowiedzieć się więcej o zaawansowanych o-series modelach, zobacz Wprowadzenie do modeli rozumowania.

Dostępność w regionie

Model Rejon
codex-mini Wschodnie stany USA2 i Szwecja Środkowa (Standardowa globalna)
o3-pro Wschodnie stany USA2 i Szwecja Środkowa (Standardowa globalna)
o4-mini Zobacz tabelę modeli.
o3 Zobacz tabelę modeli.
o3-mini Zobacz tabelę modeli.
o1 Zobacz tabelę modeli.
o1-preview Zobacz tabelę modeli. Ten model jest dostępny tylko dla klientów, którym przyznano dostęp w ramach oryginalnego ograniczonego dostępu.
o1-mini Zobacz tabelę modeli.

GPT-4o i GPT-4 Turbo

GPT-4o integruje tekst i obrazy w jednym modelu, co umożliwia mu jednoczesne przetwarzanie wielu typów danych. To podejście multimodalne zwiększa dokładność i szybkość reakcji w interakcjach człowiek-komputer. GPT-4o dorównuje GPT-4 Turbo w zadaniach związanych z tekstem angielskim i kodowaniem, oferując jednocześnie lepszą wydajność w językach innych niż angielski oraz w zadaniach związanych z wizją, wyznaczając nowe standardy dla możliwości AI.

Jak uzyskać dostęp do modeli GPT-4o i GPT-4o mini?

GPT-4o i GPT-4o mini są dostępne dla standardowego i globalnego standardu wdrożenia modelu.

Musisz utworzyć lub użyć istniejącego zasobu w obsługiwanym regionie standardowym lub globalnym, w którym jest dostępny model.

Po utworzeniu zasobu można wdrożyć modele GPT-4o. Jeśli przeprowadzasz wdrożenie programowe, nazwy modelu to:

  • gpt-4o Wersja2024-11-20
  • gpt-4o Wersja2024-08-06
  • gpt-4o Wersja2024-05-13
  • gpt-4o-mini Wersja2024-07-18

GPT-4 Turbo

GPT-4 Turbo to duży model multimodalny, który przyjmuje dane wejściowe w postaci tekstu lub obrazu i generuje tekst, potrafiący rozwiązywać trudne problemy z większą dokładnością niż jakiekolwiek poprzednie modele OpenAI. Podobnie jak GPT-3.5 Turbo i starsze modele GPT-4, GPT-4 Turbo jest zoptymalizowany do rozmów i dobrze sprawdza się w tradycyjnych zadaniach ukończenia.

GPT-4

GPT-4 jest poprzednikiem GPT-4 Turbo. Zarówno modele GPT-4, jak i GPT-4 Turbo mają nazwę modelu bazowego gpt-4. Możesz odróżnić modele GPT-4 od Turbo, sprawdzając wersję modelu.

  • gpt-4 Wersja0314
  • gpt-4 Wersja0613
  • gpt-4-32k Wersja0613

Długość kontekstu tokenu obsługiwana przez poszczególne modele można zobaczyć w tabeli podsumowania modelu.

GPT-4 i GPT-4 Turbo modele

  • Te modele można używać tylko z Chat Completion API.

Zobacz wersje modelu aby dowiedzieć się, jak usługa Azure OpenAI obsługuje uaktualnienia wersji modelu, i zobacz współpracę z modelami, aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu dla wdrożeń GPT-4.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Najnowszy duży model algorytmu genetycznego
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- tryb JSON
- równoległe wywoływanie funkcji
- Zwiększona dokładność i responsywność
- Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision
- Wyjątkowa wydajność w językach nieromance oraz w zadaniach związanych z wizją.
- Ulepszona umiejętność pisania twórczego
Input: 128 000
Wynik: 16 384
październik 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Strukturalne wyniki
- Tekst, przetwarzanie obrazów
- tryb JSON
- równoległe wywoływanie funkcji
- Zwiększona dokładność i responsywność
- Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision
- Wyjątkowa wydajność w językach innych niż angielski i w zadaniach związanych z widzeniem
Input: 128 000
Wynik: 16 384
październik 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
Najnowszy mały model GA
- Szybki, niedrogi i wydajny model idealny do zastąpienia modeli serii GPT-3.5 Turbo.
- Tekst, przetwarzanie obrazów
- tryb JSON
- równoległe wywoływanie funkcji
Input: 128 000
Wynik: 16 384
październik 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Przetwarzanie tekstu, obrazu
- tryb JSON
- równoległe wywoływanie funkcji
- Zwiększona dokładność i responsywność
- Parytet z angielskim tekstem i zadaniami programistycznymi w porównaniu do GPT-4 Turbo with Vision
- Wyjątkowa wydajność w językach innych niż angielski i w zadaniach związanych z widzeniem
Input: 128 000
Wyjście: 4,096
październik 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo z wizją
Nowy model GA
- Zastąpienie wszystkich poprzednich modelów podglądu GPT-4 (vision-preview, 1106-Preview, 0125-Preview).
- Dostępność funkcji jest obecnie różna w zależności od metody danych wejściowych i typu wdrożenia.
Input: 128 000
Wyjście: 4,096
grudzień 2023
gpt-4-32k (0613) Starszy model GA
- Podstawowe wywoływanie funkcji z narzędziami
32,768 Wrzesień 2021 r.
gpt-4 (0613) Starszy model GA
- Podstawowe wywoływanie funkcji z narzędziami
8,192 Wrzesień 2021 r.
gpt-4-32k(0314) Starszy model GA
- Informacje o wycofaniu
32,768 Wrzesień 2021 r.
gpt-4 (0314) Starszy model GA
- Informacje o wycofaniu
8,192 Wrzesień 2021 r.

Uwaga

Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.

GPT-3.5

Modele GPT-3.5 potrafią rozumieć i generować tekst w języku naturalnym lub kod. Najbardziej zdolnym i ekonomicznym modelem w rodzinie GPT-3.5 jest GPT-3.5 Turbo, który został zoptymalizowany do rozmów i równie dobrze radzi sobie z zadaniami tradycyjnego dopełniania. GPT-3.5 Turbo jest dostępny do użytku z Chat Completions API. GPT-3.5 Turbo Instruct ma podobne możliwości jak text-davinci-003, korzystając z interfejsu API ukończeń, zamiast interfejsu API czatowych ukończeń. Zalecamy używanie GPT-3.5 Turbo i GPT-3.5 Turbo Instruct zamiast starszych modeli GPT-3.5 i GPT-3.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
gpt-35-turbo (0125) NOWY Najnowszy model GA
- tryb JSON
- równoległe wywoływanie funkcji
- powtarzalny wynik (podgląd)
- Wyższa dokładność w odpowiadaniu w żądanych formatach.
- Poprawka błędu, który powodował problem z kodowaniem tekstu dla wywołań funkcji w językach innych niż angielski.
Wejście: 16,385
Wyjście: 4,096
Wrzesień 2021 r.
gpt-35-turbo (1106) Starszy model ga
- tryb JSON
- równoległe wywoływanie funkcji
- powtarzalny wynik (podgląd)
Wejście: 16,385
Wyjście: 4,096
Wrzesień 2021 r.
gpt-35-turbo-instruct (0914) Tylko punkt końcowy uzupełniania
— Zastępowanie starszych modeli uzupełniania
4,097 Wrzesień 2021 r.

Aby dowiedzieć się więcej o interakcji z GPT-3.5 Turbo i API Chat Completions, zapoznaj się z naszym szczegółowym przewodnikiem.

1 Ten model będzie akceptować żądania > 4096 tokenów. Nie zaleca się przekraczania limitu 4,096 tokenów wejściowych, ponieważ nowsza wersja modelu jest ograniczona do 4,096 tokenów. Jeśli napotkasz problemy po przekroczeniu 4,096 tokenów wejściowych w tym modelu, ta konfiguracja nie jest oficjalnie wspierana.

Zakotwiczenia

text-embedding-3-large jest najnowszym i najbardziej zaawansowanym modelem osadzania. Aktualizacja między modelami osadzeń jest niemożliwa. Aby przejść od korzystania z text-embedding-ada-002 do text-embedding-3-large, musisz wygenerować nowe osadzenia.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Podczas testowania raporty OpenAI wskazują, że zarówno duże, jak i małe modele osadzania trzeciej generacji oferują lepszą średnią wydajność w zakresie wyszukiwania wielojęzykowego z benchmarkiem MIRACL, z jednoczesnym utrzymaniem wydajności dla zadań w języku angielskim z benchmarkiem MTEB.

Kryteria oceny text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL średnia 31,4 44.0 54.9
MTEB średnia 61.0 62.3 64.6

Modele osadzeń trzeciej generacji wspierają zmniejszanie rozmiaru osadzenia za pomocą nowego parametru dimensions. Zazwyczaj większe osadzenia są droższe z punktu widzenia obliczeń, pamięci i przechowywania. Możliwość dostosowania liczby wymiarów pozwala na lepszą kontrolę całkowitych kosztów i wydajności. Parametr dimensions nie jest obsługiwany we wszystkich wersjach biblioteki OpenAI 1.x dla Pythona. Aby skorzystać z tego parametru, zalecamy uaktualnienie do najnowszej wersji: pip install openai --upgrade.

Testy benchmarkowe OpenAI MTEB wykazały, że nawet gdy wymiary modelu trzeciej generacji zostaną zredukowane do mniej niż text-embeddings-ada-002 1,536, jego wydajność pozostaje nieco lepsza.

Modele generowania obrazów

Modele generowania obrazów generują obrazy z monitów tekstowych wyświetlanych przez użytkownika. GPT-image-1 ma ograniczony dostęp do publicznej wersji zapoznawczej. DALL-E 3 jest ogólnie dostępny do użytku z interfejsami API REST. DALL-E 2 i DALL-E 3 z SDK dla klientów są w wersji zapoznawczej.

Dostępność

gpt-image-1 Klienci, którzy mają dostęp do innych modeli ograniczonego dostępu, nadal będą musieli zażądać dostępu dla tego modelu.

Żądanie dostępu: gpt-image-1 aplikacja modelu ograniczonego dostępu

Po udzieleniu dostępu należy utworzyć wdrożenie dla modelu.

Dostępność w regionie

Model Rejon
dall-e-3 Wschodnie USA
Australia Wschodnia
Szwecja Środkowa
gpt-image-1 Zachodnie USA 3 (Globalny standard)
Północne Zjednoczone Emiraty Arabskie (globalny standard)

Modele generowania wideo

Sora to model sztucznej inteligencji z platformy OpenAI, który może tworzyć realistyczne i pomysłowe sceny wideo na podstawie instrukcji tekstowych. Sora jest dostępna w publicznej wersji zapoznawczej.

Dostępność w regionie

Model Rejon
sora Wschodnie stany USA 2

Modele audio

Modele audio w usłudze Azure OpenAI są dostępne za pośrednictwem realtime, completions i audio interfejsów API.

Modele audio GPT-4o

Modele audio GPT 4o są częścią rodziny modeli GPT-4o i obsługują interakcje konwersacyjne z niskimi opóźnieniami, typu "mowa na wejściu, mowa na wyjściu" oraz generowanie dźwięku.

Uwaga

Nie zalecamy używania modeli podglądu w produkcji. Zaktualizujemy wszystkie wdrożenia modeli testowych do przyszłych wersji testowych lub do najnowszej stabilnej wersji GA. Modele oznaczone jako wersja zapoznawcza nie przestrzegają standardowego cyklu życia modelu Azure OpenAI.

Szczegóły dotyczące maksymalnej liczby żądań tokenów i danych treningowych znajdują się w poniższej tabeli.

Identyfikator modelu Opis Maksymalna liczba żądań (tokeny) Dane treningowe (do)
gpt-4o-mini-audio-preview (2024-12-17)
Dźwięk GPT-4o
Model audio na potrzeby generowania dźwięku i tekstu. Input: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Dźwięk GPT-4o
Model audio do przetwarzania dźwięku w czasie rzeczywistym. Input: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-audio-preview (2024-12-17)
Dźwięk GPT-4o
Model audio na potrzeby generowania dźwięku i tekstu. Input: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-realtime-preview (2024-12-17)
Dźwięk GPT-4o
Model audio do przetwarzania dźwięku w czasie rzeczywistym. Input: 128 000
Wyjście: 4,096
październik 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Dźwięk GPT-4o
Model audio do przetwarzania dźwięku w czasie rzeczywistym. Input: 128 000
Wyjście: 4,096
październik 2023

Aby porównać dostępność modeli audio GPT-4o we wszystkich regionach, zobacz tabelę modeli.

Audio API

Modele audio za pośrednictwem interfejsu /audio API mogą służyć do zamiany mowy na tekst, tłumaczenie i zamianę tekstu na mowę.

Modele zamiany mowy na tekst

Identyfikator modelu Opis Maksymalna prośba (rozmiar pliku audio)
whisper Model rozpoznawania mowy ogólnego przeznaczenia. 25 MB
gpt-4o-transcribe Zamiana mowy na tekst napędzana przez GPT-4o. 25 MB
gpt-4o-mini-transcribe Przekształcanie mowy na tekst zasilane przez GPT-4o mini. 25 MB

Modele tłumaczenia mowy

Identyfikator modelu Opis Maksymalna prośba (rozmiar pliku audio)
whisper Model rozpoznawania mowy ogólnego przeznaczenia. 25 MB

Modele przetwarzania tekstu na mowę (wersja zapoznawcza)

Identyfikator modelu Opis
tts Tekst mowy zoptymalizowany pod kątem szybkości.
tts-hd Optymalizacja jakości dla przetwarzania tekstu na mowę.
gpt-4o-mini-tts Model zamiany tekstu na głos zasilany przez GPT-4o mini.

Możesz kontrolować głos, aby mówił w pewnym stylu lub tonie.

Aby uzyskać więcej informacji, zobacz Dostępność regionów modeli audio w tym artykule.

Tabela podsumowania modelu i dostępność regionu

Modele według typu wdrożenia

Azure OpenAI oferuje klientom wybór struktury hostingu, która odpowiada ich potrzebom biznesowym i wzorcowym użytkowania. Usługa oferuje dwa główne typy wdrożeń:

  • Standard jest oferowany z opcją globalnego wdrażania, globalnie kierując ruchem, zapewniając większą przepustowość.
  • Aprowizowanie jest również oferowane za pomocą globalnej opcji wdrażania, dzięki czemu klienci mogą kupować i wdrażać aprowizowane jednostki przepływności w globalnej infrastrukturze platformy Azure.

Wszystkie wdrożenia mogą wykonywać dokładnie te same operacje wnioskowania, jednak rozliczenia, skala i wydajność są znacznie różne. Aby dowiedzieć się więcej na temat typów wdrożeń usługi Azure OpenAI, zobacz przewodnik dotyczący typów wdrożeń.

Globalna dostępność standardowego modelu

Region o3-pro, 2025-06-10 codex-mini, 2025-05-16 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 podgląd-użytkowania-komputera, 2025-03-11 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 ** text-embedding-3-small, 1 Text Embedding 3 Large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transkrypcja, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transkrypcja, 2025-03-20
AustraliaEast - - - - - - - - - - - - - - - - - -
Brazylia Południe - - - - - - - - - - - - - - - - -
Wschodnia Kanada - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - -
Niemcy Zachodnio-Środkowe - - - - - - - - - - - - - - - - -
północne Włochy - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - -
Północno-Centralny - - - - - - - - - - - - - - -
Norwegia Wschód - - - - - - - - - - - - - - - - - -
polandcentral - - - - - - - - - - - - - - - - - -
Republika Południowej Afrykipółnocny - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
Południowe Indie - - - - - - - - - - - - - - - - -
Hiszpania Centralna - - - - - - - - - - - - - - - - -
swedencentral - - -
Północ Szwajcarii - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - -
Południowa Anglia - - - - - - - - - - - - - - - - -
Europa Zachodnia - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - -

Uwaga

o1-mini jest obecnie dostępne dla wszystkich klientów do globalnego standardowego wdrożenia.

Wybrani klienci otrzymali standardowy (regionalny) dostęp do wdrożenia o1-mini w ramach ograniczonego dostępu o1-preview. W tej chwili dostęp do o1-mini standardowych (regionalnych) wdrożeń nie jest rozszerzany.

Ta tabela nie zawiera informacji o dostępności regionalnej w ramach dostrajania. Aby uzyskać te informacje, zapoznaj się z sekcją dostrajania .

Standardowe modele wdrażania (regionalne) według punktu końcowego

Ukończenia czatu

Region o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
AustraliaEast - - - - - -
Wschodnia Kanada - - - - - -
eastus -
eastus2 -
francecentral - - - - - -
japaneast - - - - - - -
Północno-Centralny -
Norwegia Wschód - - - - - - - -
southcentralus -
Południowe Indie - - - - - -
swedencentral
Północ Szwajcarii - - - - - - -
Południowa Anglia - - - - - -
Europa Zachodnia - - - - - - - -
westus
westus3 -

Uwaga

o1-mini jest obecnie dostępne dla wszystkich klientów do globalnego standardowego wdrożenia.

Wybrani klienci otrzymali standardowy (regionalny) dostęp do wdrożenia o1-mini w ramach ograniczonego dostępu o1-preview. W tej chwili dostęp do o1-mini standardowych (regionalnych) wdrożeń nie jest rozszerzany.

Dostępność modeli GPT-4 i GPT-4 Turbo

Wybierz dostęp klienta

Oprócz wspomnianych wyżej regionów, które są dostępne dla wszystkich klientów Azure OpenAI, niektórzy wybrani i już istniejący klienci otrzymali dostęp do wersji GPT-4 w dodatkowych regionach.

Model Rejon
gpt-4 (0314)
gpt-4-32k (0314)
Wschodnie USA
Francja Centralna
Południowo-Centralne Stany Zjednoczone
Południe Wielkiej Brytanii
gpt-4 (0613)
gpt-4-32k (0613)
Wschodnie USA
Wschód USA 2
Wschodnia Japonia
Południe Wielkiej Brytanii

modele GPT-3.5

Zobacz wersje modelu, aby dowiedzieć się, jak usługa Azure OpenAI obsługuje uaktualnienia wersji modelu, i pracę z modelami, aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu wdrożeń GPT-3.5 Turbo.

Dostrajanie modeli

Uwaga

gpt-35-turbo - Dostrajanie tego modelu jest ograniczone do podzbioru regionów i nie jest dostępne we wszystkich regionach, w których dostępny jest model podstawowy.

Obsługiwane regiony dla dostrajania mogą się różnić, jeśli używasz modeli Azure OpenAI w projekcie Azure AI Foundry w porównaniu z używaniem ich poza projektem.

Identyfikator modelu Standardowe regiony trenowania Szkolenie globalne (wersja zapoznawcza) Maksymalne żądanie (żetony) Dane treningowe (do) Modalność
gpt-35-turbo (1106) Wschodnie USA2
Północno-centralna część USA
Szwecja Środkowa
Szwajcaria Zachód
- Wejście: 16,385
Wyjście: 4,096
Wrzesień 2021 r. Tekst do tekstu
gpt-35-turbo (0125) Wschodnie USA2
Północno-centralna część USA
Szwecja Środkowa
Szwajcaria Zachód
- 16,385 Wrzesień 2021 r. Tekst do tekstu
gpt-4o-mini (2024-07-18) Północno-centralna część USA
Szwecja Środkowa
- Input: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
październik 2023 Tekst do tekstu
gpt-4o (2024-08-06) Wschodnie USA2
Północno-centralna część USA
Szwecja Środkowa
- Input: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
październik 2023 Tekst i obraz do tekstu
gpt-4.1 (2025-04-14) Północno-centralna część USA
Szwecja Środkowa
Input: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
maj 2024 Tekst i obraz do tekstu
gpt-4.1-mini (2025-04-14) Północno-centralna część USA
Szwecja Środkowa
Input: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
maj 2024 Tekst do tekstu
gpt-4.1-nano (2025-04-14) Północno-centralna część USA
Szwecja Środkowa
- Input: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 32 768
maj 2024 Tekst do tekstu
o4-mini (2025-04-16) Wschodnie USA2
Szwecja Środkowa
- Input: 128 000
Wynik: 16,384
Długość kontekstu przykładowego szkolenia: 65 536
maj 2024 Tekst do tekstu

Uwaga

Globalne szkolenie (w publicznej wersji zapoznawczej) zapewnia bardziej przystępne cenowo szkolenie na token, ale nie oferuje miejsca przechowywania danych. Obecnie jest ona dostępna dla zasobów usługi Azure OpenAI w następujących regionach, a wkrótce pojawi się więcej regionów:

  • Australia Wschodnia
  • Brazylia Południe
  • Wschodnie USA
  • Wschodnie stany USA 2
  • Francja Środkowa
  • Niemcy Zachodnio-środkowe
  • Włochy Północne
  • Japonia Wschodnia (brak wsparcia widzenia)
  • Korea Środkowa
  • Północno-środkowe stany USA
  • Norwegia Wschodnia
  • Polska Środkowa
  • Azja Południowo-Wschodnia
  • Północna część Republiki Południowej Afryki
  • Południowo-centralna część USA
  • Hiszpania Środkowa
  • Szwecja Środkowa
  • Szwajcaria Zachód
  • Szwajcaria Północna
  • Południe Wielkiej Brytanii
  • Zachodnia Europa
  • Zachodnie USA
  • Zachód USA 3

Asystenci (Podgląd)

Aby korzystać z Asystentów, potrzebujesz połączenia obsługiwanego modelu i obsługiwanego regionu. Niektóre narzędzia i funkcje wymagają najnowszych modeli. Następujące modele są dostępne w Assistants API, SDK i Azure AI Foundry. Poniższa tabela dotyczy standardowego wdrożenia. Aby uzyskać informacje na temat dostępności jednostki przepływności aprowizowanej (PTU), zobacz aprowizowanie przepływności. Wymienione modele i regiony mogą być używane z obydwoma Asystentami v1 i v2. Możesz użyć globalnych modeli standardowych , jeśli są one obsługiwane w regionach wymienionych poniżej.

Region gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
AustraliaEast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Norwegia Wschód - - - - - - - - - - -
Południowe Indie - - - - - - - - -
swedencentral - -
Południowa Anglia - - - - - -
westus - - - - -
westus3 - - - - - -

Emerytura modelowa

Aby uzyskać najnowsze informacje na temat wycofywania modelu, zapoznaj się z przewodnikiem po wycofaniu modelu.

Następne kroki