Modele usługi Azure OpenAI Service
Usługa Azure OpenAI Service jest obsługiwana przez zróżnicowany zestaw modeli z różnymi możliwościami i cenami. Dostępność modelu różni się w zależności od regionu i chmury. Aby uzyskać informacje o dostępności modelu platformy Azure Government, zobacz Azure Government OpenAI Service.
Modele | opis |
---|---|
GPT-4o i GPT-4 Turbo | Najnowsze najbardziej zdolne modele usługi Azure OpenAI z wersjami wielomodalnymi, które mogą akceptować zarówno tekst, jak i obrazy jako dane wejściowe. |
GPT-4 | Zestaw modeli ulepszających język GPT-3.5 i może zrozumieć i wygenerować język naturalny oraz kod. |
GPT-3.5 | Zestaw modeli, które ulepszają język GPT-3 i mogą zrozumieć i wygenerować język naturalny oraz kod. |
Osadzanie | Zestaw modeli, które mogą konwertować tekst na postać wektorów liczbowych, aby ułatwić podobieństwo tekstu. |
DALL-E | Seria modeli, które mogą generować oryginalne obrazy na podstawie języka naturalnego. |
Szeptać | Seria modeli w wersji zapoznawczej, które mogą transkrybować i tłumaczyć mowę na tekst. |
Zamiana tekstu na mowę (wersja zapoznawcza) | Seria modeli w wersji zapoznawczej, która może syntetyzować tekst na mowę. |
GPT-4o i GPT-4 Turbo
GPT-4o integruje tekst i obrazy w jednym modelu, umożliwiając mu obsługę wielu typów danych jednocześnie. Takie wielomodalne podejście zwiększa dokładność i szybkość reakcji w interakcjach komputerów ludzkich. GPT-4o pasuje do GPT-4 Turbo w języku angielskim i zadaniach kodowania, oferując lepszą wydajność w językach innych niż angielski i zadania przetwarzania obrazów, ustawiając nowe testy porównawcze dla funkcji sztucznej inteligencji.
Plac zabaw z wczesnym dostępem
Istniejący klienci korzystający z usługi Azure OpenAI mogą przetestować mini model GPT-4o w narzędziu Azure OpenAI Studio Early Access Playground (wersja zapoznawcza).
Aby przetestować najnowszy model:
Uwaga
GPT-4o mini wczesny dostęp plac zabaw jest obecnie dostępny tylko dla zasobów w regionie Zachodnie stany USA3 i Wschodnie stany USA i jest ograniczony do 10 żądań co pięć minut na subskrypcję. Filtry zawartości usługi Azure OpenAI są włączone w konfiguracji domyślnej i nie można ich modyfikować. GPT-4o mini jest modelem w wersji zapoznawczej i obecnie nie jest dostępny do wdrażania/bezpośredniego dostępu do interfejsu API.
- Przejdź do usługi Azure OpenAI Studio pod adresem https://oai.azure.com/ i zaloguj się przy użyciu poświadczeń, które mają dostęp do zasobów openAI.
- Wybierz zasób Azure OpenAI w regionach Zachodnie stany USA3 lub Wschodnie stany USA . Jeśli nie masz zasobu w jednym z tych regionów, musisz utworzyć zasób.
- Na głównej stronie azure OpenAI Studio wybierz przycisk Early Access Playground (wersja zapoznawcza) w sekcji Wprowadzenie . (Ten przycisk będzie widoczny tylko wtedy, gdy zasób w Wybrano zachodnie stany USA3 lub Wschodnie stany USA ).
- Teraz możesz zacząć zadawać pytania dotyczące modelu tak jak wcześniej w istniejącym placu zabaw czatu.
Jak mogę uzyskać dostęp do modelu GPT-4o?
GPT-4o jest dostępny dla standardowego i standardowego wdrożenia modelu.
Musisz utworzyć lub użyć istniejącego zasobu w obsługiwanym regionie standardowym lub globalnym, w którym jest dostępny model.
Po utworzeniu zasobu można wdrożyć model GPT-4o. Jeśli wykonujesz wdrożenie programowe, nazwa modelu to gpt-4o
, a wersja to 2024-05-13
.
GPT-4 Turbo
GPT-4 Turbo to duży model wielomodalny (akceptowanie danych wejściowych tekstu lub obrazu i generowanie tekstu), który może rozwiązywać trudne problemy z większą dokładnością niż którykolwiek z poprzednich modeli openAI. Podobnie jak GPT-3.5 Turbo, a starsze modele GPT-4 GPT-4 Turbo są zoptymalizowane pod kątem czatu i działają dobrze w przypadku tradycyjnych zadań ukończenia.
Najnowsza wersja GA GPT-4 Turbo to:
gpt-4
Wersja:turbo-2024-04-09
Jest to zamiennik następujących modeli w wersji zapoznawczej:
gpt-4
Wersja:1106-Preview
gpt-4
Wersja:0125-Preview
gpt-4
Wersja:vision-preview
Różnice między modelami OpenAI i Azure OpenAI GPT-4 Turbo GA
- Wersja najnowszego
0409
modelu turbo openAI obsługuje tryb JSON i funkcję wywołującą wszystkie żądania wnioskowania. - Wersja najnowszej wersji
turbo-2024-04-09
usługi Azure OpenAI obecnie nie obsługuje korzystania z trybu JSON i wywoływania funkcji podczas wprowadzania żądań wnioskowania przy użyciu danych wejściowych obrazu (vision). Żądania wejściowe oparte na tekście (żądania bezimage_url
obrazów wbudowanych i wbudowanych) obsługują tryb JSON i wywoływanie funkcji.
Różnice w porównaniu z interfejsem gpt-4 vision-preview
- Integracja funkcji przetwarzania obrazów specyficznych dla sztucznej inteligencji platformy Azure z funkcją GPT-4 Turbo z usługą Vision nie jest obsługiwana w wersji
gpt-4
:turbo-2024-04-09
. Obejmuje to optyczne rozpoznawanie znaków (OCR), uziemanie obiektów, monity wideo i ulepszoną obsługę danych za pomocą obrazów.
Dostępność zarządzana zaaprowizowana przez GPT-4 Turbo
gpt-4
Wersja:turbo-2024-04-09
jest dostępny zarówno w przypadku wdrożeń standardowych, jak i aprowizowania. Obecnie aprowizowana wersja tego modelu nie obsługuje żądań wnioskowania obrazów/obrazów. Aprowidowane wdrożenia tego modelu akceptują tylko wprowadzanie tekstu. Wdrożenia modelu w warstwie Standardowa akceptują żądania wnioskowania tekstu i obrazu/obrazów.
Dostępność w regionach
Aby uzyskać informacje na temat dostępności regionalnej modelu, zapoznaj się z macierzą modeli dla wdrożeń standardowych i aprowizowania.
Wdrażanie GPT-4 Turbo z usługą Vision GA
Aby wdrożyć model ga z poziomu interfejsu użytkownika programu Studio, wybierz GPT-4
pozycję, a następnie wybierz turbo-2024-04-09
wersję z menu rozwijanego. Domyślny limit przydziału gpt-4-turbo-2024-04-09
dla modelu będzie taki sam jak bieżący limit przydziału dla GPT-4-Turbo. Zobacz regionalne limity przydziału.
GPT-4
GPT-4 jest poprzednikem GPT-4 Turbo. Oba modele GPT-4 i GPT-4 Turbo mają podstawową nazwę gpt-4
modelu . Można odróżnić modele GPT-4 i Turbo, sprawdzając wersję modelu.
gpt-4
Wersja0314
gpt-4
Wersja0613
gpt-4-32k
Wersja0613
Długość kontekstu tokenu obsługiwana przez poszczególne modele można zobaczyć w tabeli podsumowania modelu.
Modele GPT-4 i GPT-4 Turbo
- Te modele mogą być używane tylko z interfejsem API uzupełniania czatów.
Zobacz wersje modelu, aby dowiedzieć się, jak usługa Azure OpenAI Obsługuje uaktualnienia wersji modelu i współpracuje z modelami , aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu wdrożeń GPT-4.
Model ID | opis | Maksymalne żądanie (tokeny) | Dane szkoleniowe (maksymalnie) |
---|---|---|---|
gpt-4o (2024-05-13) GPT-4o (Omni) |
Najnowszy model ogólnie dostępnej wersji - Tekst, przetwarzanie obrazów - Tryb JSON - wywoływanie funkcji równoległych - Zwiększona dokładność i czas odpowiedzi - Parzystość z angielskim tekstem i zadaniami kodowania w porównaniu do GPT-4 Turbo z wizją - Lepsza wydajność w językach innych niż angielski i w zadaniach przetwarzania obrazów - Nie obsługuje ulepszeń |
Dane wejściowe: 128 000 Dane wyjściowe: 4096 |
Październik 2023 r. |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo z wizją |
Nowy model ogólnie dostępnej wersji — Zastąpienie wszystkich poprzednich modeli GPT-4 w wersji zapoznawczej ( vision-preview , 1106-Preview , 0125-Preview ). - Dostępność funkcji jest obecnie różna w zależności od metody danych wejściowych i typu wdrożenia. - Nie obsługuje ulepszeń. |
Dane wejściowe: 128 000 Dane wyjściowe: 4096 |
Grudzień 2023 r. |
gpt-4 (0125-Preview)*GPT-4 Turbo (wersja zapoznawcza) |
Model w wersji zapoznawczej -Zastępuje 1106-Preview — Lepsza wydajność generowania kodu — Zmniejsza przypadki, w których model nie wykona zadania - Tryb JSON - wywoływanie funkcji równoległych — odtwarzalne dane wyjściowe (wersja zapoznawcza) |
Dane wejściowe: 128 000 Dane wyjściowe: 4096 |
Grudzień 2023 r. |
gpt-4 (vision-preview)GPT-4 Turbo z usługą Vision Preview |
Model w wersji zapoznawczej - Akceptuje tekst i dane wejściowe obrazu. — Obsługuje ulepszenia - Tryb JSON - wywoływanie funkcji równoległych — odtwarzalne dane wyjściowe (wersja zapoznawcza) |
Dane wejściowe: 128 000 Dane wyjściowe: 4096 |
Kwiecień 2023 r. |
gpt-4 (1106-Preview)GPT-4 Turbo (wersja zapoznawcza) |
Model w wersji zapoznawczej - Tryb JSON - wywoływanie funkcji równoległych — odtwarzalne dane wyjściowe (wersja zapoznawcza) |
Dane wejściowe: 128 000 Dane wyjściowe: 4096 |
Kwiecień 2023 r. |
gpt-4-32k (0613) |
Starszy model ga - Podstawowe wywoływanie funkcji za pomocą narzędzi |
32,768 | Wrzesień 2021 r. |
gpt-4 (0613) |
Starszy model ga - Podstawowe wywoływanie funkcji za pomocą narzędzi |
8,192 | Wrzesień 2021 r. |
gpt-4-32k (0314) |
Starszy model ga - Informacje o wycofaniu |
32,768 | Wrzesień 2021 r. |
gpt-4 (0314) |
Starszy model ga - Informacje o wycofaniu |
8,192 | Wrzesień 2021 r. |
Uwaga
Nie zalecamy używania modeli w wersji zapoznawczej w środowisku produkcyjnym. Uaktualnimy wszystkie wdrożenia modeli w wersji zapoznawczej do przyszłych wersji zapoznawczych lub do najnowszej stabilnej/ogólnie dostępnej wersji. Modele wyznaczone w wersji zapoznawczej nie są zgodne ze standardowym cyklem życia modelu Usługi Azure OpenAI.
- GPT-4 w wersji 0125-preview to zaktualizowana wersja wersji zapoznawczej GPT-4 Turbo wydana wcześniej jako wersja 1106-preview.
- GPT-4 w wersji 0125-preview wykonuje zadania, takie jak generowanie kodu bardziej całkowicie w porównaniu z gpt-4-1106-preview. W związku z tym, w zależności od zadania, klienci mogą stwierdzić, że GPT-4-0125-preview generuje więcej danych wyjściowych w porównaniu z gpt-4-1106-preview. Zalecamy klientom porównanie danych wyjściowych nowego modelu. GPT-4-0125-preview dotyczy również usterek w gpt-4-1106-preview z obsługą utF-8 dla języków innych niż angielski.
- Wersja GPT-4 to najnowsza wersja
turbo-2024-04-09
ogólnie dostępna i zastępuje0125-Preview
wartości ,1106-preview
ivision-preview
.
Ważne
gpt-4
Wersje 1106-Preview, 0125-Preview i vision-preview zostaną uaktualnione ze stabilną wersjągpt-4
w przyszłości.gpt-4
Wdrożenia wersji 1106-Preview, 0125-Preview i vision-preview mają wartość "Automatyczna aktualizacja do wartości domyślnej" i "Uaktualnij po wygaśnięciu" zostanie uaktualniona po wydaniu stabilnej wersji. W przypadku każdego wdrożenia uaktualnienie wersji modelu odbywa się bez przerw w działaniu usługi dla wywołań interfejsu API. Uaktualnienia są etapowane według regionu, a pełny proces uaktualniania powinien potrwać 2 tygodnie.gpt-4
Wdrożenia wersji 1106-Preview, 0125-Preview i vision-preview ustawione na wartość "Brak automatycznego uaktualniania" nie zostaną uaktualnione i przestaną działać po uaktualnieniu wersji zapoznawczej w regionie. Aby uzyskać więcej informacji na temat czasu uaktualniania, zobacz Wycofywanie i wycofywanie modeli usługi Azure OpenAI.
GPT-3.5
Modele GPT-3.5 mogą zrozumieć i wygenerować język naturalny lub kod. Najbardziej zdolny i ekonomiczny model w rodzinie GPT-3.5 to GPT-3.5 Turbo, który został zoptymalizowany pod kątem czatu i działa dobrze w przypadku tradycyjnych zadań wykonywanych, jak również. GPT-3.5 Turbo jest dostępny do użycia z interfejsem API uzupełniania czatów. GPT-3.5 Turbo Poinstruowanie ma podobne możliwości korzystania text-davinci-003
z interfejsu API uzupełniania zamiast interfejsu API uzupełniania czatów. Zalecamy używanie GPT-3.5 Turbo i GPT-3.5 Turbo Poinstruuj w starszych modelach GPT-3.5 i GPT-3.
Model ID | opis | Maksymalne żądanie (tokeny) | Dane szkoleniowe (maksymalnie) |
---|---|---|---|
gpt-35-turbo (0125) NOWY |
Najnowszy model ogólnie dostępnej wersji - Tryb JSON - wywoływanie funkcji równoległych — odtwarzalne dane wyjściowe (wersja zapoznawcza) - Wyższa dokładność odpowiadania w żądanych formatach. - Poprawka dotycząca usterki, która spowodowała problem z kodowaniem tekstu w przypadku wywołań funkcji w języku nieanglojęzycznym. |
Dane wejściowe: 16 385 Dane wyjściowe: 4096 |
Wrzesień 2021 r. |
gpt-35-turbo (1106) |
Starszy model ga - Tryb JSON - wywoływanie funkcji równoległych — odtwarzalne dane wyjściowe (wersja zapoznawcza) |
Dane wejściowe: 16 385 Dane wyjściowe: 4096 |
Wrzesień 2021 r. |
gpt-35-turbo-instruct (0914) |
Tylko punkt końcowy uzupełniania — Zastępowanie starszych modeli uzupełniania |
4,097 | Wrzesień 2021 r. |
gpt-35-turbo-16k (0613) |
Starszy model ga - Podstawowe wywoływanie funkcji za pomocą narzędzi |
16,384 | Wrzesień 2021 r. |
gpt-35-turbo (0613) |
Starszy model ga - Podstawowe wywoływanie funkcji za pomocą narzędzi |
4,096 | Wrzesień 2021 r. |
gpt-35-turbo 1 (0301) |
Starszy model ga - Informacje o wycofaniu |
4,096 | Wrzesień 2021 r. |
Aby dowiedzieć się więcej na temat interakcji z GPT-3.5 Turbo i interfejsem API uzupełniania czatów, zapoznaj się z naszymi szczegółowymi instrukcjami.
1 Ten model będzie akceptować żądania > 4096 tokenów. Nie zaleca się przekraczania limitu tokenu wejściowego 4096, ponieważ nowsza wersja modelu jest ograniczona do 4096 tokenów. Jeśli wystąpią problemy podczas przekraczania 4096 tokenów wejściowych w tym modelu, ta konfiguracja nie jest oficjalnie obsługiwana.
Osadzanie
text-embedding-3-large
jest najnowszym i najbardziej zdolnym modelem osadzania. Uaktualnianie między modelami osadzania nie jest możliwe. Aby przejść z użycia text-embedding-ada-002
do text-embedding-3-large
, należy wygenerować nowe osadzanie.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Podczas testowania raporty OpenAI zarówno duże, jak i małe modele osadzania trzeciej generacji oferują lepszą średnią wydajność pobierania w wielu językach z testem porównawczym MIRACL , jednocześnie zachowując wydajność zadań angielskich z testem porównawczym MTEB .
Test porównawczy oceny | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Średnia MIRACL | 31.4 | 44.0 | 54.9 |
Średnia MTEB | 61,0 | 62.3 | 64.6 |
Modele osadzania trzeciej generacji obsługują zmniejszenie rozmiaru osadzania za pomocą nowego dimensions
parametru. Zazwyczaj większe osadzanie jest droższe z perspektywy zasobów obliczeniowych, pamięci i magazynu. Możliwość dostosowania liczby wymiarów umożliwia większą kontrolę nad ogólnym kosztem i wydajnością. Parametr dimensions
nie jest obsługiwany we wszystkich wersjach biblioteki języka Python OpenAI 1.x, aby skorzystać z tego parametru, zalecamy uaktualnienie do najnowszej wersji: pip install openai --upgrade
.
Testy porównawcze MTEB openAI wykazały, że nawet wtedy, gdy wymiary modelu trzeciej generacji są zmniejszone do mniej niż text-embeddings-ada-002
1536 wymiarów, pozostają nieco lepsze.
DALL-E
Modele DALL-E generują obrazy na podstawie monitów tekstowych wyświetlanych przez użytkownika. Język DALL-E 3 jest ogólnie dostępny do użycia z interfejsami API REST. Zestawy DALL-E 2 i DALL-E 3 z zestawami SDK klienta są w wersji zapoznawczej.
Szeptać
Modele Szeptu mogą służyć do zamiany mowy na tekst.
Możesz również użyć modelu Whisper za pośrednictwem interfejsu API transkrypcji wsadowej usługi Azure AI Speech. Zapoznaj się z tematem Co to jest model Szeptu? aby dowiedzieć się więcej o tym, kiedy używać usługi Azure AI Speech a Azure OpenAI Service.
Zamiana tekstu na mowę (wersja zapoznawcza)
Tekst OpenAI do modeli mowy, obecnie w wersji zapoznawczej, może służyć do syntezowania tekstu na mowę.
Możesz również użyć tekstu OpenAI do mowy głosów za pośrednictwem usługi Azure AI Speech. Aby dowiedzieć się więcej, zobacz OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide (Przewodnik po zamianie mowy za pośrednictwem usługi Azure OpenAI Lub Azure AI Speech ).
Tabela podsumowania modelu i dostępność regionów
Uwaga
W tym artykule opisano głównie dostępność modelu/regionu, która ma zastosowanie do wszystkich klientów usługi Azure OpenAI z typami wdrożenia w warstwie Standardowa. Niektórzy klienci mają dostęp do kombinacji modelu/regionu, które nie są wymienione w poniższej ujednoliconej tabeli. Aby uzyskać więcej informacji na temat aprowizowania wdrożeń, zobacz nasze wskazówki dotyczące aprowizowania.
Dostępność modelu wdrażania w warstwie Standardowa
Region | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | osadzanie tekstu — 3 małe, 1 | osadzanie tekstu — 3 duże, 1 | dall-e-2, 2.0 | dall-e-3, 3.0 | babbage-002, 1 | davinci-002, 1 | tts, 001 | tts-hd, 001 | szept, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Ta tabela nie zawiera globalnej dostępności regionalnej wdrożenia modelu standardowego dla GPT-4o ani dostrajania informacji o dostępności regionalnej. Aby uzyskać te informacje, zapoznaj się z dedykowaną sekcją globalnego wdrożenia standardowego i sekcją dostrajania.
Standardowy i globalny limit przydziału modelu wdrażania w warstwie Standardowa i Standardowa
Region (Region) | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | gpt-4o | gpt-4o — GlobalStandard | GPT-35-Turbo | GPT-35-Turbo-Poinstruuj | Osadzanie tekstu-Ada-002 | osadzanie tekstu — 3 małe | osadzanie tekstu —3 — duże | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - dostrajanie | GPT-35-Turbo-1106 - grzywna | GPT-4 - grzywna | GPT-35-Turbo-0125 - grzywna |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | - | 450 K 30 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | 450 K 30 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | - | 450 K 30 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 150 K 1 M |
450 K 30 M |
240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 150 K 1 M |
450 K 30 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | - | 250 K |
francecentral | 20 tys. | 60 K | 80 K | - | - | 450 K 30 M |
240 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - |
germanywestcentral | - | - | - | - | - | 450 K 30 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | - | 450 K 30 M |
300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | 450 K 30 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 150 K 1 M |
450 K 30 M |
300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 100 tys. | 250 K |
norwayeast | - | - | 150 K | - | - | 450 K 30 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
polandcentral | - | - | - | - | - | 450 K 30 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | 450 K 30 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 K | - | 150 K 1 M |
450 K 30 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | - | 450 K 30 M |
300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
swedencentral | 40 K | 80 K | 150 K | 30 K | 150 K 1 M |
450 K 30 M |
300 K | 240 K | 350 K | - | 350 K | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 100 tys. | 250 K |
switzerlandnorth | 40 K | 80 K | - | 30 K | - | 450 K 30 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
szwajcariawest | - | - | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | - | 250 K |
uksouth | - | - | 80 K | - | - | 450 K 30 M |
240 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | 450 K 30 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 150 K 1 M |
450 K 30 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | 150 K 1 M |
450 K 30 M |
- | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
Aprowizowana dostępność modelu wdrażania
Region | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | - | ✅ | - | - |
polandcentral | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
szwajcariawest | - | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Uwaga
Aprowizowana wersja wersji gpt-4
: turbo-2024-04-09
jest obecnie ograniczona tylko do tekstu.
Jak mogę uzyskać dostęp do aprowizowania?
Aby uzyskać aprowizowaną przepływność, musisz porozmawiać z zespołem ds. sprzedaży/konta firmy Microsoft. Jeśli nie masz zespołu ds. sprzedaży/konta, niestety w tej chwili nie możesz kupić aprowizowanej przepływności.
Aby uzyskać więcej informacji na temat aprowizowania wdrożeń, zobacz nasze wskazówki dotyczące aprowizowania.
Globalna dostępność modelu standardowego
Obsługiwane modele:
gpt-4o
Wersja:2024-05-13
Obsługiwane regiony:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- polandcentral
- southafricanorth
- southcentralus
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
Dostępność modelu GPT-4 i GPT-4 Turbo
Regiony chmury publicznej
Region | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ |
eastus | - | - | ✅ | - | - | ✅ | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - |
francecentral | ✅ | ✅ | - | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - |
norwayeast | - | ✅ | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - |
southindia | - | ✅ | - | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - | - |
westus | - | ✅ | - | ✅ | - | ✅ | - |
westus3 | - | ✅ | - | - | - | ✅ | - |
Wybieranie dostępu klienta
Oprócz powyższych regionów, które są dostępne dla wszystkich klientów usługi Azure OpenAI, niektóre z wybranych wcześniej klientów otrzymały dostęp do wersji GPT-4 w dodatkowych regionach:
Model | Region (Region) |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
Wschodnie stany USA Francja Środkowa Południowo-środkowe stany USA Południowe Zjednoczone Królestwo |
gpt-4 (0613) gpt-4-32k (0613) |
Wschodnie stany USA Wschodnie stany USA 2 Japonia Wschodnia Południowe Zjednoczone Królestwo |
Modele GPT-3.5
Ważne
Nowy gpt-35-turbo (0125)
model ma różne ulepszenia, w tym większą dokładność reagowania w żądanych formatach i poprawkę dla usterki, która spowodowała problem z kodowaniem tekstu dla wywołań funkcji języka innego niż angielski.
GPT-3.5 Turbo jest używany z interfejsem API uzupełniania czatu. GPT-3.5 Turbo w wersji 0301 można również używać z interfejsem API uzupełniania, choć nie jest to zalecane. GPT-3.5 Turbo w wersji 0613 i 1106 obsługują tylko interfejs API uzupełniania czatów.
GPT-3.5 Turbo w wersji 0301 jest pierwszą wersją wydanego modelu. Wersja 0613 jest drugą wersją modelu i dodaje obsługę wywołań funkcji.
Zobacz wersje modelu, aby dowiedzieć się, jak usługa Azure OpenAI Obsługuje uaktualnienia wersji modelu i współpracuje z modelami , aby dowiedzieć się, jak wyświetlać i konfigurować ustawienia wersji modelu wdrożeń GPT-3.5 Turbo.
Dostępność modelu GPT-3.5-Turbo
Regiony chmury publicznej
Region | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
Osadzanie modeli
Te modele mogą być używane tylko z żądaniami interfejsu API osadzania.
Uwaga
text-embedding-3-large
jest najnowszym i najbardziej zdolnym modelem osadzania. Uaktualnianie między modelami osadzania nie jest możliwe. Aby przeprowadzić migrację z funkcji using text-embedding-ada-002
do text-embedding-3-large
, należy wygenerować nowe osadzanie.
Model ID | Maksymalne żądanie (tokeny) | Wymiary wyjściowe | Dane szkoleniowe (do) |
---|---|---|---|
text-embedding-ada-002 (wersja 2) |
8,191 | 1536 | Wrzesień 2021 r. |
text-embedding-ada-002 (wersja 1) |
2,046 | 1536 | Wrzesień 2021 r. |
text-embedding-3-large |
8,191 | 3072 | Wrzesień 2021 r. |
text-embedding-3-small |
8,191 | 1536 | Wrzesień 2021 r. |
Uwaga
Podczas wysyłania tablicy danych wejściowych do osadzania maksymalna liczba elementów wejściowych w tablicy na wywołanie punktu końcowego osadzania wynosi 2048.
Regiony chmury publicznej
Region | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | osadzanie tekstu — 3 małe, 1 | osadzanie tekstu — 3 duże, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | ✅ |
japaneast | - | ✅ | - | ✅ |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | ✅ |
swedencentral | - | ✅ | - | ✅ |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | ✅ |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | ✅ |
Modele DALL-E
Model ID | Dostępność funkcji | Maksymalna liczba żądań (znaki) |
---|---|---|
dalle2 (wersja zapoznawcza) | Wschodnie stany USA | 1000 |
dall-e-3 | Wschodnie stany USA, Australia Wschodnia, Szwecja Środkowa | 4000 |
Dostrajanie modeli
babbage-002
i davinci-002
nie są przeszkoleni, aby postępować zgodnie z instrukcjami. Wykonywanie zapytań dotyczących tych modeli podstawowych powinno odbywać się tylko jako punkt odniesienia do dostosowanej wersji, aby ocenić postęp trenowania.
gpt-35-turbo
— dostrajanie tego modelu jest ograniczone do podzbioru regionów i nie jest dostępne w każdym regionie, w którym model podstawowy jest dostępny.
Model ID | Dostrajanie regionów | Maksymalne żądanie (tokeny) | Dane szkoleniowe (maksymalnie) |
---|---|---|---|
babbage-002 |
Północno-środkowe stany USA Szwecja Środkowa Szwajcaria Zachodnia |
16,384 | Wrzesień 2021 r. |
davinci-002 |
Północno-środkowe stany USA Szwecja Środkowa Szwajcaria Zachodnia |
16,384 | Wrzesień 2021 r. |
gpt-35-turbo (0613) |
Wschodnie stany USA 2 Północno-środkowe stany USA Szwecja Środkowa Szwajcaria Zachodnia |
4,096 | Wrzesień 2021 r. |
gpt-35-turbo (1106) |
Wschodnie stany USA 2 Północno-środkowe stany USA Szwecja Środkowa Szwajcaria Zachodnia |
Dane wejściowe: 16 385 Dane wyjściowe: 4096 |
Wrzesień 2021 r. |
gpt-35-turbo (0125) |
Wschodnie stany USA 2 Północno-środkowe stany USA Szwecja Środkowa Szwajcaria Zachodnia |
16,385 | Wrzesień 2021 r. |
gpt-4 (0613) 1 |
Północno-środkowe stany USA Szwecja Środkowa |
8192 | Wrzesień 2021 r. |
1Dostrajanie 1 GPT-4 jest obecnie dostępne w publicznej wersji zapoznawczej. Aby uzyskać więcej informacji, zobacz nasze wskazówki dotyczące oceny bezpieczeństwa dostrajania GPT-4.
Modele szeptu
Model ID | Dostępność modelu | Maksymalna liczba żądań (rozmiar pliku audio) |
---|---|---|
whisper |
Wschodnie stany USA 2 Północno-środkowe stany USA Norwegia Wschodnia Indie Szwecja Środkowa West Europe |
25 MB |
Modele zamiany tekstu na mowę (wersja zapoznawcza)
Model ID | Dostępność modelu |
---|---|
tts-1 |
Północno-środkowe stany USA Szwecja Środkowa |
tts-1-hd |
Północno-środkowe stany USA Szwecja Środkowa |
Asystenci (wersja zapoznawcza)
W przypadku asystentów potrzebujesz kombinacji obsługiwanego modelu i obsługiwanego regionu. Niektóre narzędzia i możliwości wymagają najnowszych modeli. Następujące modele są dostępne w interfejsie API asystentów, zestawie SDK, usłudze Azure AI Studio i usłudze Azure OpenAI Studio. Poniższa tabela dotyczy płatności zgodnie z rzeczywistym użyciem. Aby uzyskać informacje na temat dostępności jednostki przepływności aprowizowanej (PTU), zobacz aprowizowanie przepływności. Wymienione modele i regiony mogą być używane z asystentami w wersji 1 i 2.
Region (Region) | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
---|---|---|---|---|---|---|---|
Australia Wschodnia | ✅ | ✅ | ✅ | ✅ | |||
East US | ✅ | ✅ | ✅ | ||||
Wschodnie stany USA 2 | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Francja Środkowa | ✅ | ✅ | ✅ | ✅ | |||
Japonia Wschodnia | ✅ | ||||||
Norwegia Wschodnia | ✅ | ||||||
Szwecja Środkowa | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |
Południowe Zjednoczone Królestwo | ✅ | ✅ | ✅ | ✅ | |||
Zachodnie stany USA | ✅ | ✅ | ✅ | ||||
Zachodnie stany USA 3 | ✅ | ✅ |
Wycofanie modelu
Aby uzyskać najnowsze informacje na temat wycofywania modelu, zapoznaj się z przewodnikiem po wycofaniu modelu.
Następne kroki
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla