Azure OpenAI Service-modellen
Azure OpenAI Service wordt mogelijk gemaakt door een diverse set modellen met verschillende mogelijkheden en prijspunten. De beschikbaarheid van modellen verschilt per regio en cloud. Raadpleeg de Azure Government OpenAI-service voor azure Government-modellen.
Modellen | Beschrijving |
---|---|
GPT-4o & GPT-4 Turbo | De meest geschikte Azure OpenAI-modellen met multimodale versies, die zowel tekst als afbeeldingen als invoer kunnen accepteren. |
GPT-4 | Een reeks modellen die worden verbeterd op GPT-3.5 en die natuurlijke taal en code kunnen begrijpen en genereren. |
GPT-3.5 | Een reeks modellen die worden verbeterd op GPT-3 en die natuurlijke taal en code kunnen begrijpen en genereren. |
Insluitingen | Een set modellen waarmee tekst kan worden omgezet in numerieke vectorvorm om de gelijkenis van tekst te vergemakkelijken. |
DALL-E | Een reeks modellen waarmee oorspronkelijke afbeeldingen uit natuurlijke taal kunnen worden gegenereerd. |
Fluisteren | Een reeks modellen in preview waarmee spraak naar tekst kan worden getranscribeerd en vertaald. |
Tekst naar spraak (preview) | Een reeks modellen in preview waarmee tekst naar spraak kan worden gesynthetiseert. |
GPT-4o en GPT-4 Turbo
GPT-4o integreert tekst en afbeeldingen in één model, zodat deze meerdere gegevenstypen tegelijk kan verwerken. Deze multimodale benadering verbetert de nauwkeurigheid en reactiesnelheid in interacties tussen menselijke computers. GPT-4o komt overeen met GPT-4 Turbo in engelse tekst- en coderingstaken en biedt superieure prestaties in niet-Engelse talen en vision-taken, waardoor nieuwe benchmarks voor AI-mogelijkheden worden ingesteld.
Vroege toegangsspeeltuin
Bestaande Azure OpenAI-klanten kunnen het NIEUWE GPT-4o-minimodel testen in de Azure OpenAI Studio Early Access Playground (preview).
Het nieuwste model testen:
Notitie
De GPT-4o mini early access playground is momenteel alleen beschikbaar voor resources in US3 - west en VS - oost, en is beperkt tot 10 aanvragen om de vijf minuten per abonnement. Azure OpenAI-inhoudsfilters zijn ingeschakeld bij de standaardconfiguratie en kunnen niet worden gewijzigd. GPT-4o mini is een preview-model en is momenteel niet beschikbaar voor implementatie-/directe API-toegang.
- Navigeer naar Azure OpenAI Studio op https://oai.azure.com/ en meld u aan met referenties die toegang hebben tot uw OpenAI-resources.
- Selecteer een Azure OpenAI-resource in de regio's VS - west 3 of VS - oost. Als u geen resource in een van deze regio's hebt, moet u een resource maken.
- Selecteer op de hoofdpagina van Azure OpenAI Studio de knop Early Access Playground (Preview) in de sectie Aan de slag . (Deze knop is alleen zichtbaar wanneer een resource zich in VS - west 3 of VS - oost is geselecteerd.)
- Nu kunt u beginnen met het stellen van de modelvragen, net zoals u dat zou doen in de bestaande chatspeeltuin.
Hoe kan ik toegang tot het GPT-4o-model?
GPT-4o is beschikbaar voor standaard - en algemene modelimplementatie.
U moet een bestaande resource maken of gebruiken in een ondersteunde standaard- of globale standaardregio waar het model beschikbaar is.
Wanneer uw resource is gemaakt, kunt u het GPT-4o-model implementeren . Als u een programmatische implementatie uitvoert, is gpt-4o
de modelnaam en de versie.2024-05-13
GPT-4 Turbo
GPT-4 Turbo is een groot multimodale model (accepteren van tekst- of afbeeldingsinvoer en het genereren van tekst) die moeilijke problemen met een grotere nauwkeurigheid kan oplossen dan een van de vorige modellen van OpenAI. Zoals GPT-3.5 Turbo en oudere GPT-4 modellen GPT-4 Turbo is geoptimaliseerd voor chatten en werkt goed voor traditionele voltooiingstaken.
De nieuwste GA-release van GPT-4 Turbo is:
gpt-4
Versie:turbo-2024-04-09
Dit is de vervanging voor de volgende preview-modellen:
gpt-4
Versie:1106-Preview
gpt-4
Versie:0125-Preview
gpt-4
Versie:vision-preview
Verschillen tussen OpenAI en Azure OpenAI GPT-4 Turbo GA-modellen
- OpenAI's versie van het nieuwste
0409
turbomodel ondersteunt JSON-modus en functie-aanroepen voor alle deductieaanvragen. - De versie van Azure OpenAI van de meest recente
turbo-2024-04-09
versie biedt momenteel geen ondersteuning voor het gebruik van de JSON-modus en functie-aanroepen bij het maken van deductieaanvragen met afbeeldingsinvoer (vision). Invoeraanvragen op basis van tekst (aanvragen zonderimage_url
en inline-afbeeldingen) ondersteunen de JSON-modus en functie-aanroepen.
Verschillen met gpt-4 vision-preview
- Integratie van azure AI-specifieke Vision-verbeteringen met GPT-4 Turbo met Vision wordt niet ondersteund voor
gpt-4
versie:turbo-2024-04-09
. Dit omvat Optical Character Recognition (OCR), objectaarding, videoprompts en verbeterde verwerking van uw gegevens met afbeeldingen.
Beheerde beschikbaarheid van GPT-4 Turbo ingericht
gpt-4
Versie:turbo-2024-04-09
is beschikbaar voor zowel standaard- als ingerichte implementaties. Momenteel biedt de ingerichte versie van dit model geen ondersteuning voor aanvragen voor afbeeldings-/visiondeductie. Ingerichte implementaties van dit model accepteren alleen tekstinvoer. Standaardmodelimplementaties accepteren zowel tekst- als afbeeldings-/visiondeductieaanvragen.
Regionale beschikbaarheid
Raadpleeg de modelmatrix voor standaardimplementaties en ingerichte implementaties voor informatie over regionale beschikbaarheid van modellen.
GPT-4 Turbo implementeren met Vision GA
Als u het GA-model wilt implementeren vanuit de gebruikersinterface van Studio, selecteert en kiest u GPT-4
vervolgens de turbo-2024-04-09
versie in de vervolgkeuzelijst. Het standaardquotum voor het gpt-4-turbo-2024-04-09
model is hetzelfde als het huidige quotum voor GPT-4-Turbo. Zie de regionale quotumlimieten.
GPT-4
GPT-4 is de voorganger van GPT-4 Turbo. Zowel de GPT-4- als GPT-4 Turbo-modellen hebben een basismodelnaam van gpt-4
. U kunt onderscheid maken tussen de GPT-4- en Turbo-modellen door de modelversie te bekijken.
gpt-4
Versie0314
gpt-4
Versie0613
gpt-4-32k
Versie0613
U kunt de contextlengte van het token zien die door elk model wordt ondersteund in de overzichtstabel van het model.
GPT-4- en GPT-4 Turbo-modellen
- Deze modellen kunnen alleen worden gebruikt met de CHAT-voltooiings-API.
Zie modelversies voor meer informatie over hoe Azure OpenAI Service modelversie-upgrades verwerkt en hoe u met modellen werkt om te leren hoe u de modelversie-instellingen van uw GPT-4-implementaties kunt bekijken en configureren.
Model-id | Beschrijving | Maximum aantal aanvragen (tokens) | Trainingsgegevens (maximaal) |
---|---|---|---|
gpt-4o (2024-05-13) GPT-4o (Omni) |
Meest recente GA-model - Tekst, afbeeldingsverwerking - JSON-modus - parallelle functie aanroepen - Verbeterde nauwkeurigheid en reactiesnelheid - Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision - Superieure prestaties in niet-Engelse talen en in vision-taken - Biedt geen ondersteuning voor verbeteringen |
Invoer: 128.000 Uitvoer: 4.096 |
Oktober 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo met Vision |
Nieuw GA-model - Vervanging voor alle vorige GPT-4 preview-modellen ( vision-preview , 1106-Preview , 0125-Preview ). - De beschikbaarheid van functies verschilt momenteel, afhankelijk van de invoermethode en het implementatietype. - Biedt geen ondersteuning voor verbeteringen. |
Invoer: 128.000 Uitvoer: 4.096 |
dec. 2023 |
gpt-4 (0125-Preview)*GPT-4 Turbo Preview |
Voorbeeldmodel -Vervangt 1106-Preview - Betere prestaties van het genereren van code - Vermindert gevallen waarin het model een taak niet voltooit - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview) |
Invoer: 128.000 Uitvoer: 4.096 |
dec. 2023 |
gpt-4 (vision-preview)GPT-4 Turbo met Vision Preview |
Voorbeeldmodel - Accepteert tekst- en afbeeldingsinvoer. - Ondersteunt verbeteringen - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview) |
Invoer: 128.000 Uitvoer: 4.096 |
apr. 2023 |
gpt-4 (1106-preview)GPT-4 Turbo Preview |
Voorbeeldmodel - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview) |
Invoer: 128.000 Uitvoer: 4.096 |
apr. 2023 |
gpt-4-32k (0613) |
Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's |
32.768 | Sep 2021 |
gpt-4 (0613) |
Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's |
8192 | Sep 2021 |
gpt-4-32k (0314) |
Ouder GA-model - Buitengebruikstellingsgegevens |
32.768 | Sep 2021 |
gpt-4 (0314) |
Ouder GA-model - Buitengebruikstellingsgegevens |
8192 | Sep 2021 |
Let op
We raden u niet aan preview-modellen in productie te gebruiken. We zullen alle implementaties van preview-modellen upgraden naar toekomstige preview-versies of naar de nieuwste stabiele/GA-versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van het Azure OpenAI-model.
- GPT-4 versie 0125-preview is een bijgewerkte versie van de GPT-4 Turbo preview die eerder is uitgebracht als versie 1106-preview.
- GPT-4 versie 0125-preview voltooit taken zoals het genereren van code volledig in vergelijking met gpt-4-1106-preview. Hierdoor kunnen klanten, afhankelijk van de taak, merken dat GPT-4-0125-preview meer uitvoer genereert in vergelijking met de gpt-4-1106-preview. We raden klanten aan de uitvoer van het nieuwe model te vergelijken. GPT-4-0125-preview behandelt ook bugs in gpt-4-1106-preview met UTF-8-verwerking voor niet-Engelse talen.
- GPT-4-versie
turbo-2024-04-09
is de nieuwste GA-release en vervangt0125-Preview
,1106-preview
envision-preview
.
Belangrijk
gpt-4
versies 1106-Preview, 0125-Preview en vision-preview worden in de toekomst bijgewerkt met een stabiele versie.gpt-4
Implementaties vangpt-4
versies 1106-Preview, 0125-Preview en vision-preview ingesteld op 'Automatisch bijwerken naar standaard' en 'Upgrade wanneer verlopen' wordt bijgewerkt nadat de stabiele versie is uitgebracht. Voor elke implementatie vindt er een upgrade van een modelversie plaats zonder onderbreking van de service voor API-aanroepen. Upgrades worden gefaseerd per regio en het volledige upgradeproces duurt naar verwachting 2 weken. Implementaties vangpt-4
versies 1106-Preview, 0125-Preview en vision-preview ingesteld op 'Geen autoupgrade' worden niet bijgewerkt en werken niet meer wanneer de preview-versie in de regio wordt bijgewerkt. Zie buitengebruikstelling en afschaffingen van Azure OpenAI-modellen voor meer informatie over de timing van de upgrade.
GPT-3.5
GPT-3.5-modellen kunnen natuurlijke taal of code begrijpen en genereren. Het meest geschikte en rendabele model in de GPT-3.5-familie is GPT-3.5 Turbo, die is geoptimaliseerd voor chatten en werkt ook goed voor traditionele voltooiingstaken. GPT-3.5 Turbo is beschikbaar voor gebruik met de API voor chatvoltooiingen. GPT-3.5 Turbo Instruct heeft vergelijkbare mogelijkheden als text-davinci-003
het gebruik van de Completions-API in plaats van de Chat Completions-API. We raden u aan GPT-3.5 Turbo en GPT-3.5 Turbo Instruct te gebruiken voor oudere GPT-3.5- en GPT-3-modellen.
Model-id | Beschrijving | Maximum aantal aanvragen (tokens) | Trainingsgegevens (maximaal) |
---|---|---|---|
gpt-35-turbo (0125) NIEUW |
Meest recente GA-model - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview) - Hogere nauwkeurigheid bij het reageren in aangevraagde indelingen. - Oplossing voor een fout die een tekstcoderingsprobleem veroorzaakte voor niet-Engelstalige functie-aanroepen. |
Invoer: 16.385 Uitvoer: 4.096 |
Sep 2021 |
gpt-35-turbo (1106) |
Ouder GA-model - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview) |
Invoer: 16.385 Uitvoer: 4.096 |
Sep 2021 |
gpt-35-turbo-instruct (0914) |
Eindpunt voor voltooiingen alleen - Vervanging van verouderde voltooiingsmodellen |
4,097 | Sep 2021 |
gpt-35-turbo-16k (0613) |
Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's |
16,384 | Sep 2021 |
gpt-35-turbo (0613) |
Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's |
4096 | Sep 2021 |
gpt-35-turbo 1 (0301) |
Ouder GA-model - Buitengebruikstellingsgegevens |
4096 | Sep 2021 |
Bekijk onze uitgebreide procedures voor meer informatie over hoe u kunt communiceren met GPT-3.5 Turbo en de API voor chatvoltooiingen.
1 Dit model accepteert aanvragen > 4.096 tokens. Het wordt niet aanbevolen om de limiet van 4096 invoertoken te overschrijden, omdat de nieuwere versie van het model wordt beperkt tot 4.096 tokens. Als u problemen ondervindt bij het overschrijden van 4096 invoertokens met dit model, wordt deze configuratie niet officieel ondersteund.
Insluitingen
text-embedding-3-large
is het meest recente en meest geschikte insluitmodel. Upgraden tussen insluitingsmodellen is niet mogelijk. Als u wilt overstappen van het gebruik text-embedding-ada-002
naar het text-embedding-3-large
gebruik, moet u nieuwe insluitingen genereren.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Bij het testen rapporteert OpenAI zowel de grote als de kleine derde generatie embeddingsmodellen betere gemiddelde prestaties voor het ophalen van meerdere talen met de MIRACL-benchmark , terwijl de prestaties voor Engelse taken met de MTEB-benchmark nog steeds behouden blijven.
Evaluatiebenchmark | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL-gemiddelde | 31.4 | 44.0 | 54.9 |
MTEB-gemiddelde | 61.0 | 62.3 | 64.6 |
De insluitingsmodellen van de derde generatie ondersteunen het verminderen van de grootte van het insluiten via een nieuwe dimensions
parameter. Meestal zijn grotere insluitingen duurder vanuit reken-, geheugen- en opslagperspectief. Als u het aantal dimensies kunt aanpassen, hebt u meer controle over de totale kosten en prestaties. De dimensions
parameter wordt niet ondersteund in alle versies van de OpenAI 1.x Python-bibliotheek om te profiteren van deze parameter, raden we aan om een upgrade uit te voeren naar de nieuwste versie: pip install openai --upgrade
.
De MTEB-benchmarktests van OpenAI hebben vastgesteld dat zelfs wanneer de dimensies van het derde generatiemodel worden verlaagd tot minder dan text-embeddings-ada-002
1536 dimensies, de prestaties iets beter blijven.
DALL-E
De DALL-E-modellen genereren afbeeldingen op basis van tekstprompts die de gebruiker biedt. DALL-E 3 is algemeen beschikbaar voor gebruik met de REST API's. DALL-E 2 en DALL-E 3 met client-SDK's zijn in preview.
Fluisteren
De Fluistermodellen kunnen worden gebruikt voor spraak-naar-tekst.
U kunt het Whisper-model ook gebruiken via azure AI Speech-batchtranscriptie-API. Bekijk wat is het Fluistermodel? voor meer informatie over wanneer u Azure AI Speech versus Azure OpenAI Service gebruikt.
Tekst naar spraak (preview)
De OpenAI-tekst naar spraakmodellen, momenteel als preview-versie, kan worden gebruikt om tekst naar spraak te synthetiseren.
U kunt de OpenAI-tekst ook gebruiken voor spraakstemmen via Azure AI Speech. Zie OpenAI-tekst naar spraakstemmen via Azure OpenAI Service of via azure AI Speech Guide voor meer informatie.
Overzichtstabel en beschikbaarheid van regio's model
Notitie
In dit artikel wordt voornamelijk aandacht besteed aan de beschikbaarheid van modellen/regio's die van toepassing zijn op alle Azure OpenAI-klanten met implementatietypen standard. Sommige geselecteerde klanten hebben toegang tot combinaties van modellen/regio's die niet worden vermeld in de onderstaande uniforme tabel. Zie onze richtlijnen voor ingerichte implementaties voor meer informatie over ingerichte implementaties.
Beschikbaarheid van standaardimplementatiemodel
Regio | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | tekst insluiten-3-klein, 1 | tekst-insluiten-3-groot, 1 | dall-e-2, 2.0 | dall-e-3, 3.0 | babbage-002, 1 | davinci-002, 1 | tts, 001 | tts-hd, 001 | fluisteren, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
US - zuid-centraal | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Deze tabel bevat geen regionale beschikbaarheid van wereldwijde standaardmodelimplementatie voor GPT-4o of het verfijnen van regionale beschikbaarheidsgegevens. Raadpleeg de specifieke algemene standaardimplementatiesectie en de sectie voor het afstemmen van deze informatie.
Quotum voor het standaardimplementatiemodel en het algemene standaardimplementatiemodel
Regio | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | gpt-4o | gpt-4o - GlobalStandard | GPT-35-Turbo | GPT-35-Turbo-Instruct | Tekst-insluiten-Ada-002 | tekst-insluiten-3-klein | tekst-insluiten-3-groot | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-4 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | - | 450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | 450 K 10 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | - | 450 K 10 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | - | 250 K |
francecentral | 20 K | 60 K | 80 K | - | - | 450 K 10 M |
240 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - |
germanywestcentral | - | - | - | - | - | 450 K 10 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | - | 450 K 10 M |
300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | 450 K 10 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 100k | 250 K |
norwayeast | - | - | 150 K | - | - | 450 K 10 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
Polencentral | - | - | - | - | - | 450 K 10 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | 450 K 10 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
US - zuid-centraal | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | - | 450 K 10 M |
300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
swedencentral | 40 K | 80 K | 150 K | 30 K | 150 K 1 M |
450 K 10 M |
300 K | 240 K | 350 K | - | 350 K | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 100k | 250 K |
switzerlandnorth | 40 K | 80 K | - | 30 K | - | 450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
zwitserlandwest | - | - | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | - | 250 K |
uksouth | - | - | 80 K | - | - | 450 K 10 M |
240 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | 450 K 10 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
- | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
Beschikbaarheid van ingerichte implementatiemodellen
Regio | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | - | ✅ | - | - |
Polencentral | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
US - zuid-centraal | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
zwitserlandwest | - | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Notitie
De ingerichte versie van gpt-4
versie: turbo-2024-04-09
is momenteel beperkt tot alleen tekst.
Hoe kan ik toegang krijgen tot Ingericht?
U moet contact opnemen met uw Microsoft-verkoop-/accountteam om ingerichte doorvoer te verkrijgen. Als u momenteel geen verkoop-/accountteam hebt, kunt u geen ingerichte doorvoer aanschaffen.
Zie onze richtlijnen voor ingerichte implementaties voor meer informatie over ingerichte implementaties.
Wereldwijde beschikbaarheid van standaardmodellen
Ondersteunde modellen:
gpt-4o
Versie:2024-05-13
Ondersteunde regio's:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- Polencentral
- southafricanorth
- US - zuid-centraal
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
Beschikbaarheid van GPT-4- en GPT-4 Turbo-modellen
Regio's voor openbare clouds
Regio | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ |
eastus | - | - | ✅ | - | - | ✅ | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - |
francecentral | ✅ | ✅ | - | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - |
norwayeast | - | ✅ | - | - | - | - | - |
US - zuid-centraal | - | - | ✅ | - | - | ✅ | - |
southindia | - | ✅ | - | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - | - |
westus | - | ✅ | - | ✅ | - | ✅ | - |
westus3 | - | ✅ | - | - | - | ✅ | - |
Klanttoegang selecteren
Naast de bovenstaande regio's die beschikbaar zijn voor alle Azure OpenAI-klanten, hebben sommige vooraf bestaande klanten toegang gekregen tot versies van GPT-4 in extra regio's:
Modelleren | Regio |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
VS - oost Frankrijk - centraal VS - zuid-centraal Verenigd Koninkrijk Zuid |
gpt-4 (0613) gpt-4-32k (0613) |
VS - oost VS - oost 2 Japan - oost Verenigd Koninkrijk Zuid |
GPT-3.5-modellen
Belangrijk
Het NIEUWE gpt-35-turbo (0125)
model heeft verschillende verbeteringen, waaronder een hogere nauwkeurigheid bij het reageren in aangevraagde indelingen en een oplossing voor een fout die een tekstcoderingsprobleem veroorzaakte voor niet-Engelse functie-aanroepen.
GPT-3.5 Turbo wordt gebruikt met de Chat Completions-API. GPT-3.5 Turbo versie 0301 kan ook worden gebruikt met de Completions-API, hoewel dit niet wordt aanbevolen. GPT-3.5 Turbo-versies 0613 en 1106 bieden alleen ondersteuning voor de API voor chatvoltooiing.
GPT-3.5 Turbo versie 0301 is de eerste versie van het model dat is uitgebracht. Versie 0613 is de tweede versie van het model en voegt ondersteuning voor het aanroepen van functies toe.
Zie modelversies voor meer informatie over hoe Azure OpenAI Service modelversie-upgrades verwerkt en hoe u met modellen werkt om te leren hoe u de modelversie-instellingen van uw GPT-3.5 Turbo-implementaties kunt bekijken en configureren.
Beschikbaarheid van GPT-3.5-Turbo-modellen
Regio's voor openbare clouds
Regio | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
US - zuid-centraal | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
Modellen voor insluiten
Deze modellen kunnen alleen worden gebruikt met API-aanvragen voor insluiten.
Notitie
text-embedding-3-large
is het meest recente en meest geschikte insluitmodel. Upgraden tussen insluitingsmodellen is niet mogelijk. Als u wilt migreren van gebruik text-embedding-ada-002
naar, text-embedding-3-large
moet u nieuwe insluitingen genereren.
Model-id | Maximum aantal aanvragen (tokens) | Uitvoerdimensies | Trainingsgegevens (tot) |
---|---|---|---|
text-embedding-ada-002 (versie 2) |
8,191 | 1536 | Sep 2021 |
text-embedding-ada-002 (versie 1) |
2,046 | 1536 | Sep 2021 |
text-embedding-3-large |
8,191 | 3072 | Sep 2021 |
text-embedding-3-small |
8,191 | 1536 | Sep 2021 |
Notitie
Bij het verzenden van een matrix met invoer voor insluiten is het maximum aantal invoeritems in de matrix per aanroep naar het eindpunt voor insluiten 2048.
Regio's voor openbare clouds
Regio | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | tekst insluiten-3-klein, 1 | tekst-insluiten-3-groot, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | ✅ |
japaneast | - | ✅ | - | ✅ |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
US - zuid-centraal | ✅ | ✅ | - | - |
southindia | - | ✅ | - | ✅ |
swedencentral | - | ✅ | - | ✅ |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | ✅ |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | ✅ |
DALL-E-modellen
Model-id | Functiebeschikbaarheid | Maximum aantal aanvragen (tekens) |
---|---|---|
dalle2 (preview) | VS - oost | 1.000 |
dall-e-3 | VS - oost, Australië - oost, Zweden - centraal | 4000 |
Modellen verfijnen
babbage-002
en davinci-002
zijn niet getraind om instructies te volgen. Het uitvoeren van query's op deze basismodellen moet alleen worden uitgevoerd als referentiepunt voor een nauwkeurig afgestemde versie om de voortgang van uw training te evalueren.
gpt-35-turbo
- het verfijnen van dit model is beperkt tot een subset van regio's en is niet beschikbaar in elke regio waar het basismodel beschikbaar is.
Model-id | Regio's verfijnen | Maximum aantal aanvragen (tokens) | Trainingsgegevens (maximaal) |
---|---|---|---|
babbage-002 |
VS - noord-centraal Zweden - centraal Zwitserland - west |
16,384 | Sep 2021 |
davinci-002 |
VS - noord-centraal Zweden - centraal Zwitserland - west |
16,384 | Sep 2021 |
gpt-35-turbo (0613) |
VS - oost 2 VS - noord-centraal Zweden - centraal Zwitserland - west |
4096 | Sep 2021 |
gpt-35-turbo (1106) |
VS - oost 2 VS - noord-centraal Zweden - centraal Zwitserland - west |
Invoer: 16.385 Uitvoer: 4.096 |
Sep 2021 |
gpt-35-turbo (0125) |
VS - oost 2 VS - noord-centraal Zweden - centraal Zwitserland - west |
16,385 | Sep 2021 |
gpt-4 (0613) 1 |
VS - noord-centraal Zweden - centraal |
8192 | Sep 2021 |
11 GPT-4 fine-tuning is momenteel in openbare preview. Zie onze GPT-4 richtlijnen voor veiligheidsevaluatie voor meer informatie.
Fluistermodellen
Model-id | Beschikbaarheid van model | Maximale aanvraag (bestandsgrootte van audio) |
---|---|---|
whisper |
VS - oost 2 VS - noord-centraal Noorwegen - oost India - zuid Zweden - centraal Europa -west |
25 MB |
Tekst-naar-spraakmodellen (preview)
Model-id | Beschikbaarheid van model |
---|---|
tts-1 |
VS - noord-centraal Zweden - centraal |
tts-1-hd |
VS - noord-centraal Zweden - centraal |
Assistenten (preview)
Voor assistenten hebt u een combinatie van een ondersteund model en een ondersteunde regio nodig. Voor bepaalde hulpprogramma's en mogelijkheden zijn de nieuwste modellen vereist. De volgende modellen zijn beschikbaar in de Assistants-API, SDK, Azure AI Studio en Azure OpenAI Studio. De volgende tabel is voor betalen per gebruik. Zie ingerichte doorvoer voor informatie over de beschikbaarheid van ingerichte doorvoereenheden (PTU). De vermelde modellen en regio's kunnen worden gebruikt met zowel Assistenten v1 als v2.
Regio | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
---|---|---|---|---|---|---|---|
Australië - oost | ✅ | ✅ | ✅ | ✅ | |||
VS - oost | ✅ | ✅ | ✅ | ||||
VS - oost 2 | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Frankrijk - centraal | ✅ | ✅ | ✅ | ✅ | |||
Japan East | ✅ | ||||||
Noorwegen - oost | ✅ | ||||||
Zweden - centraal | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |
Verenigd Koninkrijk Zuid | ✅ | ✅ | ✅ | ✅ | |||
VS - west | ✅ | ✅ | ✅ | ||||
US - west 3 | ✅ | ✅ |
Buitengebruikstelling van model
Raadpleeg de handleiding voor buitengebruikstelling van modellen voor de meest recente informatie over buitengebruikstelling van modellen.
Volgende stappen
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor