Nyheter i Azure OpenAI-tjänsten

Artikel
10/22/2024

Den här artikeln innehåller en sammanfattning av de senaste versionerna och viktiga dokumentationsuppdateringar för Azure OpenAI.

Oktober 2024

STANDARDdistributionstyp för NY datazon

Standarddistributioner av datazoner är tillgängliga i samma Azure OpenAI-resurs som alla andra Azure OpenAI-distributionstyper, men gör att du kan använda global Azure-infrastruktur för att dynamiskt dirigera trafik till datacentret i Den Microsoft-definierade datazonen med bästa tillgänglighet för varje begäran. Datazonstandarden ger högre standardkvoter än våra azure-geografibaserade distributionstyper. Standarddistributioner för datazoner stöds på gpt-4o-2024-08-06, gpt-4o-2024-05-13och gpt-4o-mini-2024-07-18 modeller.

Mer information finns i guiden för distributionstyper.

Global Batch GA

Azure OpenAI global batch är nu allmänt tillgänglig.

Azure OpenAI Batch-API:et är utformat för att effektivt hantera storskaliga och stora bearbetningsuppgifter. Bearbeta asynkrona grupper av begäranden med separat kvot, med 24-timmars målomställning, till 50 % lägre kostnad än global standard. Med batchbearbetning skickar du ett stort antal begäranden i en enda fil i stället för att skicka en begäran i taget. Globala batchbegäranden har en separat kvot för kodad token som undviker avbrott i dina onlinearbetsbelastningar.

De främsta användningsfallen är:

Storskalig databearbetning: Analysera snabbt omfattande datamängder parallellt.
Innehållsgenerering: Skapa stora mängder text, till exempel produktbeskrivningar eller artiklar.
Dokumentgranskning och sammanfattning: Automatisera granskning och sammanfattning av långa dokument.
Kundsupportautomatisering: Hantera flera frågor samtidigt för snabbare svar.
Dataextrahering och analys: Extrahera och analysera information från stora mängder ostrukturerade data.
NLP-uppgifter (Natural Language Processing): Utför uppgifter som attitydanalys eller översättning på stora datamängder.
Marknadsföring och anpassning: Generera anpassat innehåll och rekommendationer i stor skala.

Mer information om hur du kommer igång med globala batchdistributioner.

o1-preview och o1-mini modeller begränsad åtkomst

Modellerna o1-preview och o1-mini är nu tillgängliga för API-åtkomst och modelldistribution. Registrering krävs och åtkomst beviljas baserat på Microsofts berättigandekriterier.

Begär åtkomst: program för modell för begränsad åtkomst

Kunder som redan har godkänts och har åtkomst till modellen via lekplatsen för tidig åtkomst behöver inte ansöka igen. Du får automatiskt API-åtkomst. När åtkomsten har beviljats måste du skapa en distribution för varje modell.

API-stöd:

Stöd för modellerna i o1-serien har lagts till i API-versionen 2024-09-01-preview.

Parametern max_tokens har föråldrats och ersatts med den nya max_completion_tokens parametern. o1-seriemodeller fungerar bara med parametern max_completion_tokens .

Regiontillgänglighet:

Modeller är tillgängliga för standard- och global standarddistribution i USA, östra 2 och Sverige centrala för godkända kunder.

Nytt GPT-4o Realtime API för offentlig förhandsversion av tal och ljud

Azure OpenAI GPT-4o-ljud är en del av GPT-4o-modellfamiljen som stöder konversationsinteraktioner med låg latens, "tal in, tal ut". GPT-4o-ljud-API realtime :et är utformat för att hantera konversationsinteraktioner med låg latens i realtid, vilket gör det till en bra plats för användningsfall som involverar liveinteraktioner mellan en användare och en modell, till exempel kundsupportagenter, röstassistenter och realtidsöversättare.

Modellen gpt-4o-realtime-preview är tillgänglig för globala distributioner i regionerna USA, östra 2 och Sverige, centrala.

Mer information finns i gpt-4o-dokumentationen för realtidsljud.

Globala batchstöduppdateringar

Global batch stöder nu GPT-4o (2024-08-06). Mer information finns i guiden för att komma igång med den globala batchen.

September 2024

Azure OpenAI Studio UX-uppdateringar

Den 19 september, när du kommer åt Azure OpenAI Studio , kommer du inte längre att se det äldre studiogränssnittet som standard. Om det behövs kan du fortfarande gå tillbaka till den tidigare upplevelsen med hjälp av växla till det gamla utseendet i det övre fältet i användargränssnittet under de kommande veckorna. Om du byter tillbaka till äldre Studio-användargränssnitt hjälper det dig att fylla i feedbackformuläret för att meddela oss varför. Vi övervakar aktivt den här feedbacken för att förbättra den nya upplevelsen.

GPT-4o 2024-08-06 etablerade distributioner

GPT-4o 2024-08-06 är nu tillgängligt för etablerade distributioner i USA, östra, USA, östra 2, USA, norra centrala och Sverige, centrala. Den är också tillgänglig för globala etablerade distributioner.

Den senaste informationen om modelltillgänglighet finns på sidan modeller.

NY global etablerad distributionstyp

Globala distributioner är tillgängliga i samma Azure OpenAI-resurser som icke-globala distributionstyper, men gör att du kan utnyttja Azures globala infrastruktur för att dynamiskt dirigera trafik till datacentret med bästa tillgänglighet för varje begäran. Globala etablerade distributioner ger reserverad modellbearbetningskapacitet för högt och förutsägbart dataflöde med azures globala infrastruktur. Globala etablerade distributioner stöds på gpt-4o-2024-08-06 och gpt-4o-mini-2024-07-18 modeller.

Mer information finns i guiden för distributionstyper.

NYA o1-preview- och o1-mini-modeller tillgängliga för begränsad åtkomst

Azure OpenAI o1-preview och o1-mini modeller är utformade för att hantera resonemang och problemlösningsuppgifter med ökat fokus och ökad kapacitet. Dessa modeller ägnar mer tid åt att bearbeta och förstå användarens begäran, vilket gör dem exceptionellt starka inom områden som vetenskap, kodning och matematik jämfört med tidigare iterationer.

Viktiga funktioner i o1-serien

Komplex kodgenerering: Kan generera algoritmer och hantera avancerade kodningsuppgifter för att stödja utvecklare.
Avancerad problemlösning: Perfekt för omfattande brainstormingsessioner och hantering av mångfacetterade utmaningar.
Komplex dokumentjämförelse: Perfekt för att analysera kontrakt, ärendefiler eller juridiska dokument för att identifiera subtila skillnader.
Instruktion efter och arbetsflödeshantering: Särskilt effektivt för att hantera arbetsflöden som kräver kortare kontexter.

Modellvarianter

o1-preview: o1-preview är mer kapabel till seriemodellerna o1 .
o1-mini: o1-mini är den snabbare och billigare av o1 serien modeller.

Modellversion: 2024-09-12

Begär åtkomst: program för modell för begränsad åtkomst

Begränsningar

Seriemodellerna o1 är för närvarande i förhandsversion och innehåller inte vissa funktioner som är tillgängliga i andra modeller, till exempel bildtolkning och strukturerade utdata som är tillgängliga i den senaste GPT-4o-modellen. För många uppgifter kan de allmänt tillgängliga GPT-4o-modellerna fortfarande vara mer lämpliga.

Säkerhet

OpenAI har införlivat ytterligare säkerhetsåtgärder i o1 modellerna, inklusive nya tekniker för att hjälpa modellerna att vägra osäkra begäranden. Dessa framsteg gör o1 serien till några av de mest robusta modellerna tillgängliga.

Tillgänglighet

Och o1-preview o1-mini är tillgängliga i regionen USA, östra 2 för begränsad åtkomst via AI Studio early access playground. Databearbetning för o1 modellerna kan ske i en annan region än där de är tillgängliga för användning.

För att prova o1-preview modellerna och o1-mini i registreringen av den tidiga åtkomstlekplatsen krävs åtkomst baserat på Microsofts berättigandekriterier.

Begär åtkomst: program för modell för begränsad åtkomst

När åtkomsten har beviljats måste du:

Navigera till https://ai.azure.com/resources och välj en resurs i eastus2 regionen. Om du inte har någon Azure OpenAI-resurs i den här regionen måste du skapa en.
När Azure OpenAI-resursen eastus2 har valts går du till den övre vänstra panelen under Lekplatser och väljer Early access playground (förhandsversion).

Augusti 2024

GPT-4o 2024-08-06 strukturerade utdata

Tillgänglig för standarddistributioner och globala distributioner i alla USA-regioner och Sweden Central.
Den här modellen lägger till stöd för strukturerade utdata.

GPT-4o minietablerade distributioner

GPT-4o mini är nu tillgängligt för etablerade distributioner i Kanada, östra, USA, östra, USA, östra 2, USA, norra centrala och Sverige, centrala.

Den senaste informationen om modelltillgänglighet finns på sidan modeller.

GPT-4o finjustering (offentlig förhandsversion)

GPT-4o finjustering är nu tillgängligt för Azure OpenAI i offentlig förhandsversion i USA, norra centrala och Sverige, centrala.

Mer information finns i vårt blogginlägg.

Ny förhandsversion av API

API-versionen 2024-07-01-preview är den senaste versionen av api för redigering av dataplan och slutsatsdragnings-API. Den ersätter API-versionen 2024-05-01-preview och lägger till stöd för:

Stöd för Batch API har lagts till
Strategiparametrar för segmentering av vektorlager
max_num_results att filsökningsverktyget ska mata ut.

Mer information finns i vår referensdokumentation

GPT-4o mini regional tillgänglighet

GPT-4o mini är tillgängligt för standard- och global standarddistribution i regionerna USA, östra och Sverige, centrala.
GPT-4o mini är tillgängligt för global batchdistribution i regionerna USA, östra, Sverige, centrala och USA, västra.

Utvärderingsguide

Nytt blogginlägg om att komma igång med modellutvärderingar. Vi rekommenderar att du använder den här guiden som en del av modelluppgraderings - och tillbakadragningsprocessen.

Den senaste GPT-4o-modellen finns på lekplatsen för tidig åtkomst (förhandsversion)

Den 6 augusti 2024 tillkännagav OpenAI den senaste versionen av deras flaggskepp GPT-4o-modellversion 2024-08-06. GPT-4o 2024-08-06 har alla funktioner i den tidigare versionen samt:

En förbättrad förmåga att stödja komplexa strukturerade utdata.
Maxutdatatoken har ökats från 4 096 till 16 384.

Azure-kunder kan testa GPT-4o 2024-08-06 idag i den nya AI Studio early access playground (förhandsversion).

Till skillnad från den tidigare lekplatsen för tidig åtkomst kräver AI Studio early access playground (förhandsversion) inte att du har en resurs i en viss region.

Kommentar

Frågor och slutföranden som görs via lekplatsen för tidig åtkomst (förhandsversion) kan bearbetas i valfri Azure OpenAI-region och omfattas för närvarande av en gräns på 10 begäranden per minut per Azure-prenumeration. Den här gränsen kan komma att ändras i framtiden.

Azure OpenAI-tjänstens missbruksövervakning är aktiverad för alla användare med tidig åtkomst, även om den godkänns för ändring. standardinnehållsfilter är aktiverade och kan inte ändras.

Om du vill testa GPT-4o 2024-08-06loggar du in på Azure AI Early Access Playground (förhandsversion) med hjälp av den här länken.

Globala batchdistributioner är nu tillgängliga

De främsta användningsfallen är:

Storskalig databearbetning: Analysera snabbt omfattande datamängder parallellt.
Innehållsgenerering: Skapa stora mängder text, till exempel produktbeskrivningar eller artiklar.
Dokumentgranskning och sammanfattning: Automatisera granskning och sammanfattning av långa dokument.
Kundsupportautomatisering: Hantera flera frågor samtidigt för snabbare svar.
Dataextrahering och analys: Extrahera och analysera information från stora mängder ostrukturerade data.
NLP-uppgifter (Natural Language Processing): Utför uppgifter som attitydanalys eller översättning på stora datamängder.
Marknadsföring och anpassning: Generera anpassat innehåll och rekommendationer i stor skala.

Mer information om hur du kommer igång med globala batchdistributioner.

Juli 2024

GPT-4o mini är nu tillgänglig för finjustering

GPT-4o mini finjustering finns nu tillgänglig i offentlig förhandsversion i Sverige, centrala och i USA, norra centrala.

Verktyget Filsökning för assistenter faktureras nu

Filsökningsverktyget för assistenter har nu ytterligare avgifter för användning. Mer information finns på sidan med prissättning.

GPT-4o minimodell tillgänglig för distribution

GPT-4o mini är den senaste Azure OpenAI-modellen som först tillkännagavs den 18 juli 2024:

"GPT-4o mini gör det möjligt för kunder att leverera fantastiska program till en lägre kostnad med blixtrande hastighet. GPT-4o mini är betydligt smartare än GPT-3.5 Turbo – med 82 % poäng på mätning av mmlu (Massive Multitask Language Understanding) jämfört med 70 % – och är mer än 60 % billigare.1 Modellen levererar ett utökat 128 000-sammanhangsfönster och integrerar de förbättrade flerspråkiga funktionerna i GPT-4o, vilket ger större kvalitet till språk från hela världen."

Modellen är för närvarande tillgänglig för både standard- och global standarddistribution i regionen USA, östra.

Information om modellkvot finns på sidan med kvoter och gränser och för den senaste informationen om modelltillgänglighet, se sidan modeller.

Ny princip för ansvarsfull AI-standardinnehållsfiltrering

Den nya standardprincipen DefaultV2 för innehållsfiltrering ger de senaste säkerhets- och säkerhetsreduceringarna för GPT-modellserien (text), inklusive:

Fråga Shields om jailbreak-attacker på användarprompter (filter),
Skyddad materialidentifiering för text (filter) vid modellavslut
Skyddad materialidentifiering för kod (kommentera) vid modellavslut

Även om det inte finns några ändringar i innehållsfilter för befintliga resurser och distributioner (standardkonfigurationer eller anpassade innehållsfiltreringskonfigurationer förblir oförändrade), ärver nya resurser och GPT-distributioner automatiskt den nya innehållsfiltreringsprincipen DefaultV2. Kunder har möjlighet att växla mellan säkerhetsstandarder och skapa anpassade konfigurationer för innehållsfiltrering.

Mer information finns i dokumentationen om standardsäkerhetsprinciper.

Ny GA API-version

API-versionen 2024-06-01 är den senaste versionen av GA-dataplanets slutsatsdragnings-API. Den ersätter API-versionen 2024-02-01 och lägger till stöd för:

inbäddningar encoding_format och dimensions parametrar.
chattavslut logprobs och top_logprobs parametrar.

Mer information finns i referensdokumentationen för dataplanets slutsatsdragning.

Expansion av tillgängliga regioner för globala standarddistributioner av gpt-4o

GPT-4o är nu tillgängligt för globala standarddistributioner i:

australiaeast
Brasilien, södra
canadaeast
eastus
eastus2
francecentral git
germanywestcentral
Japan, östra
koreacentral
northcentralus
norwayeast
polencentral
southafricanorth
USA, södra centrala
southindia
swedencentral
switzerlandnorth
uksouth
Europa, västra
westus
westus3

Information om global standardkvot finns på sidan med kvoter och gränser.

Juni 2024

Uppdateringar av pensionsdatum

Senast den 1 oktober 2024 uppdaterades gpt-35-turbo 0301.
Uppdaterad gpt-35-turbo & gpt-35-turbo-16k0613 pensioneringsdatum till 1 oktober 2024.
Uppdaterad gpt-4 & gpt-4-32k 0314 utfasningsdatum till 1 oktober 2024 och pensionsdatum till 6 juni 2025.

Se vår modellpensionsguide för den senaste informationen om modellutfasning och pensionering.

Tokenbaserad fakturering för finjustering

Faktureringen för Finjustering av Azure OpenAI baseras nu på antalet token i träningsfilen – i stället för den totala förflutna träningstiden. Detta kan leda till en betydande kostnadsminskning för vissa träningskörningar och gör det mycket enklare att beräkna finjusteringskostnaderna. Mer information finns i det officiella meddelandet.

GPT-4o släppt i nya regioner

GPT-4o är nu också tillgängligt i:
- Sverige, centrala för regional standarddistribution.
- Australien, östra, Kanada, östra, Japan, östra, Korea, centrala, Sverige, centrala, Schweiz, norra och USA, västra 3 för etablerad distribution.

Den senaste informationen om modelltillgänglighet finns på sidan modeller.

Stöd för kundhanterad nyckel (CMK) för assistenter

Trådar och filer i assistenter stöder nu CMK i följande region:

USA, västra 3

Maj 2024

GPT-4o-etablerade distributioner

gpt-4o Version: 2024-05-13 är tillgänglig för både standarddistributioner och etablerade distributioner. Etablerings- och standardmodelldistributioner accepterar både begäranden om text- och bild-/visionsinferens. Information om regional tillgänglighet för modeller finns i modellmatrisen för etablerade distributioner.

Assistenter v2 (förhandsversion)

En uppdatering av API:et assistenter är nu offentligt tillgänglig. Den innehåller följande uppdateringar:

Filsökningsverktyg och vektorlagring
Maximalt slutförande och maximalt stöd för token för att hantera tokenanvändning.
tool_choiceparameter för att tvinga assistenten att använda ett angivet verktyg. Nu kan du skapa meddelanden med assistentrollen för att skapa anpassade konversationshistoriker i trådar.
Stöd för parametrarna temperature, top_p. response_format
Stöd för strömning och avsökning. Du kan använda hjälpfunktionerna i vår Python SDK för att skapa körningar och strömma svar. Vi har också lagt till SDK-hjälp för avsökning för att dela objektstatusuppdateringar utan behov av avsökning.
Experimentera med Logic Apps och funktionsanrop med Hjälp av Azure OpenAI Studio. Importera dina REST-API:er som implementerats i Logic Apps som funktioner och studion anropar funktionen (som ett Logic Apps-arbetsflöde) automatiskt baserat på användarens uppmaning.
AutoGen från Microsoft Research tillhandahåller ett konversationsramverk med flera agenter för att möjliggöra bekväm skapande av LLM-arbetsflöden (Large Language Model) i en mängd olika program. Azure OpenAI-assistenter är nu integrerade i AutoGen via GPTAssistantAgent, en ny experimentell agent som gör att du smidigt kan lägga till assistenter i AutoGen-baserade arbetsflöden för flera agenter. Detta möjliggör flera Azure OpenAI-assistenter som kan vara uppgifts- eller domänspecialiserade för att samarbeta och hantera komplexa uppgifter.
Stöd för finjusterade gpt-3.5-turbo-0125 modeller i följande regioner:
- USA, östra 2
- Sverige, centrala
Utökat regionalt stöd för:
- Japan, östra
- Storbritannien, södra
- Västra USA
- USA, västra 3
- Norge, östra

Mer information finns i blogginlägget om assistenter.

Allmän tillgänglighet för GPT-4o-modell (GA)

GPT-4o ("o är för "omni") är den senaste modellen från OpenAI som lanserades den 13 maj 2024.

GPT-4o integrerar text och bilder i en enda modell, vilket gör att den kan hantera flera datatyper samtidigt. Den här multimodala metoden förbättrar noggrannheten och svarstiden i interaktioner mellan människa och dator.
GPT-4o matchar GPT-4 Turbo i engelska text- och kodningsuppgifter samtidigt som det ger överlägsen prestanda på icke-engelska språk och i visionsuppgifter, vilket sätter nya riktmärken för AI-funktioner.

Information om regional tillgänglighet för modeller finns på sidan modeller.

Global standarddistributionstyp (förhandsversion)

Globala distributioner är tillgängliga i samma Azure OpenAI-resurser som icke-globala erbjudanden, men du kan använda Azures globala infrastruktur för att dynamiskt dirigera trafik till datacentret med bästa tillgänglighet för varje begäran. Global standard ger den högsta standardkvoten för nya modeller och eliminerar behovet av belastningsutjämning för flera resurser.

Mer information finns i guiden för distributionstyper.

Finjustera uppdateringar

GPT-4-finjustering är nu tillgängligt i offentlig förhandsversion.
Stöd har lagts till för startvärde, händelser, fullständig valideringsstatistik och kontrollpunkter som en del av API-versionen2024-05-01-preview.

DALL-E och GPT-4 Turbo Vision GA konfigurerbara innehållsfilter

Skapa anpassade innehållsfilter för DALL-E 2 och 3, GPT-4 Turbo med Vision GA (turbo-2024-04-09) och GPT-4o-distributioner. Innehållsfiltrering

Asynkront filter tillgängligt för alla Azure OpenAI-kunder

Det är nu tillgängligt för alla Azure OpenAI-kunder att köra filter asynkront för förbättrad svarstid i strömningsscenarier. Innehållsfiltrering

Prompt Shields

Prompt Shields skyddar program som drivs av Azure OpenAI-modeller från två typer av attacker: direkt (jailbreak) och indirekta attacker. Indirekta attacker (kallas även indirekta promptattacker eller inmatningsattacker mellan domäner) är en typ av angrepp på system som drivs av Generative AI-modeller som kan inträffa när ett program bearbetar information som inte har skapats direkt av programmets utvecklare eller användaren. Innehållsfiltrering

Api-versionen 2024-05-01-preview

Mer information finns i livscykeln för API-versionen.

GPT-4 Turbo modell allmän tillgänglighet (GA)

Den senaste GA-versionen av GPT-4 Turbo är:

gpt-4Version: turbo-2024-04-09

Detta är ersättningen för följande förhandsversionsmodeller:

gpt-4Version: 1106-Preview
gpt-4Version: 0125-Preview
gpt-4Version: vision-preview

Skillnader mellan OpenAI- och Azure OpenAI GPT-4 Turbo GA-modeller

OpenAI:s version av den senaste 0409 turbomodellen stöder JSON-läge och funktionsanrop för alla slutsatsdragningsbegäranden.
Azure OpenAI:s version av den senaste turbo-2024-04-09 stöder för närvarande inte användning av JSON-läge och funktionsanrop när du gör slutsatsdragningsbegäranden med bildindata (vision). Textbaserade indatabegäranden (begäranden utan image_url och infogade bilder) stöder JSON-läge och funktionsanrop.

Skillnader från gpt-4 vision-preview

Integrering av Azure AI-specifika visionsförbättringar med GPT-4 Turbo med Vision stöds inte för gpt-4 version: turbo-2024-04-09. Detta inkluderar optisk teckenigenkänning (OCR), objekt grounding, video prompts och förbättrad hantering av dina data med bilder.

Viktigt!

Vision förbättringar förhandsversionsfunktioner inklusive optisk teckenigenkänning (OCR), objekt jordning, video prompter kommer att dras tillbaka och inte längre tillgänglig när gpt-4 Version: vision-preview uppgraderas till turbo-2024-04-09. Om du för närvarande förlitar dig på någon av dessa förhandsversionsfunktioner blir den här automatiska modelluppgraderingen en icke-bakåtkompatibel ändring.

GPT-4 Turbo-etablerad hanterad tillgänglighet

gpt-4Version: turbo-2024-04-09 är tillgängligt för både standarddistributioner och etablerade distributioner. Den etablerade versionen av den här modellen stöder för närvarande inte begäranden om bild-/syninferens. Etablerade distributioner av den här modellen accepterar endast textinmatning. Standardmodelldistributioner accepterar både begäranden om text- och bild-/visionsinferens.

Distribuera GPT-4 Turbo med Vision GA

Om du vill distribuera GA-modellen från Studio-användargränssnittet väljer du GPT-4 och väljer turbo-2024-04-09 sedan versionen på den nedrullningsbara menyn. Standardkvoten för gpt-4-turbo-2024-04-09 modellen är samma som den aktuella kvoten för GPT-4-Turbo. Se de regionala kvotgränserna.

April 2024

Finjustering stöds nu i två nya regioner USA, östra 2 och Schweiz, västra

Finjustering är nu tillgängligt med stöd för:

USA, östra 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Schweiz, västra

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Kontrollera modellsidan för den senaste informationen om modelltillgänglighet och finjusteringsstöd i varje region.

Exempel på chattträning med flera svängar

Finjustering stöder nu chattträningsexempel för flera svängar.

GPT-4 (0125) är tillgängligt för Azure OpenAI på dina data

Nu kan du använda GPT-4-modellen (0125) i tillgängliga regioner med Azure OpenAI På dina data.

Mars 2024

Risker och säkerhetsövervakning i Azure OpenAI Studio

Azure OpenAI Studio tillhandahåller nu en instrumentpanel för risker och säkerhet för var och en av dina distributioner som använder en konfiguration av innehållsfilter. Använd den för att kontrollera resultatet av filtreringsaktiviteten. Sedan kan du justera filterkonfigurationen för att bättre uppfylla dina affärsbehov och uppfylla principerna för ansvarsfull AI.

Använda risker och säkerhetsövervakning

Azure OpenAI på dina datauppdateringar

Nu kan du ansluta till en Elasticsearch-vektordatabas som ska användas med Azure OpenAI på dina data.
Du kan använda parametern segmentstorlek under datainmatningen för att ange det maximala antalet token för ett visst datasegment i ditt index.

API för allmän tillgänglighet 2024-02-01 har släppts

Det här är den senaste GA API-versionen och ersätter den tidigare 2023-05-15 GA-versionen. Den här versionen ger stöd för de senaste Azure OpenAI GA-funktionerna som Whisper, DALLE-3, finjustering, data med mera.

Funktioner som finns i förhandsversion, till exempel assistenter, text till tal (TTS) och några av datakällorna "på dina data" kräver en förhandsversion av API:et. Mer information finns i vår livscykelguide för API-versionen.

Allmän tillgänglighet för Whisper (GA)

Whisper-tal till text-modellen är nu GA för både REST och Python. Klientbibliotekets SDK:er är för närvarande fortfarande i offentlig förhandsversion.

Prova Whisper genom att följa en snabbstart.

Allmän tillgänglighet för DALL-E 3 (GA)

DALL-E 3-avbildningsgenereringsmodellen är nu GA för både REST och Python. Klientbibliotekets SDK:er är för närvarande fortfarande i offentlig förhandsversion.

Prova DALL-E 3 genom att följa en snabbstart.

Nytt regionalt stöd för DALL-E 3

Nu kan du komma åt DALL-E 3 med en Azure OpenAI-resurs i East US eller AustraliaEast Azure-regionen, förutom SwedenCentral.

Modellutfasningar och tillbakadragningar

Vi har lagt till en sida för att spåra modellutfasningar och tillbakadragningar i Azure OpenAI Service. Den här sidan innehåller information om de modeller som för närvarande är tillgängliga, inaktuella och tillbakadragna.

2024-03-01-preview API släppt

2024-03-01-preview har samma funktioner som 2024-02-15-preview och lägger till två nya parametrar för inbäddningar:

encoding_format gör att du kan ange formatet för att generera inbäddningar i float, eller base64. Standardvärdet är float.
dimensions gör att du kan ange antalet inbäddningar för utdata. Den här parametern stöds bara med den nya tredje generationens inbäddningsmodeller: text-embedding-3-large, text-embedding-3-small. Vanligtvis är större inbäddningar dyrare ur ett beräknings-, minnes- och lagringsperspektiv. Att kunna justera antalet dimensioner ger mer kontroll över den totala kostnaden och prestandan. Parametern dimensions stöds inte i alla versioner av OpenAI 1.x Python-biblioteket, för att dra nytta av den här parametern rekommenderar vi att du uppgraderar till den senaste versionen: pip install openai --upgrade.

Om du för närvarande använder en förhandsversion av API:et för att dra nytta av de senaste funktionerna rekommenderar vi att du läser artikeln om API-versionens livscykel för att spåra hur länge din aktuella API-version kommer att stödjas.

Uppdatera till GPT-4-1106-Preview-uppgraderingsplaner

Distributionsuppgraderingen av gpt-4 1106-Preview till 0125-Preview som är planerad till gpt-4 den 8 mars 2024 äger inte längre rum. Distributioner av gpt-4 version 1106-Preview och 0125-Preview inställda på "Automatisk uppdatering till standard" och "Uppgradera när den har upphört att gälla" börjar uppgraderas när en stabil version av modellen har släppts.

Mer information om uppgraderingsprocessen finns på sidan modeller.

Februari 2024

GPT-3.5-turbo-0125 modell tillgänglig

Den här modellen har olika förbättringar, inklusive högre noggrannhet vid svar i begärda format och en korrigering för ett fel som orsakade ett problem med textkodning för funktionsanrop som inte är engelskspråkiga.

Information om regional tillgänglighet och uppgraderingar för modeller finns på sidan modeller.

Modeller för inbäddning i tredje generationen är tillgängliga

text-embedding-3-large
text-embedding-3-small

Vid testning rapporterar OpenAI att både den stora och den lilla tredje generationens inbäddningsmodeller ger bättre genomsnittlig prestanda för flerspråkshämtning med MIRACL-riktmärket samtidigt som bättre prestanda bibehålls för engelska uppgifter med MTEB-riktmärket än andra generationens textinbäddnings-ada-002-modell.

Information om regional tillgänglighet och uppgraderingar för modeller finns på sidan modeller.

GPT-3.5 Turbo kvotkonsolidering

För att förenkla migreringen mellan olika versioner av GPT-3.5-Turbo-modellerna (inklusive 16k) konsoliderar vi alla GPT-3.5-Turbo-kvoter till ett enda kvotvärde.

Alla kunder som har ökat kvoten har en kombinerad total kvot som återspeglar de tidigare ökningarna.
Alla kunder vars aktuella totala användning i modellversioner är mindre än standard får som standard en ny kombinerad total kvot.

GPT-4-0125-preview-modell tillgänglig

Modellversionen gpt-4 0125-preview är nu tillgänglig i Azure OpenAI Service i regionerna USA, östra, USA, norra centrala och USA, södra centrala. Kunder med distributioner av gpt-4 version 1106-preview uppgraderas automatiskt till 0125-preview under de kommande veckorna.

Information om regional tillgänglighet och uppgraderingar för modeller finns på sidan modeller.

Api:et för assistenter – offentlig förhandsversion

Azure OpenAI har nu stöd för API:et som driver OpenAI:s GPTs. Med Azure OpenAI Assistants (förhandsversion) kan du skapa AI-assistenter som är skräddarsydda för dina behov genom anpassade instruktioner och avancerade verktyg som kodtolkare och anpassade funktioner. Mer information finns i:

Offentlig förhandsversion av OpenAI-text till talröster

Azure OpenAI Service stöder nu text-till-tal-API:er med OpenAI:s röster. Hämta AI-genererat tal från texten du anger. Mer information finns i översiktsguiden och prova snabbstarten.

Kommentar

Azure AI Speech stöder även OpenAI-text till talröster. Mer information finns i OpenAI-text till talröster via Azure OpenAI Service eller via Azure AI Speech-guide .

Nya finjusteringsfunktioner och modellstöd

Nytt regionalt stöd för Azure OpenAI På dina data

Nu kan du använda Azure OpenAI på dina data i följande Azure-region:

Sydafrika, norra

Allmän tillgänglighet för Azure OpenAI på dina data

Azure OpenAI På dina data är nu allmänt tillgängligt.

December 2023

Azure OpenAI på dina data

Fullständigt VPN- och privat slutpunktsstöd för Azure OpenAI På dina data, inklusive säkerhetsstöd för: lagringskonton, Azure OpenAI-resurser och Azure AI-tjänsten Search resurser.
Ny artikel för att använda Azure OpenAI på dina data på ett säkert sätt genom att skydda data med virtuella nätverk och privata slutpunkter.

GPT-4 Turbo med Vision nu tillgänglig

GPT-4 Turbo med Vision på Azure OpenAI-tjänsten är nu i offentlig förhandsversion. GPT-4 Turbo with Vision är en stor multimodal modell (LMM) utvecklad av OpenAI som kan analysera bilder och ge textsvar på frågor om dem. Den innehåller både bearbetning av naturligt språk och visuell förståelse. Med förbättrat läge kan du använda Funktionerna i Azure AI Vision för att generera ytterligare insikter från bilderna.

Utforska funktionerna i GPT-4 Turbo with Vision i en kodfri upplevelse med Hjälp av Azure OpenAI Playground. Läs mer i snabbstartsguiden.
Visionsförbättring med GPT-4 Turbo with Vision är nu tillgängligt i Azure OpenAI Playground och innehåller stöd för optisk teckenigenkänning, objektgrundning, bildstöd för "lägg till dina data" och stöd för videoprompt.
Gör anrop till chatt-API:et direkt med hjälp av REST-API:et.
Regiontillgängligheten är för närvarande begränsad till SwitzerlandNorth, SwedenCentral, WestUSoch AustraliaEast
Läs mer om de kända begränsningarna i GPT-4 Turbo with Vision och andra vanliga frågor.

November 2023

Stöd för ny datakälla i Azure OpenAI på dina data

Nu kan du använda Azure Cosmos DB for MongoDB vCore och URL:er/webbadresser som datakällor för att mata in dina data och chatta med en Azure OpenAI-modell som stöds.

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 släppt

Båda modellerna är den senaste versionen från OpenAI med förbättrad instruktion som följer, JSON-läge, reproducerbara utdata och parallella funktionsanrop.

GPT-4 Turbo Preview har ett maximalt kontextfönster på 128 000 token och kan generera 4 096 utdatatoken. Den har de senaste träningsdata med kunskap fram till april 2023. Den här modellen är i förhandsversion och rekommenderas inte för produktionsanvändning. Alla distributioner av den här förhandsversionsmodellen uppdateras automatiskt när den stabila versionen blir tillgänglig.
GPT-3.5-Turbo-1106 har ett maximalt kontextfönster på 16 385 token och kan generera 4 096 utdatatoken.

Information om modellens regionala tillgänglighet finns på modellsidan.

Modellerna har sina egna unika kvotallokeringar per region.

Offentlig förhandsversion av DALL-E 3

DALL-E 3 är den senaste avbildningsgenereringsmodellen från OpenAI. Den har förbättrad bildkvalitet, mer komplexa scener och bättre prestanda vid återgivning av text i bilder. Den levereras också med fler alternativ för proportioner. DALL-E 3 är tillgängligt via OpenAI Studio och via REST-API:et. Din OpenAI-resurs måste finnas i Azure-regionen SwedenCentral .

DALL-E 3 innehåller inbyggd snabbskrivning för att förbättra bilder, minska bias och öka den naturliga variationen.

Prova DALL-E 3 genom att följa en snabbstart.

Ansvarsfull AI

Utökad kundkonfigurerbarhet: Alla Azure OpenAI-kunder kan nu konfigurera alla allvarlighetsnivåer (låg, medelhög, hög) för kategorierna hat, våld, sexuell och självskadebeteende, inklusive att endast filtrera innehåll med hög allvarlighetsgrad. Konfigurera innehållsfilter
Autentiseringsuppgifter för innehåll i alla DALL-E-modeller: AI-genererade bilder från alla DALL-E-modeller innehåller nu en digital autentiseringsuppgift som visar innehållet som AI-genererat. Program som visar bildtillgångar kan använda SDK:n öppen källkod Content Authenticity Initiative för att visa autentiseringsuppgifter i sina AI-genererade bilder. Autentiseringsuppgifter för innehåll i Azure OpenAI
Nya RAI-modeller
- Riskidentifiering av jailbreakning: Jailbreak-attacker är användarfrågor som är utformade för att provocera Generative AI-modellen att uppvisa beteenden som den har tränats för att undvika eller bryta mot reglerna som anges i systemmeddelandet. Riskidentifieringsmodellen för jailbreak är valfri (standardav) och tillgänglig i kommentars- och filtermodellen. Den körs på användarmeddelanden.
- Skyddad materialtext: Skyddad materialtext beskriver känt textinnehåll (till exempel sångtexter, artiklar, recept och valt webbinnehåll) som kan matas ut av stora språkmodeller. Den skyddade materialtextmodellen är valfri (standard av) och tillgänglig i kommentars- och filtermodellen. Den körs på LLM-slutföranden.
- Kod för skyddat material: Skyddad materialkod beskriver källkod som matchar en uppsättning källkod från offentliga lagringsplatser, som kan matas ut av stora språkmodeller utan korrekt källlagringsplatser. Kodmodellen för skyddat material är valfri (standard av) och tillgänglig i kommentars- och filtermodellen. Den körs på LLM-slutföranden.
Konfigurera innehållsfilter
Blocklistor: Kunder kan nu snabbt anpassa beteendet för innehållsfilter för frågor och slutföranden ytterligare genom att skapa en anpassad blockeringslista i sina filter. Med den anpassade blocklistan kan filtret vidta åtgärder i en anpassad lista med mönster, till exempel specifika termer eller regexmönster. Förutom anpassade blocklistor tillhandahåller vi en Microsoft-lista över svordomar (engelska). Använda blocklistor

Oktober 2023

Nya finjusteringsmodeller (förhandsversion)

gpt-35-turbo-0613 är nu tillgänglig för finjustering.
babbage-002 och davinci-002 är nu tillgängliga för finjustering. Dessa modeller ersätter de äldre basmodellerna ada, babbage, curie och davinci som tidigare var tillgängliga för finjustering.
Finjusteringstillgängligheten är begränsad till vissa regioner. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.
Finjusterade modeller har andra kvotgränser än vanliga modeller.
Självstudie: finjustera GPT-3.5-Turbo

Azure OpenAI på dina data

Nya anpassade parametrar för att fastställa antalet hämtade dokument och strikthet.
- Strikthetsinställningen anger tröskelvärdet för att kategorisera dokument som relevanta för dina frågor.
- Inställningen hämtade dokument anger antalet dokument med högsta poäng från ditt dataindex som används för att generera svar.
Du kan se datainmatning/uppladdningsstatus i Azure OpenAI Studio.
Stöd för privata slutpunkter och VPN för blobcontainrar.

September 2023

GPT-4

GPT-4 och GPT-4-32k är nu tillgängliga för alla Azure OpenAI Service-kunder. Kunder behöver inte längre ansöka om att väntelistan ska använda GPT-4 och GPT-4-32k (registreringskraven för begränsad åtkomst fortsätter att gälla för alla Azure OpenAI-modeller). Tillgängligheten kan variera beroende på region. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

GPT-3.5 Turbo Instruera

Azure OpenAI Service stöder nu MODELLEN GPT-3.5 Turbo Instruct. Den här modellen har prestanda som är jämförbar med text-davinci-003 och är tillgänglig för användning med API:et Completions. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Viska offentlig förhandsversion

Azure OpenAI Service stöder nu api:er för tal till text som drivs av OpenAI:s Whisper-modell. Hämta AI-genererad text baserat på det talljud du tillhandahåller. Mer information finns i snabbstarten.

Kommentar

Azure AI Speech stöder även OpenAI:s Whisper-modell via batch-transkriptions-API:et. Mer information finns i guiden Skapa en batch-transkription . Ta en titt på Vad är Whisper-modellen? för att lära dig mer om när du ska använda Azure AI Speech jämfört med Azure OpenAI Service.

Nya regioner

Azure OpenAI finns nu även i regionerna Sverige, centrala och Schweiz, norra. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Regionala kvotgränser ökar

Ökar till maxgränsen för standardkvoter för vissa modeller och regioner. Om du migrerar arbetsbelastningar till dessa modeller och regioner kan du dra nytta av högre token per minut (TPM).

Augusti 2023

Azure OpenAI om dina egna datauppdateringar (förhandsversion)

Nu kan du distribuera Azure OpenAI på dina data till virtuella Power-agenter.
Azure OpenAI På dina data stöder nu privata slutpunkter.
Möjlighet att filtrera åtkomst till känsliga dokument.
Uppdatera indexet automatiskt enligt ett schema.
Sökalternativ för vektorer och semantisk sökning.
Visa din chatthistorik i den distribuerade webbappen

juli 2023

Stöd för funktionsanrop

Azure OpenAI stöder nu funktionsanrop så att du kan arbeta med funktioner i API:et för chattavslut.

Inbäddning av indatamatris ökar

Azure OpenAI stöder nu matriser med upp till 16 indata per API-begäran med textinbäddning-ada-002 version 2.

Nya regioner

Azure OpenAI är nu också tillgängligt i regionerna Kanada, östra, USA, östra 2, Japan, östra och USA, norra centrala. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Juni 2023

Använda Azure OpenAI på dina egna data (förhandsversion)

Azure OpenAI On Your Data är nu tillgängligt som förhandsversion, så att du kan chatta med OpenAI-modeller som GPT-35-Turbo och GPT-4 och ta emot svar baserat på dina data.

Nya versioner av modellerna gpt-35-turbo och gpt-4

gpt-35-turbo (version 0613)
gpt-35-turbo-16k (version 0613)
gpt-4 (version 0613)
gpt-4-32k (version 0613)

Södra Storbritannien

Azure OpenAI är nu tillgängligt i regionen Storbritannien, södra. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Innehållsfiltrering och anteckningar (förhandsversion)

Så här konfigurerar du innehållsfilter med Azure OpenAI Service.
Aktivera anteckningar för att visa innehållsfiltreringskategori och allvarlighetsgradsinformation som en del av dina GPT-baserade slutförande- och chattsamtal.

Kvot

Kvoten ger flexibiliteten att aktivt hantera allokering av hastighetsgränser mellan distributionerna i din prenumeration.

maj 2023

Stöd för Java och JavaScript SDK

NYA SDK:er för förhandsversionen av Azure OpenAI erbjuder stöd för JavaScript och Java.

Allmän tillgänglighet (GA) för Azure OpenAI Chat

Stöd för allmän tillgänglighet för:
- API-version 2023-05-15för chattens slutförande .
- GPT-35-Turbo-modeller.
- GPT-4-modellserie.

Om du för närvarande använder API:et 2023-03-15-preview rekommenderar vi att du migrerar till GA-API 2023-05-15 :et. Om du för närvarande använder API-versionen 2022-12-01 förblir det här API:et allmänt tillgängligt, men innehåller inte de senaste funktionerna för att slutföra chatten.

Viktigt!

Att använda de aktuella versionerna av GPT-35-Turbo-modellerna med slutpunkten för slutförande finns kvar i förhandsversionen.

Centrala Frankrike

Azure OpenAI är nu tillgängligt i regionen France Central. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

April 2023

Offentlig förhandsversion av DALL-E 2. Azure OpenAI Service stöder nu API:er för avbildningsgenerering som drivs av OpenAI:s DALL-E 2-modell. Hämta AI-genererade bilder baserat på den beskrivande text du anger. Mer information finns i snabbstarten.
Inaktiva distributioner av anpassade modeller tas nu bort efter 15 dagar. förblir tillgängliga för omdistribuering. Om en anpassad (finjusterad) modell distribueras i mer än femton (15) dagar under vilka inga slutföranden eller chattavslutsanrop görs till den, tas distributionen bort automatiskt (och inga ytterligare värdavgifter debiteras för den distributionen). Den underliggande anpassade modellen förblir tillgänglig och kan distribueras om när som helst. Mer information finns i artikeln om hur du gör.

Mars 2023

GPT-4-seriens modeller är nu tillgängliga som förhandsversion på Azure OpenAI. För att begära åtkomst kan befintliga Azure OpenAI-kunder ansöka genom att fylla i det här formuläret. Dessa modeller är för närvarande tillgängliga i regionerna USA, östra och USA, södra centrala.
Nya API:et för slutförande av chattar för GPT-35-Turbo- och GPT-4-modeller som släpptes i förhandsversion den 3/21. Mer information finns i artikeln om uppdaterade snabbstarter och instruktioner.
GPT-35-Turbo förhandsversion. Mer information finns i artikeln instruktioner.
Ökade träningsgränser för finjustering: Den maximala träningsjobbstorleken (token i träningsfilen) x (antal epoker) är 2 miljarder token för alla modeller. Vi har också ökat maxträningsjobbet från 120 till 720 timmar.
Lägga till ytterligare användningsfall i din befintliga åtkomst. Tidigare krävde processen för att lägga till nya användningsfall att kunderna skulle ansöka om tjänsten igen. Nu släpper vi en ny process som gör att du snabbt kan lägga till nya användningsfall i din användning av tjänsten. Den här processen följer den etablerade processen för begränsad åtkomst i Azure AI-tjänster. Befintliga kunder kan intyga alla nya användningsfall här. Observera att detta krävs när du vill använda tjänsten för ett nytt användningsfall som du inte ursprungligen ansökte om.

2023 februari

Nya funktioner

Förhandsversionsexempel | för .NET SDK(slutsatsdragning)
Terraform SDK-uppdatering för att stödja Azure OpenAI-hanteringsåtgärder.
Infogning av text i slutet av en slutförande stöds nu med parametern suffix .

Uppdateringar

Innehållsfiltrering är aktiverat som standard.

Nya artiklar om:

Ny utbildning:

Introduktion till Azure OpenAI

Januari 2023

Nya funktioner

Service GA. Azure OpenAI-tjänsten är nu allmänt tillgänglig.
Nya modeller: Tillägg av den senaste textmodellen, text-davinci-003 (USA, östra, Europa, västra), text-ada-embeddings-002 (USA, östra, USA, södra centrala, Europa, västra)

December 2022

Nya funktioner

De senaste modellerna från OpenAI. Azure OpenAI ger åtkomst till alla de senaste modellerna, inklusive GPT-3.5-serien.
Ny API-version (2022-12-01). Den här uppdateringen innehåller flera begärda förbättringar, inklusive information om tokenanvändning i API-svaret, förbättrade felmeddelanden för filer, justering med OpenAI för finjustering av datastrukturen för att skapa data och stöd för suffixparametern för att tillåta anpassad namngivning av finjusterade jobb.
Högre gränser för begäranden per sekund. 50 för icke-Davinci-modeller. 20 för Davinci-modeller.
Snabbare finjustera distributioner. Distribuera en Ada- och Curie-finjusterad modell på under 10 minuter.
Högre träningsgränser: 40M träningstoken för Ada, Babbage och Curie. 10M för Davinci.
Process för att begära ändringar i missbruket och felanvändning av dataloggning och mänsklig granskning. Idag loggar tjänsten begärande-/svarsdata i syfte att upptäcka missbruk och missbruk för att säkerställa att dessa kraftfulla modeller inte missbrukas. Många kunder har dock strikta krav på datasekretess och säkerhet som kräver större kontroll över sina data. För att stödja dessa användningsfall släpper vi en ny process för kunder att ändra principer för innehållsfiltrering eller inaktivera missbruksloggning för fall med låg riskanvändning. Den här processen följer den etablerade processen för begränsad åtkomst i Azure AI-tjänster och befintliga OpenAI-kunder kan ansöka här.
Kundhanterad nyckelkryptering (CMK). CMK ger kunderna större kontroll över hanteringen av sina data i Azure OpenAI genom att tillhandahålla egna krypteringsnycklar som används för att lagra träningsdata och anpassade modeller. Kundhanterade nycklar (CMK) kallas även för BYOK och ger större flexibilitet att skapa, rotera, inaktivera och återkalla åtkomstkontroller. Du kan också granska krypteringsnycklarna som används för att skydda dina data. Läs mer i vår dokumentation om kryptering i vila.
Stöd för låsbox
SOC-2-efterlevnad
Loggning och diagnostik via Azure Resource Health, kostnadsanalys och diagnostikinställningar.
Studioförbättringar. Många användbarhetsförbättringar i Studio-arbetsflödet, inklusive Azure AD-rollstöd för att styra vem i teamet som har åtkomst till att skapa finjusterade modeller och distribuera.

Ändringar (icke-bakåtkompatibla)

Api-begäran för finjusteringsskapande har uppdaterats så att den matchar OpenAI:s schema.

Förhandsversioner av API:et:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

API-version 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

Innehållsfiltrering är tillfälligt inaktiverat som standard. Azure con tältläge ration fungerar annorlunda än Azure OpenAI. Azure OpenAI kör innehållsfilter under generationsanropet för att identifiera skadligt eller stötande innehåll och filtrera dem från svaret. Lära sig mer

Dessa modeller återaktiveras under Q1 2023 och är aktiverade som standard.

Kundåtgärder

Kontakta Azure Support om du vill att dessa ska aktiveras för din prenumeration.
Ansök om filtreringsändringar om du vill att de ska förbli inaktiverade. (Det här alternativet är endast för användningsfall med låg risk.)

Nästa steg

Läs mer om de underliggande modeller som driver Azure OpenAI.

Dela via

Nyheter i Azure OpenAI-tjänsten

Oktober 2024

STANDARDdistributionstyp för NY datazon

Global Batch GA

o1-preview och o1-mini modeller begränsad åtkomst

Nytt GPT-4o Realtime API för offentlig förhandsversion av tal och ljud

Globala batchstöduppdateringar

September 2024

Azure OpenAI Studio UX-uppdateringar

GPT-4o 2024-08-06 etablerade distributioner

NY global etablerad distributionstyp

NYA o1-preview- och o1-mini-modeller tillgängliga för begränsad åtkomst

Viktiga funktioner i o1-serien

Modellvarianter

Begränsningar

Säkerhet

Tillgänglighet

Augusti 2024

GPT-4o 2024-08-06 strukturerade utdata

GPT-4o minietablerade distributioner

GPT-4o finjustering (offentlig förhandsversion)

Ny förhandsversion av API

GPT-4o mini regional tillgänglighet

Utvärderingsguide

Den senaste GPT-4o-modellen finns på lekplatsen för tidig åtkomst (förhandsversion)

Globala batchdistributioner är nu tillgängliga

Juli 2024

GPT-4o mini är nu tillgänglig för finjustering

Verktyget Filsökning för assistenter faktureras nu

GPT-4o minimodell tillgänglig för distribution

Ny princip för ansvarsfull AI-standardinnehållsfiltrering

Ny GA API-version

Expansion av tillgängliga regioner för globala standarddistributioner av gpt-4o

Juni 2024

Uppdateringar av pensionsdatum

Tokenbaserad fakturering för finjustering

GPT-4o släppt i nya regioner

Stöd för kundhanterad nyckel (CMK) för assistenter

Maj 2024

GPT-4o-etablerade distributioner

Assistenter v2 (förhandsversion)

Allmän tillgänglighet för GPT-4o-modell (GA)

Global standarddistributionstyp (förhandsversion)

Finjustera uppdateringar

DALL-E och GPT-4 Turbo Vision GA konfigurerbara innehållsfilter

Asynkront filter tillgängligt för alla Azure OpenAI-kunder

Prompt Shields

Api-versionen 2024-05-01-preview

GPT-4 Turbo modell allmän tillgänglighet (GA)

Skillnader mellan OpenAI- och Azure OpenAI GPT-4 Turbo GA-modeller

Skillnader från gpt-4 vision-preview

GPT-4 Turbo-etablerad hanterad tillgänglighet

Distribuera GPT-4 Turbo med Vision GA

April 2024

Finjustering stöds nu i två nya regioner USA, östra 2 och Schweiz, västra

USA, östra 2

Schweiz, västra

Exempel på chattträning med flera svängar

GPT-4 (0125) är tillgängligt för Azure OpenAI på dina data

Mars 2024

Risker och säkerhetsövervakning i Azure OpenAI Studio

Azure OpenAI på dina datauppdateringar

API för allmän tillgänglighet 2024-02-01 har släppts

Allmän tillgänglighet för Whisper (GA)

Allmän tillgänglighet för DALL-E 3 (GA)

Nytt regionalt stöd för DALL-E 3

Modellutfasningar och tillbakadragningar

2024-03-01-preview API släppt

Uppdatera till GPT-4-1106-Preview-uppgraderingsplaner

Februari 2024

GPT-3.5-turbo-0125 modell tillgänglig

Modeller för inbäddning i tredje generationen är tillgängliga

GPT-3.5 Turbo kvotkonsolidering

GPT-4-0125-preview-modell tillgänglig

Api:et för assistenter – offentlig förhandsversion

Offentlig förhandsversion av OpenAI-text till talröster

Nya finjusteringsfunktioner och modellstöd

Nytt regionalt stöd för Azure OpenAI På dina data

Allmän tillgänglighet för Azure OpenAI på dina data