Dela via


Nyheter i Azure OpenAI-tjänsten

Den här artikeln innehåller en sammanfattning av de senaste versionerna och viktiga dokumentationsuppdateringar för Azure OpenAI.

Juli 2024

GPT-4o mini förhandsversionsmodell tillgänglig för tidig åtkomst

GPT-4o mini är den senaste modellen från OpenAI som lanserades den 18 juli 2024.

Från OpenAI:

"GPT-4o mini överträffar GPT-3.5 Turbo och andra små modeller på akademiska riktmärken i både textintelligens och multimodala resonemang, och stöder samma utbud av språk som GPT-4o. Det visar också starka prestanda vid funktionsanrop, vilket kan göra det möjligt för utvecklare att skapa program som hämtar data eller vidta åtgärder med externa system, och förbättrade prestanda för långa kontexter jämfört med GPT-3.5 Turbo."

Information om hur du börjar testa modellen idag i Azure OpenAI finns i Azure OpenAI Studio early access playground( Azure OpenAI Studio early access playground).

Ny princip för ansvarsfull AI-standardinnehållsfiltrering

Den nya standardprincipen DefaultV2 för innehållsfiltrering ger de senaste säkerhets- och säkerhetsreduceringarna för GPT-modellserien (text), inklusive:

  • Fråga Shields om jailbreak-attacker på användarprompter (filter),
  • Skyddad materialidentifiering för text (filter) vid modellavslut
  • Skyddad materialidentifiering för kod (kommentera) vid modellavslut

Även om det inte finns några ändringar i innehållsfilter för befintliga resurser och distributioner (standardkonfigurationer eller anpassade innehållsfiltreringskonfigurationer förblir oförändrade), ärver nya resurser och GPT-distributioner automatiskt den nya innehållsfiltreringsprincipen DefaultV2. Kunder har möjlighet att växla mellan säkerhetsstandarder och skapa anpassade konfigurationer för innehållsfiltrering.

Mer information finns i dokumentationen om standardsäkerhetsprinciper.

Ny GA API-version

API-versionen 2024-06-01 är den senaste versionen av GA-dataplanets slutsatsdragnings-API. Den ersätter API-versionen 2024-02-01 och lägger till stöd för:

  • inbäddningar encoding_format och dimensions parametrar.
  • chattavslut logprobs och top_logprobs parametrar.

Mer information finns i referensdokumentationen för dataplanets slutsatsdragning.

Expansion av tillgängliga regioner för globala standarddistributioner av gpt-4o

GPT-4o är nu tillgängligt för globala standarddistributioner i:

  • australiaeast
  • Brasilien, södra
  • canadaeast
  • eastus
  • eastus2
  • francecentral git
  • germanywestcentral
  • Japan, östra
  • koreacentral
  • northcentralus
  • norwayeast
  • polencentral
  • southafricanorth
  • USA, södra centrala
  • southindia
  • swedencentral
  • switzerlandnorth
  • uksouth
  • Europa, västra
  • westus
  • westus3

Information om global standardkvot finns på sidan med kvoter och gränser.

Juni 2024

Uppdateringar av pensionsdatum

  • Senast den 1 oktober 2024 uppdaterades gpt-35-turbo 0301.
  • Uppdaterad gpt-35-turbo & gpt-35-turbo-16k0613 pensioneringsdatum till 1 oktober 2024.
  • Uppdaterad gpt-4 & gpt-4-32k 0314 utfasningsdatum till 1 oktober 2024 och pensionsdatum till 6 juni 2025.

Se vår modellpensionsguide för den senaste informationen om modellutfasning och pensionering.

Tokenbaserad fakturering för finjustering

  • Faktureringen för Finjustering av Azure OpenAI baseras nu på antalet token i träningsfilen – i stället för den totala förflutna träningstiden. Detta kan leda till en betydande kostnadsminskning för vissa träningskörningar och gör det mycket enklare att beräkna finjusteringskostnaderna. Mer information finns i det officiella meddelandet.

GPT-4o släppt i nya regioner

  • GPT-4o är nu också tillgängligt i:
    • Sverige, centrala för regional standarddistribution.
    • Australien, östra, Kanada, östra, Japan, östra, Korea, centrala, Sverige, centrala, Schweiz, norra och USA, västra 3 för etablerad distribution.

Den senaste informationen om modelltillgänglighet finns på sidan modeller.

Stöd för kundhanterad nyckel (CMK) för assistenter

Trådar och filer i assistenter stöder nu CMK i följande region:

  • USA, västra 3

Maj 2024

GPT-4o-etablerade distributioner

gpt-4o Version: 2024-05-13 är tillgänglig för både standarddistributioner och etablerade distributioner. Etablerings- och standardmodelldistributioner accepterar både begäranden om text- och bild-/visionsinferens. Information om regional modelltillgänglighet finns i modellmatrisen för etablerade distributioner.

Assistenter v2 (förhandsversion)

En uppdatering av API:et assistenter är nu offentligt tillgänglig. Den innehåller följande uppdateringar:

  • Filsökningsverktyg och vektorlagring
  • Maximalt slutförande och maximalt stöd för token för att hantera tokenanvändning.
  • tool_choiceparameter för att tvinga assistenten att använda ett angivet verktyg. Nu kan du skapa meddelanden med assistentrollen för att skapa anpassade konversationshistoriker i trådar.
  • Stöd för parametrarna temperature, top_p. response_format
  • Stöd för strömning och avsökning. Du kan använda hjälpfunktionerna i vår Python SDK för att skapa körningar och strömma svar. Vi har också lagt till SDK-hjälp för avsökning för att dela objektstatusuppdateringar utan behov av avsökning.
  • Experimentera med Logic Apps och funktionsanrop med Hjälp av Azure OpenAI Studio. Importera dina REST-API:er som implementerats i Logic Apps som funktioner och studion anropar funktionen (som ett Logic Apps-arbetsflöde) automatiskt baserat på användarens uppmaning.
  • AutoGen från Microsoft Research tillhandahåller ett konversationsramverk med flera agenter för att möjliggöra bekväm skapande av LLM-arbetsflöden (Large Language Model) i en mängd olika program. Azure OpenAI-assistenter är nu integrerade i AutoGen via GPTAssistantAgent, en ny experimentell agent som gör att du smidigt kan lägga till assistenter i AutoGen-baserade arbetsflöden för flera agenter. Detta möjliggör flera Azure OpenAI-assistenter som kan vara uppgifts- eller domänspecialiserade för att samarbeta och hantera komplexa uppgifter.
  • Stöd för finjusterade gpt-3.5-turbo-0125 modeller i följande regioner:
    • USA, östra 2
    • Sverige, centrala
  • Utökat regionalt stöd för:
    • Japan, östra
    • Storbritannien, södra
    • Västra USA
    • USA, västra 3
    • Norge, östra

Mer information finns i blogginlägget om assistenter.

Allmän tillgänglighet för GPT-4o-modell (GA)

GPT-4o ("o är för "omni") är den senaste modellen från OpenAI som lanserades den 13 maj 2024.

  • GPT-4o integrerar text och bilder i en enda modell, vilket gör att den kan hantera flera datatyper samtidigt. Den här multimodala metoden förbättrar noggrannheten och svarstiden i interaktioner mellan människa och dator.
  • GPT-4o matchar GPT-4 Turbo i engelska text- och kodningsuppgifter samtidigt som det ger överlägsen prestanda på icke-engelska språk och i visionsuppgifter, vilket sätter nya riktmärken för AI-funktioner.

Information om regional tillgänglighet för modeller finns på sidan modeller.

Global standarddistributionstyp (förhandsversion)

Globala distributioner är tillgängliga i samma Azure OpenAI-resurser som icke-globala erbjudanden, men du kan använda Azures globala infrastruktur för att dynamiskt dirigera trafik till datacentret med bästa tillgänglighet för varje begäran. Global standard ger den högsta standardkvoten för nya modeller och eliminerar behovet av belastningsutjämning för flera resurser.

Mer information finns i guiden för distributionstyper.

Finjustera uppdateringar

DALL-E och GPT-4 Turbo Vision GA konfigurerbara innehållsfilter

Skapa anpassade innehållsfilter för DALL-E 2 och 3, GPT-4 Turbo med Vision GA (turbo-2024-04-09) och GPT-4o-distributioner. Innehållsfiltrering

Asynkront filter tillgängligt för alla Azure OpenAI-kunder

Det är nu tillgängligt för alla Azure OpenAI-kunder att köra filter asynkront för förbättrad svarstid i strömningsscenarier. Innehållsfiltrering

Prompt Shields

Prompt Shields skyddar program som drivs av Azure OpenAI-modeller från två typer av attacker: direkt (jailbreak) och indirekta attacker. Indirekta attacker (kallas även indirekta promptattacker eller inmatningsattacker mellan domäner) är en typ av angrepp på system som drivs av generativa AI-modeller som kan inträffa när ett program bearbetar information som inte har skapats direkt av programmets utvecklare eller användaren. Innehållsfiltrering

Api-versionen 2024-05-01-preview

GPT-4 Turbo modell allmän tillgänglighet (GA)

Den senaste GA-versionen av GPT-4 Turbo är:

  • gpt-4Version: turbo-2024-04-09

Detta är ersättningen för följande förhandsversionsmodeller:

  • gpt-4Version: 1106-Preview
  • gpt-4Version: 0125-Preview
  • gpt-4Version: vision-preview

Skillnader mellan OpenAI- och Azure OpenAI GPT-4 Turbo GA-modeller

  • OpenAI:s version av den senaste 0409 turbomodellen stöder JSON-läge och funktionsanrop för alla slutsatsdragningsbegäranden.
  • Azure OpenAI:s version av den senaste turbo-2024-04-09 stöder för närvarande inte användning av JSON-läge och funktionsanrop när du gör slutsatsdragningsbegäranden med bildindata (vision). Textbaserade indatabegäranden (begäranden utan image_url och infogade bilder) stöder JSON-läge och funktionsanrop.

Skillnader från gpt-4 vision-preview

  • Integrering av Azure AI-specifika visionsförbättringar med GPT-4 Turbo med Vision stöds inte för gpt-4 version: turbo-2024-04-09. Detta inkluderar optisk teckenigenkänning (OCR), objekt grounding, video prompts och förbättrad hantering av dina data med bilder.

GPT-4 Turbo-etablerad hanterad tillgänglighet

  • gpt-4Version: turbo-2024-04-09 är tillgängligt för både standarddistributioner och etablerade distributioner. Den etablerade versionen av den här modellen stöder för närvarande inte begäranden om bild-/syninferens. Etablerade distributioner av den här modellen accepterar endast textinmatning. Standardmodelldistributioner accepterar både begäranden om text- och bild-/visionsinferens.

Region tillgänglighet

Information om regional tillgänglighet för modeller finns i modellmatrisen för standarddistributioner och etablerade distributioner.

Distribuera GPT-4 Turbo med Vision GA

Om du vill distribuera GA-modellen från Studio-användargränssnittet väljer du GPT-4 och väljer turbo-2024-04-09 sedan versionen på den nedrullningsbara menyn. Standardkvoten för gpt-4-turbo-2024-04-09 modellen är samma som den aktuella kvoten för GPT-4-Turbo. Se de regionala kvotgränserna.

April 2024

Finjustering stöds nu i två nya regioner USA, östra 2 och Schweiz, västra

Finjustering är nu tillgängligt med stöd för:

USA, östra 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Schweiz, västra

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Kontrollera modellsidan för den senaste informationen om modelltillgänglighet och finjusteringsstöd i varje region.

Exempel på chattträning med flera svängar

Finjustering stöder nu chattträningsexempel för flera svängar.

GPT-4 (0125) är tillgängligt för Azure OpenAI på dina data

Nu kan du använda GPT-4-modellen (0125) i tillgängliga regioner med Azure OpenAI På dina data.

Mars 2024

Risker och säkerhetsövervakning i Azure OpenAI Studio

Azure OpenAI Studio tillhandahåller nu en instrumentpanel för risker och säkerhet för var och en av dina distributioner som använder en konfiguration av innehållsfilter. Använd den för att kontrollera resultatet av filtreringsaktiviteten. Sedan kan du justera filterkonfigurationen för att bättre uppfylla dina affärsbehov och uppfylla principerna för ansvarsfull AI.

Använda risker och säkerhetsövervakning

Azure OpenAI på dina datauppdateringar

  • Nu kan du ansluta till en Elasticsearch-vektordatabas som ska användas med Azure OpenAI på dina data.
  • Du kan använda parametern segmentstorlek under datainmatningen för att ange det maximala antalet token för ett visst datasegment i ditt index.

API för allmän tillgänglighet 2024-02-01 har släppts

Det här är den senaste GA API-versionen och ersätter den tidigare 2023-05-15 GA-versionen. Den här versionen ger stöd för de senaste Azure OpenAI GA-funktionerna som Whisper, DALLE-3, finjustering, på dina data osv.

Funktioner som fortfarande är i förhandsversion, till exempel assistenter, text till tal (TTS), vissa på dina datakällor, kräver fortfarande en förhandsversion av API:et. Mer information finns i livscykelguiden för API-versionen.

Allmän tillgänglighet för Whisper (GA)

Whisper-tal till text-modellen är nu GA för både REST och Python. Klientbibliotekets SDK:er är för närvarande fortfarande i offentlig förhandsversion.

Prova Whisper genom att följa en snabbstart.

Allmän tillgänglighet för DALL-E 3 (GA)

DALL-E 3-avbildningsgenereringsmodellen är nu GA för både REST och Python. Klientbibliotekets SDK:er är för närvarande fortfarande i offentlig förhandsversion.

Prova DALL-E 3 genom att följa en snabbstart.

Nytt regionalt stöd för DALL-E 3

Nu kan du komma åt DALL-E 3 med en Azure OpenAI-resurs i East US eller AustraliaEast Azure-regionen, förutom SwedenCentral.

Modellutfasningar och tillbakadragningar

Vi har lagt till en sida för att spåra modellutfasningar och tillbakadragningar i Azure OpenAI Service. Den här sidan innehåller information om de modeller som för närvarande är tillgängliga, inaktuella och tillbakadragna.

2024-03-01-preview API släppt

2024-03-01-preview har samma funktioner som 2024-02-15-preview och lägger till två nya parametrar för inbäddningar:

  • encoding_format gör att du kan ange formatet för att generera inbäddningar i float, eller base64. Standardvärdet är float.
  • dimensions gör att du kan ange antalet inbäddningar för utdata. Den här parametern stöds bara med den nya tredje generationens inbäddningsmodeller: text-embedding-3-large, text-embedding-3-small. Vanligtvis är större inbäddningar dyrare ur ett beräknings-, minnes- och lagringsperspektiv. Att kunna justera antalet dimensioner ger mer kontroll över den totala kostnaden och prestandan. Parametern dimensions stöds inte i alla versioner av OpenAI 1.x Python-biblioteket, för att dra nytta av den här parametern rekommenderar vi att du uppgraderar till den senaste versionen: pip install openai --upgrade.

Om du för närvarande använder en förhandsversion av API:et för att dra nytta av de senaste funktionerna rekommenderar vi att du läser artikeln om API-versionens livscykel för att spåra hur länge din aktuella API-version kommer att stödjas.

Uppdatera till GPT-4-1106-Preview-uppgraderingsplaner

Distributionsuppgraderingen av gpt-4 1106-Preview till 0125-Preview som är planerad till gpt-4 den 8 mars 2024 äger inte längre rum. Distributioner av gpt-4 version 1106-Preview och 0125-Preview inställda på "Automatisk uppdatering till standard" och "Uppgradera när den har upphört att gälla" börjar uppgraderas när en stabil version av modellen har släppts.

Mer information om uppgraderingsprocessen finns på sidan modeller.

Februari 2024

GPT-3.5-turbo-0125 modell tillgänglig

Den här modellen har olika förbättringar, inklusive högre noggrannhet vid svar i begärda format och en korrigering för ett fel som orsakade ett problem med textkodning för funktionsanrop som inte är engelskspråkiga.

Information om regional tillgänglighet och uppgraderingar för modeller finns på sidan modeller.

Modeller för inbäddning i tredje generationen är tillgängliga

  • text-embedding-3-large
  • text-embedding-3-small

Vid testning rapporterar OpenAI att både den stora och den lilla tredje generationens inbäddningsmodeller ger bättre genomsnittlig prestanda för flerspråkshämtning med MIRACL-riktmärket samtidigt som bättre prestanda bibehålls för engelska uppgifter med MTEB-riktmärket än andra generationens textinbäddnings-ada-002-modell.

Information om regional tillgänglighet och uppgraderingar för modeller finns på sidan modeller.

GPT-3.5 Turbo kvotkonsolidering

För att förenkla migreringen mellan olika versioner av GPT-3.5-Turbo-modellerna (inklusive 16k) konsoliderar vi alla GPT-3.5-Turbo-kvoter till ett enda kvotvärde.

  • Alla kunder som har ökat kvoten har en kombinerad total kvot som återspeglar de tidigare ökningarna.

  • Alla kunder vars aktuella totala användning i modellversioner är mindre än standard får som standard en ny kombinerad total kvot.

GPT-4-0125-preview-modell tillgänglig

Modellversionen gpt-4 0125-preview är nu tillgänglig i Azure OpenAI Service i regionerna USA, östra, USA, norra centrala och USA, södra centrala. Kunder med distributioner av gpt-4 version 1106-preview uppgraderas automatiskt till 0125-preview under de kommande veckorna.

Information om regional tillgänglighet och uppgraderingar för modeller finns på sidan modeller.

Api:et för assistenter – offentlig förhandsversion

Azure OpenAI har nu stöd för API:et som driver OpenAI:s GPTs. Med Azure OpenAI Assistants (förhandsversion) kan du skapa AI-assistenter som är skräddarsydda för dina behov genom anpassade instruktioner och avancerade verktyg som kodtolkare och anpassade funktioner. Mer information finns i:

Offentlig förhandsversion av OpenAI-text till talröster

Azure OpenAI Service stöder nu text-till-tal-API:er med OpenAI:s röster. Hämta AI-genererat tal från texten du anger. Mer information finns i översiktsguiden och prova snabbstarten.

Kommentar

Azure AI Speech stöder även OpenAI-text till talröster. Mer information finns i OpenAI-text till talröster via Azure OpenAI Service eller via Azure AI Speech-guide .

Nya finjusteringsfunktioner och modellstöd

Nytt regionalt stöd för Azure OpenAI På dina data

Nu kan du använda Azure OpenAI på dina data i följande Azure-region:

  • Sydafrika, norra

Allmän tillgänglighet för Azure OpenAI på dina data

December 2023

Azure OpenAI på dina data

  • Fullständigt VPN- och privat slutpunktsstöd för Azure OpenAI På dina data, inklusive säkerhetsstöd för: lagringskonton, Azure OpenAI-resurser och Azure AI-usluga pretrage resurser.
  • Ny artikel för att använda Azure OpenAI på dina data på ett säkert sätt genom att skydda data med virtuella nätverk och privata slutpunkter.

GPT-4 Turbo med Vision nu tillgänglig

GPT-4 Turbo med Vision på Azure OpenAI-tjänsten är nu i offentlig förhandsversion. GPT-4 Turbo with Vision är en stor multimodal modell (LMM) utvecklad av OpenAI som kan analysera bilder och ge textsvar på frågor om dem. Den innehåller både bearbetning av naturligt språk och visuell förståelse. Med förbättrat läge kan du använda Funktionerna i Azure AI Vision för att generera ytterligare insikter från bilderna.

  • Utforska funktionerna i GPT-4 Turbo with Vision i en kodfri upplevelse med Hjälp av Azure OpenAI Playground. Läs mer i snabbstartsguiden.
  • Visionsförbättring med GPT-4 Turbo with Vision är nu tillgängligt i Azure OpenAI Playground och innehåller stöd för optisk teckenigenkänning, objektgrundning, bildstöd för "lägg till dina data" och stöd för videoprompt.
  • Gör anrop till chatt-API:et direkt med hjälp av REST-API:et.
  • Regiontillgängligheten är för närvarande begränsad till SwitzerlandNorth, SwedenCentral, WestUSoch AustraliaEast
  • Läs mer om de kända begränsningarna i GPT-4 Turbo with Vision och andra vanliga frågor.

November 2023

Stöd för ny datakälla i Azure OpenAI på dina data

  • Nu kan du använda Azure Cosmos DB for MongoDB vCore samt URL:er/webbadresser som datakällor för att mata in dina data och chatta med en Azure OpenAI-modell som stöds.

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 släppt

Båda modellerna är den senaste versionen från OpenAI med förbättrad instruktion som följer, JSON-läge, reproducerbara utdata och parallella funktionsanrop.

  • GPT-4 Turbo Preview har ett maximalt kontextfönster på 128 000 token och kan generera 4 096 utdatatoken. Den har de senaste träningsdata med kunskap fram till april 2023. Den här modellen är i förhandsversion och rekommenderas inte för produktionsanvändning. Alla distributioner av den här förhandsversionsmodellen uppdateras automatiskt när den stabila versionen blir tillgänglig.

  • GPT-3.5-Turbo-1106 har ett maximalt kontextfönster på 16 385 token och kan generera 4 096 utdatatoken.

Information om modellens regionala tillgänglighet finns på modellsidan.

Modellerna har sina egna unika kvotallokeringar per region.

Offentlig förhandsversion av DALL-E 3

DALL-E 3 är den senaste avbildningsgenereringsmodellen från OpenAI. Den har förbättrad bildkvalitet, mer komplexa scener och bättre prestanda vid återgivning av text i bilder. Den levereras också med fler alternativ för proportioner. DALL-E 3 är tillgängligt via OpenAI Studio och via REST-API:et. Din OpenAI-resurs måste finnas i Azure-regionen SwedenCentral .

DALL-E 3 innehåller inbyggd snabbskrivning för att förbättra bilder, minska bias och öka den naturliga variationen.

Prova DALL-E 3 genom att följa en snabbstart.

Ansvarsfull AI

  • Utökad kundkonfigurerbarhet: Alla Azure OpenAI-kunder kan nu konfigurera alla allvarlighetsnivåer (låg, medelhög, hög) för kategorierna hat, våld, sexuell och självskadebeteende, inklusive att endast filtrera innehåll med hög allvarlighetsgrad. Konfigurera innehållsfilter

  • Autentiseringsuppgifter för innehåll i alla DALL-E-modeller: AI-genererade bilder från alla DALL-E-modeller innehåller nu en digital autentiseringsuppgift som visar innehållet som AI-genererat. Program som visar bildtillgångar kan använda SDK:n för content authenticity initiative med öppen källkod för att visa autentiseringsuppgifter i sina AI-genererade bilder. Autentiseringsuppgifter för innehåll i Azure OpenAI

  • Nya RAI-modeller

    • Riskidentifiering av jailbreakning: Jailbreak-attacker är användarfrågor som är utformade för att provocera Generative AI-modellen att uppvisa beteenden som den har tränats för att undvika eller bryta mot reglerna som anges i systemmeddelandet. Riskidentifieringsmodellen för jailbreak är valfri (standardav) och tillgänglig i kommentars- och filtermodellen. Den körs på användarmeddelanden.
    • Skyddad materialtext: Skyddad materialtext beskriver känt textinnehåll (till exempel sångtexter, artiklar, recept och valt webbinnehåll) som kan matas ut av stora språkmodeller. Den skyddade materialtextmodellen är valfri (standard av) och tillgänglig i kommentars- och filtermodellen. Den körs på LLM-slutföranden.
    • Kod för skyddat material: Skyddad materialkod beskriver källkod som matchar en uppsättning källkod från offentliga lagringsplatser, som kan matas ut av stora språkmodeller utan korrekt källlagringsplatser. Kodmodellen för skyddat material är valfri (standard av) och tillgänglig i kommentars- och filtermodellen. Den körs på LLM-slutföranden.

    Konfigurera innehållsfilter

  • Blocklistor: Kunder kan nu snabbt anpassa beteendet för innehållsfilter för frågor och slutföranden ytterligare genom att skapa en anpassad blockeringslista i sina filter. Med den anpassade blocklistan kan filtret vidta åtgärder i en anpassad lista med mönster, till exempel specifika termer eller regexmönster. Förutom anpassade blocklistor tillhandahåller vi en Microsoft-lista över svordomar (engelska). Använda blocklistor

Oktober 2023

Nya finjusteringsmodeller (förhandsversion)

Azure OpenAI på dina data

  • Nya anpassade parametrar för att fastställa antalet hämtade dokument och strikthet.
    • Strikthetsinställningen anger tröskelvärdet för att kategorisera dokument som relevanta för dina frågor.
    • Inställningen hämtade dokument anger antalet dokument med högsta poäng från ditt dataindex som används för att generera svar.
  • Du kan se datainmatning/uppladdningsstatus i Azure OpenAI Studio.
  • Stöd för privata slutpunkter och VPN för blobcontainrar.

September 2023

GPT-4

GPT-4 och GPT-4-32k är nu tillgängliga för alla Azure OpenAI Service-kunder. Kunder behöver inte längre ansöka om att väntelistan ska använda GPT-4 och GPT-4-32k (registreringskraven för begränsad åtkomst fortsätter att gälla för alla Azure OpenAI-modeller). Tillgängligheten kan variera beroende på region. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

GPT-3.5 Turbo Instruera

Azure OpenAI Service stöder nu MODELLEN GPT-3.5 Turbo Instruct. Den här modellen har prestanda som är jämförbar med text-davinci-003 och är tillgänglig för användning med API:et Completions. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Viska offentlig förhandsversion

Azure OpenAI Service stöder nu api:er för tal till text som drivs av OpenAI:s Whisper-modell. Hämta AI-genererad text baserat på det talljud du tillhandahåller. Mer information finns i snabbstarten.

Kommentar

Azure AI Speech stöder även OpenAI:s Whisper-modell via batch-transkriptions-API:et. Mer information finns i guiden Skapa en batch-transkription . Ta en titt på Vad är Whisper-modellen? för att lära dig mer om när du ska använda Azure AI Speech jämfört med Azure OpenAI Service.

Nya regioner

  • Azure OpenAI finns nu även i regionerna Sverige, centrala och Schweiz, norra. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Regionala kvotgränser ökar

  • Ökar till maxgränsen för standardkvoter för vissa modeller och regioner. Om du migrerar arbetsbelastningar till dessa modeller och regioner kan du dra nytta av högre token per minut (TPM).

Augusti 2023

Azure OpenAI om dina egna datauppdateringar (förhandsversion)

juli 2023

Stöd för funktionsanrop

Inbäddning av indatamatris ökar

Nya regioner

  • Azure OpenAI är nu också tillgängligt i regionerna Kanada, östra, USA, östra 2, Japan, östra och USA, norra centrala. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Juni 2023

Använda Azure OpenAI på dina egna data (förhandsversion)

  • Azure OpenAI On Your Data är nu tillgängligt som förhandsversion, så att du kan chatta med OpenAI-modeller som GPT-35-Turbo och GPT-4 och ta emot svar baserat på dina data.

Nya versioner av modellerna gpt-35-turbo och gpt-4

  • gpt-35-turbo (version 0613)
  • gpt-35-turbo-16k (version 0613)
  • gpt-4 (version 0613)
  • gpt-4-32k (version 0613)

Södra Storbritannien

  • Azure OpenAI är nu tillgängligt i regionen Storbritannien, södra. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

Innehållsfiltrering och anteckningar (förhandsversion)

  • Så här konfigurerar du innehållsfilter med Azure OpenAI Service.
  • Aktivera anteckningar för att visa innehållsfiltreringskategori och allvarlighetsgradsinformation som en del av dina GPT-baserade slutförande- och chattsamtal.

Säljbudget

maj 2023

Stöd för Java och JavaScript SDK

  • NYA SDK:er för förhandsversionen av Azure OpenAI erbjuder stöd för JavaScript och Java.

Allmän tillgänglighet (GA) för Azure OpenAI Chat

  • Stöd för allmän tillgänglighet för:
    • API-version 2023-05-15för chattens slutförande .
    • GPT-35-Turbo-modeller.
    • GPT-4-modellserie.

Om du för närvarande använder API:et 2023-03-15-preview rekommenderar vi att du migrerar till GA-API 2023-05-15 :et. Om du för närvarande använder API-versionen 2022-12-01 förblir det här API:et allmänt tillgängligt, men innehåller inte de senaste funktionerna för att slutföra chatten.

Viktigt!

Att använda de aktuella versionerna av GPT-35-Turbo-modellerna med slutpunkten för slutförande finns kvar i förhandsversionen.

Centrala Frankrike

  • Azure OpenAI är nu tillgängligt i regionen France Central. Kontrollera modellsidan för den senaste informationen om modelltillgänglighet i varje region.

April 2023

  • Offentlig förhandsversion av DALL-E 2. Azure OpenAI Service stöder nu API:er för avbildningsgenerering som drivs av OpenAI:s DALL-E 2-modell. Hämta AI-genererade bilder baserat på den beskrivande text du anger. Mer information finns i snabbstarten.

  • Inaktiva distributioner av anpassade modeller tas nu bort efter 15 dagar. förblir tillgängliga för omdistribuering. Om en anpassad (finjusterad) modell distribueras i mer än femton (15) dagar under vilka inga slutföranden eller chattavslutsanrop görs till den, tas distributionen bort automatiskt (och inga ytterligare värdavgifter debiteras för den distributionen). Den underliggande anpassade modellen förblir tillgänglig och kan distribueras om när som helst. Mer information finns i artikeln om hur du gör.

Mars 2023

  • GPT-4-seriens modeller är nu tillgängliga som förhandsversion på Azure OpenAI. För att begära åtkomst kan befintliga Azure OpenAI-kunder ansöka genom att fylla i det här formuläret. Dessa modeller är för närvarande tillgängliga i regionerna USA, östra och USA, södra centrala.

  • Nya API:et för slutförande av chattar för GPT-35-Turbo- och GPT-4-modeller som släpptes i förhandsversion den 3/21. Mer information finns i artikeln om uppdaterade snabbstarter och instruktioner.

  • GPT-35-Turbo förhandsversion. Mer information finns i artikeln instruktioner.

  • Ökade träningsgränser för finjustering: Den maximala träningsjobbstorleken (token i träningsfilen) x (antal epoker) är 2 miljarder token för alla modeller. Vi har också ökat maxträningsjobbet från 120 till 720 timmar.

  • Lägga till ytterligare användningsfall i din befintliga åtkomst.  Tidigare krävde processen för att lägga till nya användningsfall att kunderna skulle ansöka om tjänsten igen. Nu släpper vi en ny process som gör att du snabbt kan lägga till nya användningsfall i din användning av tjänsten. Den här processen följer den etablerade processen för begränsad åtkomst i Azure AI-tjänster. Befintliga kunder kan intyga alla nya användningsfall här. Observera att detta krävs när du vill använda tjänsten för ett nytt användningsfall som du inte ursprungligen ansökte om.

2023 februari

Nya funktioner

Uppdateringar

  • Innehållsfiltrering är aktiverat som standard.

Nya artiklar om:

Ny utbildning:

Januari 2023

Nya funktioner

  • Service GA. Azure OpenAI-tjänsten är nu allmänt tillgänglig.

  • Nya modeller: Tillägg av den senaste textmodellen, text-davinci-003 (USA, östra, Europa, västra), text-ada-embeddings-002 (USA, östra, USA, södra centrala, Europa, västra)

December 2022

Nya funktioner

  • De senaste modellerna från OpenAI. Azure OpenAI ger åtkomst till alla de senaste modellerna, inklusive GPT-3.5-serien.

  • Ny API-version (2022-12-01). Den här uppdateringen innehåller flera begärda förbättringar, inklusive information om tokenanvändning i API-svaret, förbättrade felmeddelanden för filer, justering med OpenAI för finjustering av datastrukturen för att skapa data och stöd för suffixparametern för att tillåta anpassad namngivning av finjusterade jobb. ​

  • Högre gränser för begäranden per sekund. 50 för icke-Davinci-modeller. 20 för Davinci-modeller.

  • Snabbare finjustera distributioner. Distribuera en Ada- och Curie-finjusterad modell på under 10 minuter.

  • Högre träningsgränser: 40M träningstoken för Ada, Babbage och Curie. 10M för Davinci.

  • Process för att begära ändringar i missbruket och felanvändning av dataloggning och mänsklig granskning. Idag loggar tjänsten begärande-/svarsdata i syfte att upptäcka missbruk och missbruk för att säkerställa att dessa kraftfulla modeller inte missbrukas. Många kunder har dock strikta krav på datasekretess och säkerhet som kräver större kontroll över sina data. För att stödja dessa användningsfall släpper vi en ny process för kunder att ändra principer för innehållsfiltrering eller inaktivera missbruksloggning för fall med låg riskanvändning. Den här processen följer den etablerade processen för begränsad åtkomst i Azure AI-tjänster och befintliga OpenAI-kunder kan ansöka här.

  • Kundhanterad nyckelkryptering (CMK). CMK ger kunderna större kontroll över hanteringen av sina data i Azure OpenAI genom att tillhandahålla egna krypteringsnycklar som används för att lagra träningsdata och anpassade modeller. Kundhanterade nycklar (CMK) kallas även för BYOK och ger större flexibilitet att skapa, rotera, inaktivera och återkalla åtkomstkontroller. Du kan också granska krypteringsnycklarna som används för att skydda dina data. Läs mer i vår dokumentation om kryptering i vila.

  • Stöd för låsbox

  • SOC-2-efterlevnad

  • Loggning och diagnostik via Azure Resource Health, kostnadsanalys och diagnostikinställningar.

  • Studioförbättringar. Många användbarhetsförbättringar i Studio-arbetsflödet, inklusive Azure AD-rollstöd för att styra vem i teamet som har åtkomst till att skapa finjusterade modeller och distribuera.

Ändringar (icke-bakåtkompatibla)

Api-begäran för finjusteringsskapande har uppdaterats så att den matchar OpenAI:s schema.

Förhandsversioner av API:et:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API-version 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

Innehållsfiltrering är tillfälligt inaktiverat som standard. Azure con režim šatora ration fungerar annorlunda än Azure OpenAI. Azure OpenAI kör innehållsfilter under generationsanropet för att identifiera skadligt eller stötande innehåll och filtrera dem från svaret. Lära sig mer

Dessa modeller återaktiveras under Q1 2023 och är aktiverade som standard. ​

Kundåtgärder

Nästa steg

Läs mer om de underliggande modeller som driver Azure OpenAI.