Delen via


Wat is er nieuw in de Azure OpenAI-service?

Dit artikel bevat een overzicht van de nieuwste releases en belangrijke documentatie-updates voor Azure OpenAI.

Juli 2024

GPT-4o mini preview model beschikbaar voor vroege toegang

GPT-4o mini is het nieuwste model van OpenAI gelanceerd op 18 juli 2024.

Vanuit OpenAI:

"GPT-4o mini overschrijdt GPT-3.5 Turbo en andere kleine modellen op academische benchmarks in zowel tekstuele intelligentie als multimodale redenering, en ondersteunt hetzelfde scala aan talen als GPT-4o. Het toont ook sterke prestaties in functie-aanroepen, waardoor ontwikkelaars toepassingen kunnen bouwen die gegevens ophalen of acties uitvoeren met externe systemen, en verbeterde prestaties van lange context vergeleken met GPT-3.5 Turbo.

Als u het model vandaag in Azure OpenAI wilt testen, raadpleegt u de vroege toegangsspeeltuin van Azure OpenAI Studio.

Nieuw beleid voor het standaardfilteren van verantwoordelijke AI-inhoud

Het nieuwe standaardbeleid DefaultV2 voor inhoudsfilters biedt de nieuwste veiligheids- en beveiligingsbeperking voor de GPT-modelreeks (tekst), waaronder:

  • Prompt Shields voor jailbreakaanvallen op gebruikersprompts (filter),
  • Beveiligde materiaaldetectie voor tekst (filter) bij modelvoltooiingen
  • Beveiligde materiaaldetectie voor code (aantekeningen maken) bij modelvoltooiingen

Hoewel er geen wijzigingen zijn in inhoudsfilters voor bestaande resources en implementaties (standaard- of aangepaste configuraties voor inhoudsfilters blijven ongewijzigd), nemen nieuwe resources en GPT-implementaties automatisch het nieuwe beleid DefaultV2voor inhoudsfilters over. Klanten hebben de mogelijkheid om te schakelen tussen de standaardinstellingen voor veiligheid en aangepaste configuraties voor inhoudsfilters te maken.

Raadpleeg onze documentatie over het standaardveiligheidsbeleid voor meer informatie.

Nieuwe GA API-release

API-versie 2024-06-01 is de nieuwste API-release voor deductie-API voor ga-gegevensvlakken. De API-versie 2024-02-01 wordt vervangen en er wordt ondersteuning toegevoegd voor:

  • insluitingen encoding_format en dimensions parameters.
  • chatvoltooiingen logprobs & top_logprobs parameters.

Raadpleeg onze referentiedocumentatie voor gegevensvlakdeductie voor meer informatie.

Uitbreiding van regio's die beschikbaar zijn voor wereldwijde standaardimplementaties van gpt-4o

GPT-4o is nu beschikbaar voor wereldwijde standaardimplementaties in:

  • australiaeast
  • brazilsouth
  • canadaeast
  • eastus
  • eastus2
  • francecentral git
  • germanywestcentral
  • japaneast
  • koreacentral
  • northcentralus
  • norwayeast
  • Polencentral
  • southafricanorth
  • US - zuid-centraal
  • southindia
  • swedencentral
  • switzerlandnorth
  • uksouth
  • westeurope
  • westus
  • westus3

Raadpleeg de pagina quota en limieten voor informatie over het algemene standaardquotum.

Juni 2024

Updates voor buitengebruikstellingsdatum

  • De gpt-35-turbo buitengebruikstellingsdatum van 0301 is bijgewerkt naar niet eerder dan 1 oktober 2024.
  • Bijgewerkt gpt-35-turbo & gpt-35-turbo-16k0613 buitengebruikstellingsdatum tot 1 oktober 2024.
  • Bijgewerkt gpt-4 en gpt-4-32k 0314 afschaffingsdatum tot 1 oktober 2024 en buitengebruikstellingsdatum tot 6 juni 2025.

Raadpleeg onze handleiding voor buitengebruikstelling van modellen voor de meest recente informatie over modelafschaffen en buitengebruikstelling.

Facturering op basis van tokens voor het afstemmen

  • Azure OpenAI-facturering is nu gebaseerd op het aantal tokens in uw trainingsbestand, in plaats van de totale verstreken trainingstijd. Dit kan leiden tot een aanzienlijke kostenreductie voor sommige trainingsuitvoeringen en maakt het schatten van de kosten veel eenvoudiger. Voor meer informatie kunt u de officiële aankondiging raadplegen.

GPT-4o uitgebracht in nieuwe regio's

  • GPT-4o is nu ook beschikbaar in:
    • Zweden - centraal voor standaard regionale implementatie.
    • Australië - oost, Canada - oost, Japan - oost, Korea - centraal, Zweden - centraal, Zwitserland - noord, en VS - west 3 voor ingerichte implementatie.

Zie de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen.

Cmk-ondersteuning (Door de klant beheerde sleutel) voor assistenten

Threads en bestanden in assistenten ondersteunen nu CMK in de volgende regio:

  • US - west 3

Mei 2024

Met GPT-4o ingerichte implementaties

gpt-4o Versie: 2024-05-13 is beschikbaar voor zowel standaard- als ingerichte implementaties. Ingerichte en standaardmodelimplementaties accepteren zowel tekst- als afbeeldings-/visiondeductieaanvragen. Raadpleeg de modelmatrix voor ingerichte implementaties voor informatie over regionale beschikbaarheid van modellen.

Assistenten v2 (preview)

Een vernieuwing van de Assistants-API is nu openbaar beschikbaar. Deze bevat de volgende updates:

  • Hulpprogramma voor bestandszoekopdrachten en vectoropslag
  • Maximale voltooiing en maximale ondersteuning voor prompttoken voor het beheren van tokengebruik.
  • tool_choiceparameter voor het afdwingen van de Assistent om een opgegeven hulpprogramma te gebruiken. U kunt nu berichten maken met de assistentrol om aangepaste gespreksgeschiedenissen te maken in Threads.
  • Ondersteuning voor temperature, top_pparameters response_format .
  • Ondersteuning voor streaming en polling. U kunt de helperfuncties in onze Python SDK gebruiken om uitvoeringen te maken en antwoorden te streamen. We hebben ook polling SDK-helpers toegevoegd om objectstatusupdates te delen zonder dat er polling nodig is.
  • Experimenteer met Logic Apps en functie-aanroepen met behulp van Azure OpenAI Studio. Importeer uw REST API's die zijn geïmplementeerd in Logic Apps als functies en de studio roept automatisch de functie aan (als een Logic Apps-werkstroom) op basis van de gebruikersprompt.
  • AutoGen by Microsoft Research biedt een gespreksframework met meerdere agents om handige bouw van LLM-werkstromen (Large Language Model) mogelijk te maken voor een breed scala aan toepassingen. Azure OpenAI-assistenten zijn nu geïntegreerd in AutoGen via GPTAssistantAgenteen nieuwe experimentele agent waarmee u naadloos assistenten kunt toevoegen aan op AutoGen gebaseerde werkstromen voor meerdere agents. Hierdoor kunnen meerdere Azure OpenAI-assistenten worden gebruikt die taak of domein kunnen zijn om samen te werken en complexe taken aan te pakken.
  • Ondersteuning voor nauwkeurig afgestemde gpt-3.5-turbo-0125 modellen in de volgende regio's:
    • VS - oost 2
    • Zweden - centraal
  • Uitgebreide regionale ondersteuning voor:
    • Japan East
    • Verenigd Koninkrijk Zuid
    • VS - west
    • US - west 3
    • Noorwegen - oost

Zie het blogbericht over assistenten voor meer informatie.

GPT-4o model algemene beschikbaarheid (GA)

GPT-4o ("o is for "omni") is het nieuwste model van OpenAI gelanceerd op 13 mei 2024.

  • GPT-4o integreert tekst en afbeeldingen in één model, zodat het meerdere gegevenstypen tegelijk kan verwerken. Deze multimodale benadering verbetert de nauwkeurigheid en reactiesnelheid in interacties tussen menselijke computers.
  • GPT-4o komt overeen met GPT-4 Turbo in engelse tekst- en coderingstaken en biedt superieure prestaties in niet-Engelse talen en in vision-taken, waardoor nieuwe benchmarks voor AI-mogelijkheden worden ingesteld.

Zie de pagina modellen voor informatie over regionale beschikbaarheid van modellen.

Globaal standaardimplementatietype (preview)

Globale implementaties zijn beschikbaar in dezelfde Azure OpenAI-resources als niet-globale aanbiedingen, maar bieden u de mogelijkheid om de globale infrastructuur van Azure te gebruiken om verkeer dynamisch naar het datacenter te routeren met de beste beschikbaarheid voor elke aanvraag. Globale standaard biedt het hoogste standaardquotum voor nieuwe modellen en elimineert de noodzaak om taken te verdelen over meerdere resources.

Zie de handleiding voor implementatietypen voor meer informatie.

Updates afstemmen

Configureerbare inhoudsfilters van DALL-E en GPT-4 Turbo Vision GA

Maak aangepaste inhoudsfilters voor uw DALL-E 2 en 3, GPT-4 Turbo met Vision GA (turbo-2024-04-09) en GPT-4o-implementaties. Inhoud filteren

Asynchroon filter beschikbaar voor alle Azure OpenAI-klanten

Het asynchroon uitvoeren van filters voor verbeterde latentie in streamingscenario's is nu beschikbaar voor alle Azure OpenAI-klanten. Inhoud filteren

Promptschilden

Prompt Shields beschermt toepassingen die worden aangedreven door Azure OpenAI-modellen tegen twee soorten aanvallen: directe (jailbreak) en indirecte aanvallen. Indirecte aanvallen (ook wel indirecte promptaanvallen of aanvallen tussen domeinprompts genoemd) zijn een type aanval op systemen die worden aangedreven door Generatieve AI-modellen die kunnen optreden wanneer een toepassing informatie verwerkt die niet rechtstreeks is geschreven door de ontwikkelaar van de toepassing of de gebruiker. Inhoud filteren

API-release 2024-05-01-preview

  • Zie de levenscyclus van de API-versie voor meer informatie.

GPT-4 Turbo model algemene beschikbaarheid (GA)

De nieuwste GA-release van GPT-4 Turbo is:

  • gpt-4Versie: turbo-2024-04-09

Dit is de vervanging voor de volgende preview-modellen:

  • gpt-4Versie: 1106-Preview
  • gpt-4Versie: 0125-Preview
  • gpt-4Versie: vision-preview

Verschillen tussen OpenAI en Azure OpenAI GPT-4 Turbo GA-modellen

  • OpenAI's versie van het nieuwste 0409 turbomodel ondersteunt JSON-modus en functie-aanroepen voor alle deductieaanvragen.
  • De versie van Azure OpenAI van de meest recente turbo-2024-04-09 versie biedt momenteel geen ondersteuning voor het gebruik van de JSON-modus en functie-aanroepen bij het maken van deductieaanvragen met afbeeldingsinvoer (vision). Invoeraanvragen op basis van tekst (aanvragen zonder image_url en inline-afbeeldingen) ondersteunen de JSON-modus en functie-aanroepen.

Verschillen met gpt-4 vision-preview

  • Integratie van azure AI-specifieke Vision-verbeteringen met GPT-4 Turbo met Vision wordt niet ondersteund voor gpt-4 versie: turbo-2024-04-09. Dit omvat Optical Character Recognition (OCR), objectaarding, videoprompts en verbeterde verwerking van uw gegevens met afbeeldingen.

Beheerde beschikbaarheid van GPT-4 Turbo ingericht

  • gpt-4Versie: turbo-2024-04-09 is beschikbaar voor zowel standaard- als ingerichte implementaties. Momenteel biedt de ingerichte versie van dit model geen ondersteuning voor aanvragen voor afbeeldings-/visiondeductie. Ingerichte implementaties van dit model accepteren alleen tekstinvoer. Standaardmodelimplementaties accepteren zowel tekst- als afbeeldings-/visiondeductieaanvragen.

Regionale beschikbaarheid

Raadpleeg de modelmatrix voor standaardimplementaties en ingerichte implementaties voor informatie over regionale beschikbaarheid van modellen.

GPT-4 Turbo implementeren met Vision GA

Als u het GA-model wilt implementeren vanuit de gebruikersinterface van Studio, selecteert en kiest u GPT-4 vervolgens de turbo-2024-04-09 versie in de vervolgkeuzelijst. Het standaardquotum voor het gpt-4-turbo-2024-04-09 model is hetzelfde als het huidige quotum voor GPT-4-Turbo. Zie de regionale quotumlimieten.

April 2024

Fine-tuning wordt nu ondersteund in twee nieuwe regio's VS - oost 2 en Zwitserland - west

Het afstemmen is nu beschikbaar met ondersteuning voor:

VS - oost 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Zwitserland - west

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Controleer de modellenpagina voor de meest recente informatie over de beschikbaarheid van modellen en het afstemmen van ondersteuning in elke regio.

Voorbeelden van chattrainingen met meerdere bochten

Afstemming biedt nu ondersteuning voor trainingsvoorbeelden voor chats met meerdere bochten.

GPT-4 (0125) is beschikbaar voor Azure OpenAI op uw gegevens

U kunt nu het GPT-4-model (0125) gebruiken in beschikbare regio's met Azure OpenAI op uw gegevens.

Maart 2024

Risico's en veiligheidsbewaking in Azure OpenAI Studio

Azure OpenAI Studio biedt nu een risico- en veiligheidsdashboard voor elk van uw implementaties die gebruikmaken van een configuratie voor inhoudsfilters. Gebruik deze om de resultaten van de filteractiviteit te controleren. Vervolgens kunt u uw filterconfiguratie aanpassen om uw bedrijfsbehoeften beter te kunnen bedienen en te voldoen aan de principes voor verantwoorde AI.

Risico's en veiligheidsbewaking gebruiken

Azure OpenAI op uw gegevensupdates

  • U kunt nu verbinding maken met een Elasticsearch-vectordatabase die moet worden gebruikt met Azure OpenAI op uw gegevens.
  • U kunt de parameter segmentgrootte tijdens gegevensopname gebruiken om het maximum aantal tokens van een bepaald segment van gegevens in uw index in te stellen.

API voor algemene beschikbaarheid van 2024-02-01 (GA) uitgebracht

Dit is de nieuwste GA API-release en is de vervanging voor de vorige 2023-05-15 GA-release. In deze release wordt ondersteuning toegevoegd voor de nieuwste Functies van Azure OpenAI GA, zoals Whisper, DALLE-3, fine-tuning, op uw gegevens, enzovoort.

Voor functies die nog in preview zijn, zoals Assistenten, tekst-naar-spraak (TTS), die zeker zijn op uw gegevensbronnen, is nog steeds een preview-API-versie vereist. Raadpleeg onze levenscyclushandleiding voor API-versies voor meer informatie.

Algemene beschikbaarheid van Fluisteren (GA)

Het Fluisterse spraak-naar-tekstmodel is nu algemeen beschikbaar voor zowel REST als Python. Clientbibliotheek-SDK's zijn momenteel nog in openbare preview.

Fluisteren door een quickstart te volgen.

Algemene beschikbaarheid van DALL-E 3 (GA)

Het DALL-E 3-model voor het genereren van installatiekopieën is nu algemeen beschikbaar voor zowel REST als Python. Clientbibliotheek-SDK's zijn momenteel nog in openbare preview.

Probeer DALL-E 3 uit door een quickstart te volgen.

Nieuwe regionale ondersteuning voor DALL-E 3

U hebt nu toegang tot DALL-E 3 met een Azure OpenAI-resource in de East US of AustraliaEast Azure-regio, naast SwedenCentral.

Afschaffingen en buitengebruikstelling van modellen

We hebben een pagina toegevoegd om modelaftredingen en buitengebruikstelling bij te houden in Azure OpenAI Service. Deze pagina bevat informatie over de modellen die momenteel beschikbaar zijn, afgeschaft en buiten gebruik worden gesteld.

API 2024-03-01-preview uitgebracht

2024-03-01-preview heeft dezelfde functionaliteit als 2024-02-15-preview en voegt twee nieuwe parameters toe voor insluitingen:

  • encoding_format hiermee kunt u de indeling opgeven voor het genereren van insluitingen in float, of base64. De standaardwaarde is float.
  • dimensions hiermee kunt u het aantal insluitingen van uitvoer instellen. Deze parameter wordt alleen ondersteund met de nieuwe insluitingsmodellen van de derde generatie: text-embedding-3-large, text-embedding-3-small. Meestal zijn grotere insluitingen duurder vanuit reken-, geheugen- en opslagperspectief. Als u het aantal dimensies kunt aanpassen, hebt u meer controle over de totale kosten en prestaties. De dimensions parameter wordt niet ondersteund in alle versies van de OpenAI 1.x Python-bibliotheek om te profiteren van deze parameter, raden we aan om een upgrade uit te voeren naar de nieuwste versie: pip install openai --upgrade.

Als u momenteel een preview-API-versie gebruikt om te profiteren van de nieuwste functies, raden we u aan het artikel over de levenscyclus van de API-versie te raadplegen om bij te houden hoe lang uw huidige API-versie wordt ondersteund.

Update naar GPT-4-1106-Preview-upgradeplannen

De implementatie-upgrade van gpt-4 1106-Preview naar gpt-4 0125-Preview gepland voor 8 maart 2024 vindt niet meer plaats. Implementaties van gpt-4 versies 1106-Preview en 0125-Preview ingesteld op 'Automatisch bijwerken naar standaard' en 'Upgraden wanneer verlopen' wordt bijgewerkt nadat een stabiele versie van het model is uitgebracht.

Raadpleeg de pagina modellen voor meer informatie over het upgradeproces.

Februari 2024

GPT-3.5-turbo-0125 model beschikbaar

Dit model heeft verschillende verbeteringen, waaronder een hogere nauwkeurigheid bij het reageren in aangevraagde indelingen en een oplossing voor een fout die een tekstcoderingsprobleem veroorzaakte voor niet-Engelse functie-aanroepen.

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid en upgrades van het model.

Insluitingsmodellen van de derde generatie zijn beschikbaar

  • text-embedding-3-large
  • text-embedding-3-small

Bij het testen rapporteert OpenAI zowel de grote als de kleine derde generatie insluitingsmodellen betere gemiddelde prestaties van het ophalen van meerdere talen met de MIRACL-benchmark , terwijl nog steeds betere prestaties blijven behouden voor Engelse taken met de MTEB-benchmark dan het tweede generatie text-embedding-ada-002-model.

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid en upgrades van het model.

GPT-3.5 Turbo quotaconsolidatie

Ter vereenvoudiging van de migratie tussen verschillende versies van de GPT-3.5-Turbo-modellen (inclusief 16k), consolideren we alle GPT-3.5-Turbo-quota in één quotumwaarde.

  • Alle klanten die een verhoogd quotum hebben goedgekeurd, hebben een gecombineerd totaalquotum dat overeenkomt met de vorige verhogingen.

  • Elke klant waarvan het huidige totale gebruik in modelversies kleiner is dan de standaardwaarde, krijgt standaard een nieuw gecombineerd totaalquotum.

GPT-4-0125-preview model beschikbaar

De gpt-4 modelversie 0125-preview is nu beschikbaar in De Azure OpenAI-service in de regio's VS - oost, VS - noord-centraal en VS - zuid-centraal. Klanten met implementaties van gpt-4 de versie 1106-preview worden in de komende weken automatisch bijgewerkt naar 0125-preview .

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid en upgrades van het model.

Openbare preview van assistenten-API

Azure OpenAI ondersteunt nu de API die de GPT's van OpenAI aanroept. Met Azure OpenAI Assistants (preview) kunt u AI-assistenten maken die zijn afgestemd op uw behoeften via aangepaste instructies en geavanceerde hulpprogramma's zoals code-interpreter en aangepaste functies. Raadpleeg voor meer informatie:

Openbare preview van OpenAI-tekst naar spraakstemmen

Azure OpenAI Service ondersteunt nu tekst-naar-spraak-API's met de stemmen van OpenAI. Haal door AI gegenereerde spraak op uit de tekst die u opgeeft. Zie de overzichtshandleiding en probeer de quickstart voor meer informatie.

Notitie

Azure AI Speech ondersteunt ook OpenAI-tekst naar spraakstemmen. Zie OpenAI-tekst naar spraakstemmen via Azure OpenAI Service of via azure AI Speech Guide voor meer informatie.

Nieuwe mogelijkheden voor het afstemmen van modellen en modelondersteuning

Nieuwe regionale ondersteuning voor Azure OpenAI op uw gegevens

U kunt nu Azure OpenAI op uw gegevens gebruiken in de volgende Azure-regio:

  • Zuid-Afrika - noord

Algemene beschikbaarheid van Azure OpenAI voor uw gegevens

December 2023

Azure OpenAI op uw gegevens

  • Volledige ondersteuning voor VPN en privé-eindpunten voor Azure OpenAI op uw gegevens, waaronder beveiligingsondersteuning voor: opslagaccounts, Azure OpenAI-resources en Azure AI-Search-service-resources.
  • Nieuw artikel voor het veilig gebruiken van Azure OpenAI On Your Data door gegevens te beveiligen met virtuele netwerken en privé-eindpunten.

GPT-4 Turbo met Vision nu beschikbaar

GPT-4 Turbo with Vision in Azure OpenAI-service is nu in openbare preview. GPT-4 Turbo with Vision is een groot multimodale model (LMM) ontwikkeld door OpenAI dat afbeeldingen kan analyseren en tekstuele antwoorden kan geven op vragen over deze modellen. Het bevat zowel natuurlijke taalverwerking als visueel begrip. Met de verbeterde modus kunt u de Azure AI Vision-functies gebruiken om extra inzichten te genereren op basis van de afbeeldingen.

  • Verken de mogelijkheden van GPT-4 Turbo met Vision in een ervaring zonder code met behulp van de Azure OpenAI Playground. Meer informatie vindt u in de snelstartgids.
  • Visuele verbetering met GPT-4 Turbo met Vision is nu beschikbaar in de Azure OpenAI Playground en bevat ondersteuning voor optische tekenherkenning, objectgronding, ondersteuning voor afbeeldingen voor 'uw gegevens toevoegen' en ondersteuning voor videoprompt.
  • Maak rechtstreeks aanroepen naar de chat-API met behulp van de REST API.
  • Beschikbaarheid van regio's is momenteel beperkt totSwitzerlandNorth, SwedenCentralen WestUSAustraliaEast
  • Meer informatie over de bekende beperkingen van GPT-4 Turbo met Vision en andere veelgestelde vragen.

November 2023

Nieuwe ondersteuning voor gegevensbronnen in Azure OpenAI op uw gegevens

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 uitgebracht

Beide modellen zijn de nieuwste versie van OpenAI met verbeterde instructies na, JSON-modus, reproduceerbare uitvoer en parallelle functie aanroepen.

  • GPT-4 Turbo Preview heeft een maximaal contextvenster van 128.000 tokens en kan 4096 uitvoertokens genereren. Het bevat de nieuwste trainingsgegevens met kennis tot april 2023. Dit model is in preview en wordt niet aanbevolen voor productiegebruik. Alle implementaties van dit preview-model worden automatisch bijgewerkt zodra de stabiele release beschikbaar is.

  • GPT-3.5-Turbo-1106 heeft een maximaal contextvenster van 16.385 tokens en kan 4.096 uitvoertokens genereren.

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid van modellen.

De modellen hebben hun eigen unieke toewijzingen per regioquotum.

Openbare preview van DALL-E 3

DALL-E 3 is het nieuwste model voor het genereren van installatiekopieën van OpenAI. Het biedt verbeterde beeldkwaliteit, complexere scènes en verbeterde prestaties bij het weergeven van tekst in afbeeldingen. Het wordt ook geleverd met meer opties voor hoogte-breedteverhouding. DALL-E 3 is beschikbaar via OpenAI Studio en via de REST API. Uw OpenAI-resource moet zich in de SwedenCentral Azure-regio bevinden.

DALL-E 3 bevat ingebouwde promptherschrijven om afbeeldingen te verbeteren, vooroordelen te verminderen en natuurlijke variatie te vergroten.

Probeer DALL-E 3 uit door een quickstart te volgen.

Verantwoorde AI

  • Uitgebreide configureerbaarheid van klanten: alle Azure OpenAI-klanten kunnen nu alle ernstniveaus (laag, gemiddeld, hoog) configureren voor de categorieën haat, geweld, seksueel en zelfschade, waaronder het filteren van alleen inhoud met hoge ernst. Inhoudsfilters configureren

  • Inhoudsreferenties in alle DALL-E-modellen: door AI gegenereerde afbeeldingen van alle DALL-E-modellen bevatten nu een digitale referentie die de inhoud openbaar maakt als DOOR AI gegenereerd. Toepassingen die afbeeldingsassets weergeven, kunnen gebruikmaken van de open source Content Authenticity Initiative SDK om referenties weer te geven in hun door AI gegenereerde afbeeldingen. Referenties voor inhoud in Azure OpenAI

  • Nieuwe RAI-modellen

    • Jailbreak-risicodetectie: Jailbreak-aanvallen zijn gebruikersprompts die zijn ontworpen om het Generatieve AI-model te veroorzaken bij het vertonen van gedrag dat is getraind om de regels die zijn ingesteld in het systeembericht te vermijden of te verbreken. Het jailbreakrisicodetectiemodel is optioneel (standaard uitgeschakeld) en beschikbaar in aantekeningen en filtermodel. Deze wordt uitgevoerd op gebruikersprompts.
    • Beveiligde materiaaltekst: Beveiligde materiaaltekst beschrijft bekende tekstinhoud (bijvoorbeeld liedteksten, artikelen, recepten en geselecteerde webinhoud) die kan worden uitgevoerd door grote taalmodellen. Het beveiligde tekstmodel voor materiaal is optioneel (standaard uitgeschakeld) en beschikbaar in aantekeningen- en filtermodel. Deze wordt uitgevoerd op LLM-voltooiingen.
    • Beveiligde materiaalcode: met beveiligde materiaalcode wordt broncode beschreven die overeenkomt met een set broncode uit openbare opslagplaatsen, die kan worden uitgevoerd door grote taalmodellen zonder de juiste bronvermelding van bronopslagplaatsen. Het beveiligde materiaalcodemodel is optioneel (standaard uitgeschakeld) en beschikbaar in aantekeningen- en filtermodel. Deze wordt uitgevoerd op LLM-voltooiingen.

    Inhoudsfilters configureren

  • Blokkeringslijsten: Klanten kunnen nu snel het gedrag van inhoudsfilters aanpassen voor prompts en voltooiingen door een aangepaste blokkeringslijst in hun filters te maken. Met de aangepaste blokkeringslijst kan het filter actie ondernemen op een aangepaste lijst met patronen, zoals specifieke termen of regex-patronen. Naast aangepaste bloklijsten bieden we een blokkeringslijst voor Microsoft-grof taalgebruik (Engels). Blokkeringslijsten gebruiken

Oktober 2023

Nieuwe verfijningsmodellen (preview)

Azure OpenAI op uw gegevens

  • Nieuwe aangepaste parameters voor het bepalen van het aantal opgehaalde documenten en striktheid.
    • Met de strikte instelling wordt de drempelwaarde ingesteld voor het categoriseren van documenten als relevant voor uw query's.
    • De instelling voor opgehaalde documenten geeft het aantal topscoredocumenten op van uw gegevensindex die wordt gebruikt voor het genereren van antwoorden.
  • U kunt de status van gegevensopname/upload bekijken in Azure OpenAI Studio.
  • Ondersteuning voor privé-eindpunten en VPN's voor blobcontainers.

September 2023

GPT-4

GPT-4 en GPT-4-32k zijn nu beschikbaar voor alle Azure OpenAI Service-klanten. Klanten hoeven niet langer op de wachtlijst te wachten om GPT-4 en GPT-4-32k te gebruiken (de registratievereisten voor beperkte toegang blijven van toepassing op alle Azure OpenAI-modellen). De beschikbaarheid kan per regio verschillen. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

GPT-3.5 Turbo Instruct

Azure OpenAI Service ondersteunt nu het GPT-3.5 Turbo Instruct-model. Dit model heeft prestaties die vergelijkbaar zijn met text-davinci-003 en is beschikbaar voor gebruik met de Voltooiings-API. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Fluister openbare preview

Azure OpenAI Service biedt nu ondersteuning voor spraak-naar-tekst-API's, mogelijk gemaakt door het Whisper-model van OpenAI. Door AI gegenereerde tekst ophalen op basis van de spraakaudio die u opgeeft. Bekijk de quickstart voor meer informatie.

Notitie

Azure AI Speech ondersteunt ook het Whisper-model van OpenAI via de batchtranscriptie-API. Raadpleeg de handleiding Een batchtranscriptie maken voor meer informatie. Bekijk wat is het Fluistermodel? voor meer informatie over wanneer u Azure AI Speech versus Azure OpenAI Service gebruikt.

Nieuwe regio's

  • Azure OpenAI is nu ook beschikbaar in de regio's Zweden - centraal en Zwitserland - noord. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Verhogingen van regionale quotumlimieten

  • Hiermee worden de maximale standaardquotumlimieten voor bepaalde modellen en regio's verhoogd. Door workloads naar deze modellen en regio's te migreren, kunt u profiteren van hogere tokens per minuut (TPM).

Augustus 2023

Azure OpenAI op uw eigen gegevens (preview)-updates

Juli 2023

Ondersteuning voor functie-aanroepen

Toename invoermatrix insluiten

Nieuwe regio's

  • Azure OpenAI is nu ook beschikbaar in de regio's Canada - oost, VS - oost 2, Japan - oost en VS - noord-centraal. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Juni 2023

Azure OpenAI gebruiken op uw eigen gegevens (preview)

  • Azure OpenAI On Your Data is nu beschikbaar in preview, zodat u kunt chatten met OpenAI-modellen zoals GPT-35-Turbo en GPT-4 en antwoorden ontvangt op basis van uw gegevens.

Nieuwe versies van gpt-35-turbo- en gpt-4-modellen

  • gpt-35-turbo (versie 0613)
  • gpt-35-turbo-16k (versie 0613)
  • gpt-4 (versie 0613)
  • gpt-4-32k (versie 0613)

Verenigd Koninkrijk Zuid

  • Azure OpenAI is nu beschikbaar in de regio VK - zuid. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Inhoud filteren en aantekeningen (preview)

  • Inhoudsfilters configureren met De Azure OpenAI-service.
  • Schakel aantekeningen in om inhoudsfiltercategorie en ernstgegevens weer te geven als onderdeel van uw op GPT gebaseerde voltooiings- en chatvoltooiingsgesprekken.

Target

Mei 2023

Ondersteuning voor Java & JavaScript SDK

  • NIEUWE Azure OpenAI Preview SDK's die ondersteuning bieden voor JavaScript en Java.

Algemene beschikbaarheid van Azure OpenAI-chats (GA)

  • Ondersteuning voor algemene beschikbaarheid voor:
    • Api-versie van 2023-05-15chatvoltooiing.
    • GPT-35-Turbo modellen.
    • GPT-4-modelserie.

Als u momenteel de 2023-03-15-preview API gebruikt, raden we u aan om te migreren naar de GA-API 2023-05-15 . Als u momenteel api-versie 2022-12-01 gebruikt, blijft deze API algemeen beschikbaar, maar bevat deze niet de nieuwste mogelijkheden voor voltooiing van chats.

Belangrijk

Het gebruik van de huidige versies van de GPT-35-Turbo-modellen met het voltooiingseindpunt blijft in preview.

Frankrijk - centraal

  • Azure OpenAI is nu beschikbaar in de regio Frankrijk - centraal. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

April 2023

  • Openbare preview van DALL-E 2. Azure OpenAI Service ondersteunt nu API's voor het genereren van installatiekopieën, mogelijk gemaakt door het DALL-E 2-model van OpenAI. Haal door AI gegenereerde afbeeldingen op op basis van de beschrijvende tekst die u opgeeft. Bekijk de quickstart voor meer informatie.

  • Inactieve implementaties van aangepaste modellen worden nu na 15 dagen verwijderd; modellen blijven beschikbaar voor opnieuw implementeren. Als een aangepast (afgestemd) model gedurende meer dan vijftien (15) dagen wordt geïmplementeerd waarin er geen aanroepen voor voltooiingen of chats worden gedaan, wordt de implementatie automatisch verwijderd (en worden er geen verdere hostingkosten in rekening gebracht voor die implementatie). Het onderliggende aangepaste model blijft beschikbaar en kan op elk gewenst moment opnieuw worden geïmplementeerd. Raadpleeg het artikel voor meer informatie.

Maart 2023

  • GPT-4-seriemodellen zijn nu beschikbaar in preview op Azure OpenAI. Als u toegang wilt aanvragen, kunnen bestaande Azure OpenAI-klanten van toepassing zijn door dit formulier in te vullen. Deze modellen zijn momenteel beschikbaar in de regio's VS - oost en VS - zuid-centraal.

  • Nieuwe API voor voltooiing van chat voor GPT-35-Turbo- en GPT-4-modellen die zijn uitgebracht in preview op 3/21. Bekijk de bijgewerkte quickstarts en procedures voor meer informatie.

  • GPT-35-Turbo preview. Bekijk het artikel voor meer informatie.

  • Verhoogde trainingslimieten voor het afstemmen: de maximale grootte van de trainingstaak (tokens in trainingsbestand) x (# van tijdvakken) is 2 miljard tokens voor alle modellen. We hebben ook de maximale trainingstaak verhoogd van 120 tot 720 uur.

  • Aanvullende use cases toevoegen aan uw bestaande toegang.  Voorheen vereist het proces voor het toevoegen van nieuwe gebruiksvoorbeelden dat klanten opnieuw moeten worden toegepast op de service. Nu brengen we een nieuw proces uit waarmee u snel nieuwe use cases kunt toevoegen aan uw gebruik van de service. Dit proces volgt het tot stand gebrachte proces voor beperkte toegang binnen Azure AI-services. Bestaande klanten kunnen hier alle nieuwe gebruiksvoorbeelden bevestigen. Houd er rekening mee dat dit vereist is wanneer u de service wilt gebruiken voor een nieuwe use case waarvoor u oorspronkelijk geen aanvraag hebt gedaan.

2023 februari

Nieuwe functies

Updates

  • Inhoudsfiltering is standaard ingeschakeld.

Nieuwe artikelen over:

Nieuwe trainingscursus:

Januari 2023

Nieuwe functies

  • Ga naar service. De Azure OpenAI-service is nu algemeen beschikbaar.

  • Nieuwe modellen: Toevoeging van het nieuwste tekstmodel, text-davinci-003 (VS - oost, Europa - west), text-ada-embeddings-002 (VS - oost, VS - zuid-centraal, Europa - west)

December 2022

Nieuwe functies

  • De nieuwste modellen van OpenAI. Azure OpenAI biedt toegang tot alle nieuwste modellen, waaronder de GPT-3.5-serie.

  • Nieuwe API-versie (2022-12-01). Deze update bevat verschillende aangevraagde verbeteringen, waaronder tokengebruiksgegevens in het API-antwoord, verbeterde foutberichten voor bestanden, afstemming met OpenAI op het verfijnen van de gegevensstructuur voor het maken van gegevens en ondersteuning voor de parameter achtervoegsel om aangepaste namen van nauwkeurig afgestemde taken toe te staan. ​

  • Hogere aanvraaglimieten per seconde. 50 voor niet-Davinci-modellen. 20 voor Davinci-modellen.

  • Snellere implementaties afstemmen. Implementeer in minder dan 10 minuten een nauwkeurig afgestemde Ada- en Curie-modellen.

  • Hogere trainingslimieten: 40M trainingstokens voor Ada, Babbage en Curie. 10M voor Davinci.

  • Proces voor het aanvragen van wijzigingen aan het misbruik en miss-use gegevenslogboeken en menselijke beoordeling. Vandaag de dag registreert de service aanvraag-/antwoordgegevens voor misbruik en misbruikdetectie om ervoor te zorgen dat deze krachtige modellen niet worden misbruikt. Veel klanten hebben echter strikte vereisten voor gegevensprivacy en beveiliging die meer controle over hun gegevens vereisen. Ter ondersteuning van deze use cases brengen we een nieuw proces uit voor klanten om het beleid voor inhoudsfiltering te wijzigen of de logboekregistratie voor misbruik uit te schakelen voor use cases met een laag risico. Dit proces volgt het tot stand gebrachte proces voor beperkte toegang binnen Azure AI-services en bestaande OpenAI-klanten kunnen hier van toepassing zijn.

  • Cmk-versleuteling (door de klant beheerde sleutel). CMK biedt klanten meer controle over het beheren van hun gegevens in Azure OpenAI door hun eigen versleutelingssleutels op te geven die worden gebruikt voor het opslaan van trainingsgegevens en aangepaste modellen. Door de klant beheerde sleutels (CMK), ook wel bekend als BYOK (Bring Your Own Key), bieden meer flexibiliteit bij het maken, roteren, uitschakelen en intrekken van toegangsbeheer. U kunt ook de versleutelingssleutels controleren die worden gebruikt voor het beveiligen van uw gegevens. Meer informatie vindt u in onze documentatie over versleuteling-at-rest.

  • Ondersteuning voor Lockbox

  • SOC-2-naleving

  • Logboekregistratie en diagnostische gegevens via Azure Resource Health, Kostenanalyse en Metrische gegevens & Diagnostische instellingen.

  • Studio-verbeteringen. Talloze bruikbaarheidsverbeteringen in de Studio-werkstroom, waaronder ondersteuning voor Azure AD-rollen, om te bepalen wie in het team toegang heeft om nauwkeurig afgestemde modellen te maken en te implementeren.

Wijzigingen (fouten)

Het maken van een API-aanvraag is bijgewerkt zodat deze overeenkomt met het schema van OpenAI.

Preview-API-versies:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API-versie 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

Inhoudsfiltering is standaard tijdelijk uitgeschakeld . Azure-con tentmodus ration werkt anders dan Azure OpenAI. Azure OpenAI voert inhoudsfilters uit tijdens de generatieoproep om schadelijke of beledigende inhoud te detecteren en te filteren op basis van het antwoord. Meer informatie

Deze modellen worden opnieuw ingeschakeld in Q1 2023 en zijn standaard ingeschakeld. ​

Klantacties

Volgende stappen

Meer informatie over de onderliggende modellen die Azure OpenAI mogelijk maken.