Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Ez a cikk összefoglalja az Azure OpenAI legújabb kiadásait és főbb dokumentációs frissítéseit.
2025. június
megjelent codex-mini &o3-pro modellek
-
codex-mini
éso3-pro
most már elérhetők. További információkért tekintse meg az érvelési modellek használatának első lépéseit ismertető oldalt
2025. május
Megjelent a Sora videogeneráció (előzetes verzió)
A Sora (2025-05-02) az OpenAI videógenerációs modellje, amely szöveges utasításokból valós és fantáziadús videojeleneteket hozhat létre.
Az első lépésekhez kövesse a Videógenerálás rövid útmutatóját . További információkért tekintse meg a videógenerálási fogalmakat ismertető útmutatót.
A parancssori pajzsok kiemelése
A reflektorfény a parancssori pajzsok egyik alfunkciója, amely fokozza a közvetett (beágyazott dokumentum) támadások elleni védelmet azáltal, hogy speciális formázással címkéz be bemeneti dokumentumokat a modell megbízhatóságának csökkentése érdekében. További információkért tekintse meg a Prompt shields szűrő dokumentációját .
Modell útválasztó (előzetes)
Az Azure AI Foundry modell útválasztója egy üzembe helyezhető AI-csevegési modell, amely automatikusan kiválasztja a legjobb mögöttes csevegőmodellt egy adott kérdés megválaszolásához. A modell útválasztó működésével és előnyeivel és korlátaival kapcsolatos további információkért tekintse meg a Modell útválasztók alapfogalmait ismertető útmutatót. A modell útválasztójának a Completions API-val való használatához kövesse az útmutatót.
2025. április
Realtime API (előzetes verzió) támogatása a WebRTC-hez
A Realtime API (előzetes verzió) mostantól támogatja a WebRTC-t, lehetővé téve a valós idejű hangstreamelést és az alacsony késleltetésű interakciókat. Ez a funkció ideális az azonnali visszajelzést igénylő alkalmazásokhoz, például az élő ügyfélszolgálathoz vagy az interaktív hangsegédekhez. További információkért tekintse meg a Realtime API (előzetes verzió) dokumentációját.
Megjelent a GPT-image-1 (előzetes verzió, korlátozott hozzáférés)
A GPT-image-1 (2025-04-15) az Azure OpenAI legújabb képgenerálási modellje. Jelentős fejlesztéseket tartalmaz a DALL-E-hez, többek között a következőket:
- Jobban reagálhat a pontos utasításokra.
- Megbízhatóan rendereli a szöveget.
- Bemenetként fogadja el a képeket, ami lehetővé teszi a képszerkesztés és -szerkesztés új képességeit.
Hozzáférés kérése: Korlátozott hozzáférésű modellalkalmazás
Kövesse a képgenerálás útmutatót az új modell használatának megkezdéséhez.
o4-mini és o3 modellek megjelentek
o4-mini
és o3
a modellek már elérhetők. Ezek az Azure OpenAI legújabb érvelési modelljei, amelyek jelentősen megnövelik az érvelést, a minőséget és a teljesítményt. További információkért tekintse meg az érvelési modellek használatának első lépéseit ismertető oldalt.
Megjelent a GPT-4.1
A GPT 4.1 és a GPT 4.1 nano már elérhető. Ezek az Azure OpenAI legújabb modelljei. A GPT 4.1 1 millió token környezeti korláttal rendelkezik. További információt a modellek oldalán talál.
gpt-4o audiomodellek megjelentek
A GPT-4o által működtetett új hangmodellek már elérhetők.
A
gpt-4o-transcribe
ésgpt-4o-mini-transcribe
beszéd a szöveggé alakító modellek megjelentek. Ezeket a modelleket az/audio
és/realtime
API-k révén használhatja.A
gpt-4o-mini-tts
szövegfelolvasási modell ki van adva. Használja a modellt szövegfelolvasáshozgpt-4o-mini-tts
az/audio
API-val.
Az elérhető modellekről további információt a modellek és a verziók dokumentációjában talál.
2025. március
Responses API & számítógép-használat-előnézet modell
A Responses API egy új állapotalapú API az Azure OpenAI-ból. Egyetlen egységes felületen egyesíti a csevegés befejezésének legjobb képességeit és az assistants API-t. A Responses API az új computer-use-preview
modell támogatását is hozzáadja, amely a számítógép-használati képességet biztosítja.
computer-use-preview
Az egyéb korlátozott hozzáférési modellekhez hozzáféréssel rendelkező ügyfeleknek továbbra is hozzáférést kell kérniük ehhez a modellhez.
Hozzáférés kérése: computer-use-preview
korlátozott hozzáférésű modellalkalmazás
A modell képességeivel és a régiók elérhetőségével kapcsolatos további információkért tekintse meg a modellek dokumentációját.
Playwright integrációs demo kód.
Előre beállított túlcsordulás (előzetes verzió)
A Spillover a kiépített üzembe helyezések forgalomingadozásait úgy kezeli, hogy a túlhasználatot egy kijelölt alapértelmezett üzembe helyezésre irányítja. Ha többet szeretne megtudni arról, hogyan maximalizálhatja a konfigurált telepítések kihasználtságát a spillover használatával, lásd: Forgalom kezelése a konfigurált telepítésekhez (előzetes verzió).
Tartalomszűrési konfigurációk megadása
Az üzembe helyezési szintű tartalomszűrési konfiguráció mellett most egy kérésfejlécet is biztosítunk, amely lehetővé teszi az egyéni konfiguráció megadását kéréskor minden API-híváshoz. További információ: Tartalomszűrők használata (előzetes verzió).
2025. február
GPT-4.5 előzetes verzió
Az Azure OpenAI-ban már elérhető a legújabb GPT-modell, amely a különféle szöveges és képi feladatokban kiválóan teljesít.
A modell képességeivel és a régiók elérhetőségével kapcsolatos további információkért tekintse meg a modellek dokumentációját.
Tárolt kiegészítési API
A tárolt befejezésekkel rögzítheti a csevegés befejező munkameneteinek beszélgetési előzményeit, és adatkészletként használhatja az értékeléshez és a finomhangoláshoz.
o3-mini datazone standard üzembe helyezések
o3-mini
már elérhető a globális szabvány és az adatzóna szabványos telepítésekhez a regisztrált, korlátozott hozzáférésű ügyfelek számára.
További információt az érvelési modell útmutatójában talál.
gpt-4o mini audio megjelent
A gpt-4o-mini-audio-preview
(2024-12-17) modell a legújabb hangkiegészítési modell. További információkért tekintse meg a hanggenerálási rövid útmutatót.
A gpt-4o-mini-realtime-preview
(2024-12-17) modell a legújabb valós idejű hangmodell. A valós idejű modellek ugyanazt a mögöttes GPT-4o hangmodellt használják, mint a befejezési API, de alacsony késésű, valós idejű hang interakciókra van optimalizálva. További információkért tekintse meg a valós idejű hangalapú gyorsútmutatót.
Az elérhető modellekről további információt a modellek és a verziók dokumentációjában talál.
2025. január
o3-mini megjelent
o3-mini
(2025-01-31) a legújabb érvelési modell, amely továbbfejlesztett érvelési képességeket kínál. További információt az érvelési modell útmutatójában talál.
GPT-4o hangkiegészítések
A gpt-4o-audio-preview
modell már elérhető az USA 2. keleti régiójában és Svédország középső régióiban történő globális üzembe helyezéshez. Használja a modellt a gpt-4o-audio-preview
hanggeneráláshoz.
A gpt-4o-audio-preview
modell bevezeti a hangmoderitást a meglévő /chat/completions
API-ba. A hangmodell kibővíti az AI-alkalmazások lehetőségeit a szöveg- és hangalapú interakciókban és a hangelemzésben. A modellben gpt-4o-audio-preview
támogatott módok a következők: szöveg, hang és szöveg + hang. További információkért tekintse meg a hanggenerálási rövid útmutatót.
Megjegyzés:
A Realtime API ugyanazt a mögöttes GPT-4o hangmodellt használja, mint a befejezési API, de alacsony késleltetésű, valós idejű hang interakciókra van optimalizálva.
GPT-4o Realtime API 2024-12-17
A gpt-4o-realtime-preview
modell 2024-12-17-es verziója globális telepítésekhez Kelet-USA 2 és Svédország középső régiójában érhető el. Valós idejű hang interakciókhoz használja a gpt-4o-realtime-preview
2024-12-17-es verziójú modellt a gpt-4o-realtime-preview
2024-10-01-es verzió helyett.
-
Kérés gyorsítótárazás támogatása hozzáadva az
gpt-4o-realtime-preview
modellhez. - Támogatást adtunk az új hangokhoz. A
gpt-4o-realtime-preview
modellek most a következő hangokat támogatják: "ötvözet", "hamu", "ballada", "korall", "visszhang", "zsálya", "csillám", "vers". - A sebességkorlátok már nem a percenkénti kapcsolatokon alapulnak. A sebességkorlátozás mostantól az RPM-en (kérések percenként) és a TPM-en (tokenek percenként) alapul a
gpt-4o-realtime-preview
modellhez. Az egyesgpt-4o-realtime-preview
modellek üzembe helyezésének sebességkorlátjai 100 000 TPM és 1K RPM. Az előzetes verzióban előfordulhat, hogy az Azure AI Foundry portál és az API-k pontatlanul mutatnak eltérő díjszabási korlátokat. Még ha más sebességkorlátot is próbál beállítani, a tényleges sebességkorlát 100 000 TPM és 1K RPM lesz.
További információkért lásd a GPT-4o valós idejű hang gyors kezelési útmutatót, valamint az útmutatót.
2024. december
o1 korlátozott hozzáférésre kiadott érvelési modell
A legújabb o1
modell már elérhető AZ API-hozzáféréshez és a modell üzembe helyezéséhez.
Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva. Azoknak az ügyfeleknek, akik korábban kérelmezték és hozzáférést kaptak a o1-preview
, nem kell újra igényelniük, mivel automatikusan szerepelnek a legújabb modell várólistáján.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Ha többet szeretne megtudni a speciális o1
sorozatmodellekről, tekintse meg az o1 sorozatok érvelési modelljeinek első lépéseit.
Régió rendelkezésre állása
Modell | Régió |
---|---|
o1 (Verzió: 2024-12-17) |
USA2 keleti régiója (globális szabvány) Svédország középső régiója (Global Standard) |
Preferenciák finomhangolása (előzetes verzió)
A közvetlen preferenciák optimalizálása (DPO) egy új igazítási technika a nagy nyelvi modellekhez, amelyek úgy lettek kialakítva, hogy a modell súlyát az emberi beállítások alapján igazítsák. Az emberi visszajelzésekből (RLHF) származó megerősítési tanulástól eltérően a DPO nem igényel jutalommodellt, és egyszerűbb adatokat (bináris beállításokat) használ a betanításhoz. Ez a módszer számítási szempontból könnyebb és gyorsabb, így ugyanolyan hatékony az igazítás során, miközben hatékonyabb. A DPO különösen olyan helyzetekben hasznos, ahol a szubjektív elemek, például a hang, a stílus vagy a konkrét tartalombeállítások fontosak. Örömmel jelentjük be a DPO nyilvános előzetes verzióját az Azure OpenAI-ban, kezdve a gpt-4o-2024-08-06
modellel.
A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.
Tárolt befejezések és desztilláció
A tárolt befejezésekkel rögzítheti a csevegés befejező munkameneteinek beszélgetési előzményeit, és adatkészletként használhatja az értékeléshez és a finomhangoláshoz.
GPT-4o 2024-11-20
gpt-4o-2024-11-20
már elérhető a következő helyeken a globális standard üzembe helyezéshez
- USA keleti régiója
- USA 2. keleti régiója
- USA északi középső régiója
- USA déli középső régiója
- USA nyugati régiója
- USA 3. nyugati régiója
- Közép-Svédország
ÚJ adatövezet előkészített üzembehelyezési típus
Az adatzóna által kiépített üzembe helyezések ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-telepítési típus, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat a Microsoft által meghatározott adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna kiépített üzembe helyezései fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez a Microsoft által megadott adatzónákon belüli Azure-infrastruktúra használatával. Adatzóna kiépített üzemelő példányai támogatottak a gpt-4o-2024-08-06
, gpt-4o-2024-05-13
és gpt-4o-mini-2024-07-18
modelleken.
További információt az üzembehelyezési típusok útmutatójában talál.
2024. november
Látás finomhangolása – GA
A Vision finomhangolás a GPT-4o-val (2024-08-06) most általános elérhetőségben (GA).
A látás finomhangolásával képeket adhat a JSONL betanítási adataihoz. Ugyanúgy, ahogy egy vagy több képbemenetet küldhet a csevegés befejezéséhez, ugyanezeket az üzenettípusokat is belefoglalhatja a betanítási adatokba. A képek megadhatók URL-ek formájában vagy base64 kódolású képként.
A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.
ÚJ AI-visszaélések monitorozása
A visszaélések monitorozásának új formáit vezetjük be, amelyek llM-eket használnak az Azure OpenAI potenciálisan visszaélésszerű használatának észlelésének hatékonyságának javítására, valamint a visszaélések monitorozásának engedélyezésére anélkül, hogy emberi felülvizsgálatra van szükség a kérések és kiegészítések esetében. További információ: Visszaélések monitorozása.
A tartalombesorolással megjelölt és/vagy vélhetően visszaélésszerű használati minta részeként megjelölt kéréseket és kiegészítéseket egy további felülvizsgálati folyamatnak vetik alá, amely segít megerősíteni a rendszer elemzését, és tájékoztatni a műveleti döntéseket. A visszaélések monitorozási rendszereit kiterjesztettük, hogy az LLM alapértelmezés szerint, szükség esetén pedig az emberek számára is lehetővé tegye a felülvizsgálatot.
2024. október
ÚJ adat zóna standard telepítési típus
Az adatzóna standard üzemelő példányai ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-üzembe helyezési típus, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat a Microsoft által definiált adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna-szabvány magasabb alapértelmezett kvótákat biztosít, mint az Azure földrajzi alapú üzembe helyezési típusai. A(z) adatzóna standard telepítései támogatottak a gpt-4o-2024-08-06
, gpt-4o-2024-05-13
és gpt-4o-mini-2024-07-18
modelleken.
További információt az üzembehelyezési típusok útmutatójában talál.
Globális Batch GA
Az Azure OpenAI globális köteg általánosan elérhető.
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön sorba állított token kvótával rendelkeznek, ami segít elkerülni az online munkaterhek megzavarását.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
o1-preview és o1-mini modellek korlátozott hozzáféréssel
A o1-preview
és o1-mini
modellek mostantól elérhetők API-hozzáféréshez és modelltelepítéshez.
Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Azok az ügyfelek, akik már jóváhagyták a modellt, és hozzáféréssel rendelkeznek a modellhez a korai hozzáférésű játszótéren keresztül, nem kell újra alkalmazniuk, automatikusan API-hozzáférést kapnak. A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.
API-támogatás:
Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-preview
lett hozzáadva.
A max_tokens
paraméter elavult, és az új max_completion_tokens
paraméterre cserélődött.
o1 sorozatú modellek csak a max_completion_tokens
paraméterrel működnek.
Régió rendelkezésre állása:
A modellek az USA 2. keleti régiójában és a Svédország középső régiójában a standard és globális standard üzembe helyezéshez érhetők el a jóváhagyott ügyfelek számára.
Új GPT-4o Realtime API nyilvános előzetes beszédhez és hanghoz
Az Azure OpenAI GPT-4o audio a GPT-4o modellcsalád része, amely támogatja az alacsony késleltetésű, "beszéd be, beszéd ki" típusú beszélgetési interakciókat. A GPT-4o audio realtime
API valós idejű, kis késésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas a felhasználó és a modell közötti élő interakciókat, például az ügyfélszolgálati ügynököket, a hangsegédeket és a valós idejű fordítókat érintő használati esetekhez.
A gpt-4o-realtime-preview
modell elérhető globális telepítésekhez a Kelet-USA 2 és Svédország központi régióiban.
További információkért tekintse meg a GPT-4o valós idejű hangalapú gyorsútmutatót.
Globális batch támogatási frissítések
A globális köteg mostantól támogatja a GPT-4o-t (2024-08-06). További információt a globális csomag kezdő útmutatójában talál.
2024. szeptember
Azure OpenAI Studio UX-frissítések
2024. szeptember 19-én az Azure OpenAI Studio megnyitásakor alapértelmezés szerint nem jelenik meg az örökölt Azure OpenAI Studio. Ha szükség van rá, a felhasználói felület felső sávjában a Switch to the old look váltógombot használva visszatérhet a korábbi megjelenéshez a következő pár hétben. Ha visszaáll a régi Azure AI Foundry portálra, az segít, ha kitölti a visszajelzési űrlapot, hogy jelezze számunkra az okát. Aktívan figyeljük ezt a visszajelzést az új élmény javítása érdekében.
GPT-4o 2024-08-06 telepített üzembe helyezések
A GPT-4o 2024-08-06 már elérhető az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban üzembe helyezéshez. Globális üzembe helyezésekhez is elérhető.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
ÚJ előre konfigurált globális üzembehelyezési típus
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális üzembe helyezési típusok, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat az adatközpontba, és minden kéréshez a legjobb rendelkezésre állást biztosíthassa. Az előkészített globális telepítések fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez az Azure globális infrastruktúrájának révén. Globális kapacitású kiépítések támogatottak a gpt-4o-2024-08-06
és gpt-4o-mini-2024-07-18
modelleken.
További információt az üzembehelyezési típusok útmutatójában talál.
ÚJ o1-preview és o1-mini modellek korlátozott hozzáféréshez
Az Azure OpenAI o1-preview
és o1-mini
a modellek célja az érvelési és problémamegoldási feladatok kezelése nagyobb összpontosítással és képességgel. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.
Az o1 sorozat főbb képességei
- Összetett kódgenerálás: Képes algoritmusok létrehozására és speciális kódolási feladatok kezelésére a fejlesztők támogatásához.
- Speciális problémamegoldás: Ideális átfogó ötletgyűjtési munkamenetekhez és a sokrétű kihívások kezeléséhez.
- Összetett dokumentum-összehasonlítás: Tökéletes a szerződések, esetfájlok vagy jogi dokumentumok elemzéséhez a finom különbségek azonosításához.
- Utasításkövetés és munkafolyamat-kezelés: Különösen hatékony olyan munkafolyamatok kezelésében, amelyek rövidebb kontextusokat igényelnek.
Modellvariánsok
-
o1-preview
:o1-preview
ao1
sorozatmodelljei közül a legkiválóbb. -
o1-mini
: Ao1-mini
ao1
sorozat modelljei közül a leggyorsabb és legolcsóbb.
Modellverzió: 2024-09-12
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Korlátozások
A o1
sorozatmodellek jelenleg előzetes verzióban érhetők el, és nem tartalmaznak más modellekben elérhető funkciókat, például a képfelismerést és a strukturált kimeneteket, amelyek a legújabb GPT-4o modellben érhetők el. Sok feladat esetén az általánosan elérhető GPT-4o modellek még mindig megfelelőbbek lehetnek.
Biztonság
Az OpenAI további biztonsági intézkedéseket is beépített a o1
modellekbe, beleértve az új technikákat, amelyekkel a modellek elutasíthatják a nem biztonságos kéréseket. Ezek a fejlesztések teszik elérhetővé a o1
sorozatot a leg robusztusabb modellek közül.
Elérhetőség
o1-preview
és o1-mini
az USA keleti 2 régiójában elérhetők korlátozott hozzáféréssel az Azure AI Foundry portál korai hozzáférésű játszóterén keresztül. A modellek adatfeldolgozása o1
más régióban fordulhat elő, mint ahol a modellek használhatók.
A o1-preview
és a o1-mini
modellek kipróbálásához a korai hozzáférésű játszótéren regisztráció szükséges, és a hozzáférést a Microsoft jogosultsági feltételei alapján fogják biztosítani.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A hozzáférés megadása után a következőkre lesz szüksége:
- Keresse meg https://ai.azure.com/resources és válassza ki az erőforrást a
eastus2
régióban. Ha ebben a régióban nincs Azure OpenAI-erőforrása, létre kell hoznia egyet. - Miután kiválasztotta az
eastus2
Azure OpenAI-erőforrást, a bal felső panelen válassza a Korai hozzáférésű játszótér (előzetes verzió) lehetőséget.
2024. augusztus
GPT-4o 2024-08-06 strukturált kimenetek
- Elérhető a standard és globális üzembe helyezésekhez az összes USA-régióban és Svédország központi régiójában.
- Ez a modell támogatja a strukturált kimeneteket.
GPT-4o mini előre konfigurált üzembe helyezések
A GPT-4o mini már elérhető a kiépített üzembe helyezésekhez Kanada keleti régiójában, az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
GPT-4o finomhangolás (nyilvános előzetes verzió)
A GPT-4o finomhangolása mostantól nyilvános előzetes verzióban elérhető az Azure OpenAI-hoz az USA északi középső régiójában és a Svédország középső régiójában.
További információkért tekintse meg blogbejegyzésünket.
Új előzetes verziójú API-kiadás
Az API-verzió 2024-07-01-preview
a dataplane legújabb szerkesztési és következtetési API-kiadása. Lecseréli az API-verziót 2024-05-01-preview
, és támogatja a következőket:
- Batch API-támogatás hozzáadva
- Vektortároló adattömb-stratégiai paraméterei
-
max_num_results
amit a fájlkereső eszköznek ki kell adnia.
További információkért tekintse meg referenciadokumentációnkat
GPT-4o kisebb regionális elérhetőség
- A GPT-4o mini az USA keleti és svédországi középső régióiban standard és globális standard üzembe helyezéshez érhető el.
- A GPT-4o mini az USA keleti régiójában, Svédország középső régiójában és az USA nyugati régiójában elérhető a globális kötegelt üzembe helyezéshez.
Értékelési útmutató
- Új blogbejegyzés a modellértékelések első lépéseiről. Javasoljuk, hogy ezt az útmutatót használja a modellfrissítési és -kivonási folyamat részeként.
A legújabb GPT-4o modell elérhető a korai hozzáférésű játszótéren (előzetes verzió)
2024. augusztus 6-án az OpenAI bejelentette a gpt-4o-modell legújabb verzióját 2024-08-06
. A GPT-4o 2024-08-06
az előző verzió összes képességével rendelkezik, valamint:
- Az összetett strukturált kimenetek támogatásának továbbfejlesztett képessége.
- A maximális kimeneti jogkivonatok száma 4096-ról 16 384-re nőtt.
Az Azure-ügyfelek ma tesztelhetik a GPT-4o-t 2024-08-06
az új Azure AI Foundry korai hozzáférésű játszótéren (előzetes verzió).
Az előző korai hozzáférésű játszótértől eltérően az Azure AI Foundry portál korai hozzáférésű játszótere (előzetes verzió) nem igényel erőforrást egy adott régióban.
Megjegyzés:
A korai hozzáférésű játszótéren (előzetes verzió) végrehajtott kérések és kiegészítések bármely Azure OpenAI-régióban feldolgozhatók, és jelenleg percenként 10 kérésre vonatkoznak Azure-előfizetési korlátonként. Ez a korlát a jövőben változhat.
Az Azure OpenAI visszaélések monitorozása minden korai hozzáférésű játszótér-felhasználó számára engedélyezve van, még akkor is, ha módosításra jóváhagyták; az alapértelmezett tartalomszűrők engedélyezve vannak, és nem módosíthatók.
A GPT-4o 2024-08-06
teszteléséhez jelentkezzen be az Azure AI korai hozzáférésű játszóterére (előzetes verzió) ezen a hivatkozáson keresztül.
A globális kötegtelepítések már elérhetők
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön sorba állított token kvótával rendelkeznek, ami segít elkerülni az online munkaterhek megzavarását.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
2024. július
A GPT-4o mini már elérhető a finomhangoláshoz
A GPT-4o mini finomhangolás mostantól nyilvános előzetes verzióban érhető el Svédország középső régiójában és az USA északi középső régiójában.
Az Asszisztens fájlkeresési eszköz most már számlázható
Az Asszisztensek fájlkereső eszközének használatáért most további díjakat kell fizetnie. További információkért tekintse meg a díjszabási oldalt .
A GPT-4o minimodell üzembe helyezéshez érhető el
A GPT-4o mini a legújabb Azure OpenAI-modell, amelyet először 2024. július 18-án jelentettek be:
"A GPT-4o mini lehetővé teszi az ügyfelek számára, hogy lenyűgöző alkalmazásokat nyújtsanak alacsonyabb áron, villámgyorsan. A GPT-4o mini jelentősen intelligensebb, mint a GPT-3.5 Turbo – 82%-os pontszámot ért el a Massive Multitask Language Understanding (MMLU) mérése terén a 70%-hoz képest, és több mint 60%-kal olcsóbb.1 A modell kibővített 128K környezeti ablakot biztosít, és integrálja a GPT-4o továbbfejlesztett többnyelvű képességeit, így jobb minőséget biztosít a nyelveknek a világ minden tájáról."
A modell jelenleg az USA keleti régiójában standard és globális standard üzembe helyezéshez is elérhető.
A modellkvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalt , és a modell elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Új felelős AI alapértelmezett tartalomszűrési szabályzat
Az új alapértelmezett tartalomszűrési szabályzat DefaultV2
biztosítja a GPT-modellsorozat (szöveg) legújabb védelmi és biztonsági megoldásait, beleértve a következőket:
- Védőpajzs a felhasználói utasítások jailbreak támadásai ellen (szűrő).
- Védett anyagok észlelése szövegszűrővel a modellkimeneteknél
- Védett anyagok észlelése kódban (annotáció) modell kiegészítéseknél
Bár a meglévő erőforrások és üzemelő példányok tartalomszűrői nem változnak (az alapértelmezett vagy egyéni tartalomszűrési konfigurációk változatlanok maradnak), az új erőforrások és a GPT-környezetek automatikusan öröklik az új tartalomszűrési szabályzatot DefaultV2
. Az ügyfeleknek lehetőségük van váltani a biztonsági alapértékek között, és egyéni tartalomszűrési konfigurációkat hozhatnak létre.
További információért tekintse meg az Alapértelmezett biztonsági szabályzat dokumentációját .
Új GA API-kiadás
Az 2024-06-01
API-verzió a legújabb általánosan elérhető adatsík-inferencia API-kiadás. Lecseréli az API-verziót 2024-02-01
, és támogatja a következőket:
- beágyazások
encoding_format
>dimensions
paraméterek. - csevegés befejezések
logprobs
éstop_logprobs
paraméterek.
További információért tekintse meg az adatsík következtetési referenciadokumentációját .
A gpt-4o globális standard üzembe helyezéséhez elérhető régiók bővítése
A GPT-4o mostantól elérhető a globális standard telepítésekhez.
- AustraliaEast
- Brazília déli régiója
- Kanada keleti része
- eastus
- eastus2
- francecentral Git
- Németország Közép-Nyugat
- japaneast
- koreacentral
- northcentralus
- Norvégia keleti része
- Lengyel központ
- southafricanorth
- southcentralus
- Dél-India
- Swedencentral
- Svájc észak
- uksouth
- Nyugat-Európa
- westus
- westus3
A globális standard kvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalát.
Június 2024
A nyugdíjazási dátum frissítései
- Frissítettük a
gpt-35-turbo
0301 nyugdíjazási dátumát, hogy legkorábban 2024. október 1-je legyen. - Frissítve a
& 0613 nyugdíjazási dátumot 2024. október 1-re. - Frissítettük a
gpt-4
ésgpt-4-32k
0314 elavulási dátumát 2024. október 1-re és a visszavonási dátumát 2025. június 6-ra.
Tekintse meg a modell nyugdíjazási útmutatónkat a modell elavulásával és kivonásával kapcsolatos legfrissebb információkért.
Tokenalapú számlázás a finomhangoláshoz
- Az Azure OpenAI finomhangolási számlázása mostantól a betanítási fájlban lévő tokenek számán alapul – a teljes eltelt betanítási idő helyett. Ez jelentős költségcsökkenést eredményezhet egyes betanítási futtatások esetében, és sokkal egyszerűbbé teszi a finomhangolási költségek becslését. További információkért tekintse meg a hivatalos közleményt.
A GPT-4o új régiókban jelent meg
- A GPT-4o mostantól a következőben is elérhető:
- Svédország központi régiója a standard regionális telepítéshez.
- Kelet-Ausztrália, Kelet-Kanada, Kelet-Japán, Közép-Korea, Közép-Svédország, Észak-Svájc, USA nyugati régió 3 az előfizetéses üzembe helyezéshez.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Ügyfél által felügyelt kulcs (CMK) támogatása asszisztensekhez
A szálak és fájlok az asszisztensekben mostantól támogatják a CMK-t a következő régióban:
- USA 3. nyugati régiója
2024. május
GPT-4o előkészített telepítések
gpt-4o
Verzió: 2024-05-13
standard és telepített példányokhoz is elérhető. A kiépített és a standard modell üzembe helyezései szöveges és kép-/látásbeli következtetési kéréseket is elfogadnak.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg az előre beállított kiépítések modellmátrixát.
Asszisztensek v2 (előzetes verzió)
Az Assistants API frissítése mostantól nyilvánosan elérhető. A következő frissítéseket tartalmazza:
- Fájlkereső eszköz és vektoros tárolás
- Maximális befejezési és kérési token támogatás a tokenhasználat kezeléséhez.
-
tool_choice
paramétert, amely arra kényszeríti az Asszisztenst, hogy egy megadott eszközt használjon. Mostantól létrehozhat üzeneteket az asszisztens szerepkörrel, hogy egyéni beszélgetési előzményeket hozzon létre a szálakban. -
temperature
,top_p
,response_format
paraméterek támogatása. - Streamelési és lekérdezési támogatás. A Python SDK segédfüggvényeivel futtatásokat hozhat létre, és streamelheti a válaszokat. Lekérdezési SDK-segítőket is hozzáadtunk az objektumállapot-frissítések lekérdezés nélkül való megosztásához.
- Kísérletezzen a Logic Apps és a függvényhívás használatával az Azure OpenAI Studióval. Importálja függvényként a Logic Appsben implementált REST API-kat, és a studio automatikusan meghívja a függvényt (Logic Apps-munkafolyamatként) a felhasználói kérés alapján.
- Az AutoGen by Microsoft Research egy többügynökből álló beszélgetési keretrendszert biztosít, amely lehetővé teszi a nagy méretű nyelvi modell (LLM) munkafolyamatainak kényelmes létrehozását az alkalmazások széles körében. Az Azure OpenAI-asszisztensek mostantól integrálva vannak az AutoGenbe egy új kísérleti ügynökön keresztül
GPTAssistantAgent
, amellyel zökkenőmentesen adhat hozzá asszisztenseket az AutoGen-alapú többügynök-munkafolyamatokhoz. Ez lehetővé teszi, hogy több Olyan Azure OpenAI-asszisztens is legyen, amely feladatra vagy tartományra specializálódott az összetett feladatok együttműködésére és kezelésére. - A finomhangolt
gpt-3.5-turbo-0125
modellek támogatása a következő régiókban:- USA 2. keleti régiója
- Közép-Svédország
- Kiterjesztett regionális támogatás a következő célokra:
- Kelet-Japán
- Egyesült Királyság déli régiója
- USA nyugati régiója
- USA 3. nyugati régiója
- Kelet-Norvégia
További információt az asszisztensekről szóló blogbejegyzésben talál.
GPT-4o modell általános rendelkezésre állása (GA)
A GPT-4o ("o is for "omni") az OpenAI legújabb modellje, amely 2024. május 13-án jelent meg.
- A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban.
- A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményt nyújtva az AI-képességekhez.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
Globális standard üzembehelyezési típus (előzetes verzió)
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális ajánlatok, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat az adatközpontba az egyes kérések legjobb rendelkezésre állása mellett. A globális szabvány a legmagasabb alapértelmezett kvótát biztosítja az új modellekhez, és szükségtelenné teszi a terheléselosztást több erőforrás között.
További információt az üzembehelyezési típusok útmutatójában talál.
Frissítések finomhangolása
- A GPT-4 finomhangolása nyilvános előzetes verzióban érhető el.
- Az seed, események, teljes érvényesítési statisztikák és ellenőrzőpontok támogatását hozzáadtuk az
2024-05-01-preview
API-kiadás részeként.
DALL-E és GPT-4 Turbo Vision GA konfigurálható tartalomszűrők
Hozzon létre egyéni tartalomszűrőket a DALL-E 2 és 3, a GPT-4 Turbo Vision GA (turbo-2024-04-09
), valamint a GPT-4o telepítésekhez.
Tartalomszűrés
Aszinkron szűrő minden Azure OpenAI-ügyfél számára elérhető
A szűrők aszinkron futtatása a streamelési forgatókönyvek jobb késése érdekében mostantól minden Azure OpenAI-ügyfél számára elérhető. Tartalomszűrés
Azonnali pajzsok
Az Prompt Shields az Azure OpenAI-modellek által üzemeltetett alkalmazásokat kétféle támadástól védi: közvetlen (jailbreak) és közvetett támadásoktól. A közvetett támadások (más néven indirekt parancssori támadások vagy tartományközi parancssori injektálási támadások) a Generatív AI-modellek által üzemeltetett rendszerek elleni támadástípusok, amelyek akkor fordulhatnak elő, ha egy alkalmazás olyan információkat dolgoz fel, amelyeket nem közvetlenül az alkalmazás fejlesztője vagy a felhasználó készített. Tartalomszűrés
2024-05-01-előzetes API-kiadás
- További információkért tekintse meg az API-verzió életciklusát.
GPT-4 Turbo modell általános elérhetősége (GA)
A GPT-4 Turbo legújabb GA kiadása a következő:
-
gpt-4
Verzió:turbo-2024-04-09
Ez a következő előzetes modellek lecserélése:
-
gpt-4
Verzió:1106-Preview
-
gpt-4
Verzió:0125-Preview
-
gpt-4
Verzió:vision-preview
Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek
- Az OpenAI legújabb
0409
turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak. - Az Azure OpenAI legújabb
turbo-2024-04-09
verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú kérések (olyanok, amelyek nélkülözik aimage_url
-t és a beágyazott képeket) támogatják a JSON-módot és a függvényhívást.
Különbségek a gpt-4 vision-preview-tól
- Az Azure AI-specifikus Vision fejlesztések integrációja a Vision-nel rendelkező GPT-4 Turbo-val nem támogatott ennél a verziónál
gpt-4
:turbo-2024-04-09
. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.
Fontos
A Vision fejlesztések előzetes funkciói, beleértve az optikai karakterfelismerést (OCR), a tárgy horgonyzást és a videó utasításokat, ki lesznek vonva, és már nem lesznek elérhetők, ha a gpt-4
verzió vision-preview
frissítve lesz turbo-2024-04-09
változatra. Ha jelenleg ezen előzetes verziójú funkciók bármelyikére támaszkodik, ez az automatikus modellfrissítés kompatibilitástörő változás lesz.
GPT-4 Turbo szolgáltatott és felügyelt rendelkezésre állás
-
gpt-4
Verzió:turbo-2024-04-09
standard és speciális telepítésekhez is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.
A GPT-4 Turbo üzembe helyezése a Vision GA-val
A GA-modell üzembe helyezéséhez az Azure AI Foundry portálon válassza ki GPT-4
, majd válassza ki a turbo-2024-04-09
verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09
GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.
2024. április
A finomhangolás mostantól két új régióban támogatott az USA 2. keleti régiójában és Svájc nyugati régiójában
A finomhangolás mostantól a következő támogatással érhető el:
USA 2. keleti régiója
-
gpt-35-turbo
(0613) -
gpt-35-turbo
(1106) -
gpt-35-turbo
(0125)
Nyugat-Svájc
babbage-002
davinci-002
-
gpt-35-turbo
(0613) -
gpt-35-turbo
(1106) -
gpt-35-turbo
(0125)
Az egyes régiókban a modellek elérhetőségével és a támogatás finomhangolásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Többfordulós csevegési tréningpéldák
A finomhangolás mostantól támogatja a többfordulós csevegéses betanítási példákat.
A GPT-4 (0125) elérhető az Azure OpenAI on Your Data szolgáltatáshoz
Most már használhatja a GPT-4 (0125) modellt az elérhető régiókban az Azure OpenAI On Your Data használatával.
2024. március
Kockázatok és biztonság monitorozása az Azure OpenAI Studióban
Az Azure OpenAI Studio mostantól egy Kockázat- és biztonsági irányítópultot biztosít minden olyan üzemelő példányhoz, amely tartalomszűrő-konfigurációt használ. Ezzel ellenőrizheti a szűrési tevékenység eredményeit. Ezután módosíthatja a szűrőkonfigurációt, hogy jobban kiszolgálja az üzleti igényeket, és megfeleljen a felelős AI-alapelveknek.
Kockázatok és biztonság monitorozásának használata
Az Azure OpenAI on Your Data frissítései
- Most már csatlakozhat egy Elasticsearch vektoradatbázishoz, amelyet az Azure OpenAI On Your Data szolgáltatással használhat.
- Az adatbetöltés során az adattömb méretparaméterével beállíthatja az index adott adattömbjeinek tokenjeinek maximális számát.
Megjelent a 2024-02-01 általános rendelkezésre állási (GA) API
Ez a legújabb GA API-kiadás, és az előző 2023-05-15
GA-kiadás lecserélése. Ez a kiadás támogatja az Azure OpenAI GA legújabb funkcióit, például a Whisperet, a DALLE-3-at és a finomhangolást az adatokon.
Az előzetes verziójú funkciókhoz, például az Asszisztensekhez, a szövegfelolvasáshoz (TTS) és az "adatokon" lévő adatforrásokhoz előzetes verziójú API-verzióra van szükség. További információt az API-verzió életciklus-útmutatójában talál.
Whisper általános elérhetőség (GA)
A Whisper Speech to Text modell mostantól általános elérhetőségben van elérhető REST és Python rendszereken. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a Whisperet egy rövid útmutató követésével.
DALL-E 3 általános rendelkezésre állás (GA)
A DALL-E 3 képgenerálási modell mostantól a REST és a Python számára is elérhető. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Új regionális támogatás a DALL-E 3-hoz
Most már elérheti a DALL-E 3-at egy Azure OpenAI erőforrással a(z) East US
vagy AustraliaEast
Azure-régióban, amellett, hogy SwedenCentral
.
Modell-elavulások és megszüntetések
Hozzáadtunk egy lapot, amely nyomon követi a modellek elavulását és kivonását az Azure OpenAI-ban. Ez a lap a jelenleg elérhető, elavult és kivezetett modellekről nyújt tájékoztatást.
Megjelent a 2024-03-01-preview API
2024-03-01-preview
ugyanazokkal a funkciókkal rendelkezik, mint 2024-02-15-preview
a beágyazásokhoz, és két új paramétert ad hozzá:
-
encoding_format
lehetővé teszi, hogy meghatározza a beágyazások generálásának formátumát:float
vagybase64
. Az alapértelmezett érték afloat
. -
dimensions
lehetővé teszi a kimeneti beágyazások számának beállítását. Ezt a paramétert csak az új, harmadik generációs beágyazási modellek támogatják:text-embedding-3-large
,text-embedding-3-small
. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. Adimensions
paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, a paraméter kihasználásához javasoljuk, hogy frissítsen a legújabb verzióra:pip install openai --upgrade
.
Ha jelenleg egy előzetes verziójú API-verziót használ a legújabb funkciók kihasználásához, javasoljuk, hogy tekintse meg az API-verzió életciklusáról szóló cikket, amely nyomon követi, hogy a jelenlegi API-verzió mennyi ideig lesz támogatott.
Frissítés a GPT-4-1106-Preview frissítési csomagokra
A 2024. március 8-ra ütemezett gpt-4
1106-os előzetes verzió gpt-4
0125-ös előzetes verzióra való frissítése már nem kerül végrehajtásra.
gpt-4
Az 1106-os és 0125-ös előzetes verziók, amelyek "Automatikus frissítés alapértelmezettre" és "Frissítés lejáratkor" értékekre vannak állítva, a modell stabil verziójának kiadása után kezdenek frissülni.
A frissítési folyamatról további információt a modellek oldalán talál.
2024. február
GPT-3.5-turbo-0125 modell elérhető
Ez a modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
Harmadik generációs beágyazási modellek érhetők el
text-embedding-3-large
text-embedding-3-small
A tesztelés során az OpenAI-jelentések a nagy és a kis harmadik generációs beágyazási modellek is jobb átlagos többnyelvű lekérési teljesítményt nyújtanak a MIRACL-teljesítményteszttel, miközben az angol feladatok teljesítménye továbbra is jobb az MTEB-teljesítményteszttel, mint a második generációs text-embedding-ada-002 modell.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
GPT-3.5 Turbo kvótakonszolidáció
A GPT-3.5-Turbo modellek (beleértve a 16k-ot is) különböző verziói közötti migrálás egyszerűsítése érdekében az összes GPT-3.5-Turbo-kvótát egyetlen kvótaértékbe összesítjük.
Azoknak az ügyfeleknek, akik a kvóta növelését jóváhagyták, az előző növekedéseket tükröző összesített kvótával fognak rendelkezni.
Minden olyan ügyfél, akinek a modellverziók jelenlegi teljes kihasználtsága kisebb az alapértelmezettnél, alapértelmezés szerint új összesített teljes kvótát kap.
GPT-4-0125-preview modell elérhető
A gpt-4
modellverzió 0125-preview
már elérhető az Usa keleti régiójában, az USA északi középső régiójában és az USA déli középső régiójában található Azure OpenAI-ban. Azok az ügyfelek, akik a(z) gpt-4
1106-preview
verzióval rendelkeznek, a következő hetekben automatikusan frissítve lesznek a(z) 0125-preview
verzióra.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
Az Assistants API nyilvános előzetes verziója
Az Azure OpenAI mostantól támogatja az OpenAI GPT-jét használó API-t. Az Azure OpenAI Assistants (előzetes verzió) lehetővé teszi az igényeinek megfelelő AI-asszisztensek létrehozását egyéni utasítások és speciális eszközök, például kódértelmezők és egyéni függvények használatával. További információ:
- fogalmak
- A Python részletes útmutatója
- Kódértelmező
- Függvényhívás
- Asszisztensek modellje és régióinak rendelkezésre állása
- Asszisztensek mintái
OpenAI szöveg-beszéd hangok nyilvános előzetes verziója
Az Azure OpenAI mostantól támogatja a szövegfelolvasási API-kat az OpenAI hangjával. Az AI által létrehozott beszéd lekérése a megadott szövegből. További információért tekintse meg az áttekintési útmutatót , és próbálja ki a rövid útmutatót.
Megjegyzés:
Az Azure AI Speech támogatja az OpenAI szövegfelolvasást is. További információkért tekintse meg az OpenAI szövegfelolvasási hangokat az Azure OpenAI vagy az Azure AI Speech útmutatón keresztül.
Új finomhangolási képességek és modelltámogatás
Új regionális támogatás az Azure OpenAI on Your Data szolgáltatáshoz
Mostantól a következő Azure-régióban használhatja az Azure OpenAI On Your Data-t:
- Dél-Afrika északi régiója
Az Azure OpenAI on Your Data általános rendelkezésre állása
- Az Azure OpenAI az Ön adatain most már mindenki számára elérhető.
2023. december
Azure OpenAI az Ön adataira vonatkozóan
- Az Azure OpenAI on Your Data teljes VPN- és privát végponttámogatása, beleértve a következő biztonsági támogatásokat: tárfiókok, Azure OpenAI-erőforrások és Azure AI-Search szolgáltatás-erőforrások.
- Új cikk az Azure OpenAI On Your Data konfigurációjának virtuális hálózatokkal és privát végpontokkal történő védelméről.
A GPT-4 Turbo és a Vision már elérhető
A GPT-4 Turbo és a Vision az Azure OpenAI-ban nyilvános előzetes verzióban érhető el. A GPT-4 Turbo with Vision egy nagy multimodális modell (LMM), amelyet az OpenAI fejlesztett ki, amely képes képek elemzésére és szöveges válaszokat adni a velük kapcsolatos kérdésekre. A természetes nyelvi feldolgozást és a vizuális megértést egyaránt magában foglalja. A továbbfejlesztett móddal az Azure AI Vision funkcióival további megállapításokat hozhat létre a képekből.
- Ismerje meg a GPT-4 Turbo és a Vision képességeit kód nélküli környezetben az Azure OpenAI Playground használatával. További információ a rövid útmutatóban.
- A GPT-4 Turbo és a Vision használatával végzett látásjavítás már elérhető az Azure OpenAI-játszótéren, és támogatja az optikai karakterfelismerést, az objektumok földelését, az adatok hozzáadásának képtámogatását, valamint a videoüzenetek támogatását.
- Hívásokat kezdeményezhet közvetlenül a csevegő API-ba a REST API használatával.
- A régió rendelkezésre állása jelenleg csak
SwitzerlandNorth
,SwedenCentral
,WestUS
ésAustraliaEast
- Tudjon meg többet a GPT-4 Turbo és a Vision ismert korlátairól és más gyakori kérdésekről.
2023. november
Új adatforrás-támogatás az Azure OpenAI On Your Data szolgáltatásban
- Mostantól adatforrásként használhatja az Azure Cosmos DB for MongoDB virtuális magot és URL-címeket/webcímeket az adatok betöltéséhez és a támogatott Azure OpenAI-modellel való csevegéshez.
GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 megjelent
Mindkét modell az OpenAI legújabb kiadása, továbbfejlesztett utasításkövetéssel, JSON móddal, reprodukálható kimenettel és párhuzamos függvényhívással.
GPT-4 Turbo Preview maximális kontextusablaka 128 000 token, és 4096 kimeneti tokent képes létrehozni. 2023 áprilisáig rendelkezik a legfrissebb betanítási adatokkal. Ez a modell előzetes verzióban érhető el, és éles használatra nem ajánlott. Az előzetes verziójú modell összes központi telepítése automatikusan frissül, amint a stabil kiadás elérhetővé válik.
A GPT-3.5-Turbo-1106 maximális kontextusablaka 16 385 token, és 4096 kimeneti tokent képes létrehozni.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
A modellek saját egyedi régiónkénti kvótakiosztásokkal rendelkeznek.
DALL-E 3 nyilvános előzetes verzió
A DALL-E 3 az OpenAI legújabb képgenerálási modellje. Jobb képminőséget, összetettebb jeleneteket és jobb teljesítményt nyújt a képeken lévő szövegek renderelése során. Emellett több méretarány-beállítással is rendelkezik. A DALL-E 3 az OpenAI Studióban és a REST API-on keresztül érhető el. Az OpenAI-erőforrásnak az SwedenCentral
Azure-régióban kell lennie.
A DALL-E 3 beépített gyors újraírást tartalmaz a képek javítása, az torzítás csökkentése és a természetes változatok növelése érdekében.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Felelős mesterséges intelligencia
Bővített ügyfélkonfiguráció: Mostantól minden Azure OpenAI-ügyfél konfigurálhatja az összes súlyossági szintet (alacsony, közepes, magas) a gyűlölet, az erőszak, a szexuális és az önsértés kategóriákhoz, beleértve a csak a nagy súlyosságú tartalmak szűrését is. Tartalomszűrők konfigurálása
Tartalom hitelesítő adatai az összes DALL-E modellben: Az összes DALL-E modellből származó AI által létrehozott képek mostantól tartalmaznak egy digitális hitelesítő adatot, amely mesterséges intelligenciával létrehozott módon teszi közzé a tartalmat. A képeszközöket megjelenítő alkalmazások a nyílt forráskód Content Authenticity Initiative SDK használatával jeleníthetik meg a hitelesítő adatokat a mesterséges intelligenciával létrehozott rendszerképeikben. Tartalom hitelesítő adatai az Azure OpenAI-ban
Új RAI-modellek
- Jailbreak-kockázatészlelés: A jailbreak-támadások olyan felhasználói kérések, amelyek a Generatív AI-modellt olyan viselkedések bemutatására késztetik, amelyeket a rendszerüzenetben beállított szabályok elkerülése vagy megszegése érdekében betanított. A jailbreak kockázatészlelési modell nem kötelező (alapértelmezés szerint ki van kapcsolva), és az annotáció és szűrő modellben érhető el. Felhasználói kéréseken fut.
- Védett anyagszöveg: A védett anyagszöveg ismert szöveges tartalmakat (például dalszövegeket, cikkeket, recepteket és kijelölt webes tartalmakat) ír le, amelyeket nagy nyelvi modellek képesek kiadni. A védett anyag szövegmodellje nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzet- és szűrőmodellben érhető el. A rendszer az LLM-befejezésekre épül.
- Védett anyagkód: A védett anyagkód olyan forráskódot ír le, amely megfelel a nyilvános adattárakból származó forráskódkészletnek, amelyet nagy nyelvi modellek a forrástárak megfelelő idézete nélkül is ki tudnak adni. A védett anyagkódmodell nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzetekben és szűrőmodellben érhető el. A rendszer az LLM-befejezésekre épül.
Tiltólisták: Az ügyfelek mostantól gyorsan testre szabhatják a tartalomszűrők viselkedését a kérések és befejezések esetében, ha egyéni tiltólistát hoznak létre a szűrőikben. Az egyéni tiltólista lehetővé teszi, hogy a szűrő végrehajtsa a műveletet a minták testre szabott listáján, például adott kifejezéseken vagy regex mintákon. Az egyéni blokklistákon kívül a Microsoft profanitási blokklistát (angol) is biztosítunk. Blokklisták használata
Október 2023.
Új finomhangolási modellek (előzetes verzió)
gpt-35-turbo-0613
mostantól elérhető a finomhangoláshoz.babbage-002
ésdavinci-002
már elérhetőek a finomhangoláshoz. Ezek a modellek helyettesítik az örökölt ada, babbage, curie és davinci alapmodelleket, amelyek korábban finomhangolhatóak voltak.A rendelkezésre állás finomhangolása bizonyos régiókra korlátozódik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
A finomhangolt modellek eltérő kvótakorlátokkal rendelkeznek, mint a normál modellek.
Azure OpenAI az Ön adataira vonatkozóan
- Új egyéni paraméterek a lekért dokumentumok számának és szigorúságának meghatározásához.
- A szigorúsági beállítás a küszöbértéket úgy állítja be, hogy a dokumentumok a lekérdezések szempontjából relevánsnak minősüljenek.
- A lekért dokumentumok beállítása megadja a válaszok létrehozásához használt adatindexből származó legmagasabb pontszámú dokumentumok számát.
- Az adatok betöltésének/feltöltésének állapotát az Azure OpenAI Studióban tekintheti meg.
- Privát végpontok és VPN-ek támogatása blobtárolókhoz.
2023. szeptember
GPT-4
A GPT-4 és a GPT-4-32k mostantól minden Azure OpenAI-ügyfél számára elérhető. Az ügyfeleknek már nem kell a GPT-4 és a GPT-4-32k használatára alkalmazniuk a várakozási listát (a korlátozott hozzáférésű regisztrációs követelmények továbbra is érvényesek az összes Azure OpenAI-modellre). A rendelkezésre állás régiónként eltérő lehet. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
GPT-3.5 Turbo Instruct
Az Azure OpenAI mostantól támogatja a GPT-3.5 Turbo Instruct modellt. Ez a modell teljesítménye összehasonlítható a text-davinci-003
-val/vel, és elérhető a Completions API-val való használatra. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
A Whisper nyilvános előzetes verziója
Az Azure OpenAI mostantól támogatja az OpenAI Whisper-modellje által működtetett beszédfelismerési API-kat. Az AI által létrehozott szöveg lekérése a megadott beszédhang alapján. További információért tekintse meg a rövid útmutatót.
Megjegyzés:
Az Azure AI Speech az OpenAI Whisper modellt is támogatja a kötegelt átírási API-n keresztül. További információért tekintse meg a Kötegelt átírás útmutatót. További információ az Azure AI Speech és az Azure OpenAI használatáról: Mi a Whisper-modell?
Új régiók
- Az Azure OpenAI mostantól svédországi középső és svájci északi régiókban is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Regionális kvótakorlátok növekedése
- Az egyes modellek és régiók maximális alapértelmezett kvótakorlátjának növelése. A számítási feladatok ezekre a modellekre és régiókra történő migrálása lehetővé teszi, hogy kihasználja a percenkénti több token (TPM) nyújtotta előnyöket.
2023. augusztus
Az Azure OpenAI előzetes verziójának frissítései saját adatokkal
- Most már üzembe helyezheti az Azure OpenAI-t az adatain a Power Virtual Agentsben.
- Az Azure OpenAI On Your Data mostantól támogatja a privát végpontokat.
- A bizalmas dokumentumokhoz való hozzáférés szűrésének képessége.
- Az index automatikus frissítése ütemezés szerint.
- Vektorkeresési és szemantikai keresési lehetőségek.
- Csevegési előzmények megtekintése az üzembe helyezett webalkalmazásban
2023. július
A függvényhívások támogatása
- Az Azure OpenAI mostantól támogatja a függvényhívást , hogy a csevegővégzítési API-ban együttműködhessen a függvényekkel.
Beágyazott bemeneti tömb növelése
- Az Azure OpenAI mostantól támogatja az API-kérésenként legfeljebb 16 bemenettel rendelkező tömböket a text-embedding-ada-002 2-es verzióval.
Új régiók
- Az Azure OpenAI mostantól kanada keleti, USA 2. keleti régiójában, Kelet-Japánban és az USA északi középső régiójában is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
2023. június
Az Azure OpenAI használata saját adatokon (előzetes verzió)
- Az Azure OpenAI On Your Data előzetes verzióban érhető el, így olyan OpenAI-modellekkel cseveghet, mint a GPT-35-Turbo és a GPT-4, és az adatok alapján fogadhat válaszokat.
A gpt-35-turbo és a gpt-4 modellek új verziói
- gpt-35-turbo (0613-es verzió)
- gpt-35-turbo-16k (0613-es verzió)
- gpt-4 (0613-es verzió)
- gpt-4-32k (0613-es verzió)
Egyesült Királyság déli régiója
- Az Azure OpenAI már elérhető az Egyesült Királyság déli régiójában. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Tartalomszűrés és széljegyzetek (előzetes verzió)
- Tartalomszűrők konfigurálása az Azure OpenAI-val.
- Engedélyezze a széljegyzeteket a tartalomszűrés kategóriájának és súlyossági adatainak megtekintéséhez a GPT-alapú befejezési és csevegés-befejezési hívások részeként.
Kvóta
- A kvóta lehetővé teszi, hogy aktívan kezelje a sebességkorlátok kiosztását az előfizetésen belüli telepítések között.
2023. május
Java > JavaScript SDK-támogatás
Az Azure OpenAI-csevegés befejezésének általános rendelkezésre állása (GA)
- Általános rendelkezésre állási támogatás:
- Csevegés befejezése API-verzió
2023-05-15
. - GPT-35-Turbo modellek.
- GPT-4 modellsorozat.
- Csevegés befejezése API-verzió
Ha jelenleg az API-t 2023-03-15-preview
használja, javasoljuk, hogy migráljon a GA 2023-05-15
API-ba. Ha jelenleg az 2022-12-01
API-verziót használja, ez az API továbbra is GA marad, de nem tartalmazza a legújabb csevegés befejezésére szolgáló képességeket.
Fontos
A GPT-35-Turbo modellek jelenlegi verzióinak használata a befejezési végponttal továbbra is előzetes státuszban van.
Közép-Franciaország
- Az Azure OpenAI már elérhető a franciaországi középső régióban. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
2023. április
DALL-E 2 nyilvános előzetes verzió. Az Azure OpenAI mostantól támogatja az OpenAI DALL-E 2 modellje által működtetett képgenerálási API-kat. Mesterséges intelligenciával létrehozott képek lekérése a megadott leíró szöveg alapján. További információért tekintse meg a rövid útmutatót.
A testreszabott modellek inaktív üzembe helyezései 15 nap után törlődnek; modellek továbbra is elérhetők maradnak az újbóli üzembe helyezéshez. Ha egy testre szabott (finomhangolt) modell több mint tizenöt (15) napig van üzembe helyezve, amely alatt nem történik befejezési vagy csevegés-befejezési hívás, az üzembe helyezés automatikusan törlődik (és az üzembe helyezésért nem jár további üzemeltetési díj). A mögöttes testreszabott modell továbbra is elérhető marad, és bármikor újra üzembe helyezheti. További információért tekintse meg az útmutatót.
2023 márciusa
A GPT-4 sorozatú modellek mostantól előzetes verzióban érhetők el az Azure OpenAI-ban. A hozzáférés kéréséhez a meglévő Azure OpenAI-ügyfelek az űrlap kitöltésével jelentkezhetnek. Ezek a modellek jelenleg az USA keleti régiójában és az USA déli középső régiójában érhetők el.
A GPT-35-Turbo és GPT-4 modellekhez készült új csevegés-befejezési API 3/21-es előzetes verzióban jelenik meg. További információért tekintse meg a frissített rövid útmutatókat és útmutatókat.
GPT-35-Turbo előzetes. További információért tekintse meg az útmutatót.
Megnövelt betanítási korlátok a finomhangoláshoz: A betanítási feladat maximális mérete (a betanítási fájlban lévő tokenek) x (az alapidőszakok száma) 2 milliárd token az összes modellhez. A maximális betanítási feladatot 120 óráról 720 órára növeltük.
További használati esetek hozzáadása a meglévő hozzáféréshez. Korábban az új használati esetek hozzáadásának folyamata miatt az ügyfeleknek újra kellett alkalmazniuk a szolgáltatást. Most egy új folyamatot adunk ki, amely lehetővé teszi új használati esetek gyors hozzáadását a szolgáltatás használatához. Ez a folyamat az Azure OpenAI-ban létrehozott korlátozott hozzáférésű folyamatot követi. A meglévő ügyfelek itt bármilyen új használati esetet tanúsíthatnak. Vegye figyelembe, hogy erre akkor van szükség, ha olyan új használati esethez szeretné használni a szolgáltatást, amelyre eredetileg nem jelentkezett.
Február 2023
Új funkciók
- .NET SDK (inferencia) előzetes kiadás | Minták
- Terraform SDK-frissítés az Azure OpenAI felügyeleti műveleteinek támogatásához.
- A kimenet végén lévő szöveg beillesztése mostantól támogatott a
suffix
paraméter használatával.
Frissítések
- A tartalomszűrés alapértelmezés szerint be van kapcsolva.
Új cikkek:
Új tanfolyam:
2023. január
Új funkciók
Service GA. Az Azure OpenAI mostantól általánosan elérhető.
Új modellek: A legújabb szöveges modell hozzáadása, text-davinci-003 (USA keleti régiója, Nyugat-Európa), text-ada-embeddings-002 (USA keleti régiója, USA déli középső régiója, Nyugat-Európa)
2022. december
Új funkciók
Az OpenAI legújabb modelljei. Az Azure OpenAI hozzáférést biztosít az összes legújabb modellhez, beleértve a GPT-3.5 sorozatot is.
Új API-verzió (2022-12-01). Ez a frissítés számos kért fejlesztést tartalmaz, többek között a jogkivonat-használati információkat az API-válaszban, a fájlokra vonatkozó továbbfejlesztett hibaüzeneteket, az OpenAI-val való igazítást a létrehozási adatstruktúra finomhangolásához, valamint az utótagparaméter támogatását a finomhangolt feladatok egyéni elnevezésének engedélyezéséhez.
Nagyobb kérelemkorlátok másodpercenként. 50 nem Davinci-modellek esetén. 20-es verzió a Davinci-modellekhez.
Gyorsabb üzembe helyezés a finomra hangolt rendszerekkel. Ada és Curie finomhangolt modellek üzembe helyezése 10 perc alatt.
Magasabb betanítási korlátok: 40 millió betanítási token az Ada, Babbage és Curie számára. 10 millió Davincinek.
A visszaélések és a helytelen használatú adatnaplózás módosításának kérése és az emberi felülvizsgálat folyamata. Ma a szolgáltatás naplózza a kérések/válaszok adatait a visszaélés és a visszaélés észlelése céljából, hogy ezek a hatékony modellek ne legyenek visszaélve. Azonban sok ügyfél szigorú adatvédelmi és biztonsági követelményekkel rendelkezik, amelyek nagyobb ellenőrzést igényelnek az adataik felett. Ezeknek a használati eseteknek a támogatásához egy új folyamatot bocsátunk ki az ügyfelek számára a tartalomszűrési szabályzatok módosítására vagy az alacsony kockázatú használati esetek visszaélésnaplózásának kikapcsolására. Ez a folyamat az Azure OpenAI-ban létrehozott korlátozott hozzáférésű folyamatot követi, és a meglévő OpenAI-ügyfelek is alkalmazhatnak itt.
Ügyfél által felügyelt kulcs (CMK) titkosítása. A CMK a betanítási adatok és a testreszabott modellek tárolásához használt saját titkosítási kulcsok biztosításával nagyobb irányítást biztosít az ügyfelek számára az adatok Azure OpenAI-ban való kezelése felett. Az ügyfél által kezelt kulcsok (CMK) használata, amely Bring Your Own Key (BYOK, saját kulcs használata) módszerként is ismert, nagyobb rugalmasságot biztosít a hozzáférés-vezérlők létrehozása, rotálása, letiltása és visszavonása terén. Továbbá az adatok védelméhez használt titkosítási kulcsok naplózására is lehetősége van. További információ a inaktív állapotú titkosítási dokumentációnkból.
Lockbox támogatás
SOC-2 megfelelőség
Naplózás és diagnosztika az Azure Resource Health, a Költségelemzés és a Mutatók & Diagnosztikai beállítások használatával.A Studio fejlesztései. A Studio-munkafolyamat számos használhatósági fejlesztése, köztük az Azure AD-szerepkör támogatása annak szabályozásához, hogy a csapatban kik férhetnek hozzá a finomhangolt modellek létrehozásához és üzembe helyezéséhez.
Módosítások (kompatibilitást megszakító)
A create API-kérés finomhangolása az OpenAI sémájának megfelelően lett frissítve.
Előzetes verziójú API-verziók:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
API 2022-12-01-es verzió:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
A tartalomszűrés alapértelmezés szerint átmenetileg ki van kapcsolva . Az Azure tartalom moderálás másképp működik, mint az Azure OpenAI. Az Azure OpenAI tartalomszűrőket futtat a generációs hívás során, hogy észlelje a káros vagy sértő tartalmakat, és szűrje őket a válaszból. Tudj meg többet
Ezek a modellek 2023 első negyedévében újra engedélyezve lesznek, és alapértelmezés szerint be vannak kapcsolva.
Ügyfélműveletek
- Ha szeretné, hogy ezek be vannak kapcsolva az előfizetéshez, lépjen kapcsolatba az Azure ügyfélszolgálatával .
- Ha szeretné, hogy a módosítások továbbra is ki legyenek kapcsolva, alkalmazza a szűrési módosításokat. (Ez a beállítás csak alacsony kockázatú használati esetekre vonatkozik.)
Következő lépések
További információ az Azure OpenAI-t használó mögöttes modellekről.