Az Azure OpenAI szolgáltatás újdonságai
Ez a cikk összefoglalja az Azure OpenAI legújabb kiadásait és főbb dokumentációs frissítéseit.
A legújabb o1
modell már elérhető AZ API-hozzáféréshez és a modell üzembe helyezéséhez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva. Azok az ügyfelek, akik korábban alkalmazták és hozzáféréssel o1-preview
rendelkeztek, nem kell újból alkalmazniuk őket, mivel automatikusan szerepelnek a legújabb modell várakozási listájában.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Ha többet szeretne megtudni a speciális o1
sorozatmodellekről, tekintse meg az o1 sorozatok érvelési modelljeinek első lépéseit.
Modell | Régió |
---|---|
o1 (Verzió: 2024-12-17) |
USA2 keleti régiója (globális szabvány) Svédország középső régiója (Global Standard) |
A közvetlen preferenciák optimalizálása (DPO) egy új igazítási technika a nagy nyelvi modellekhez, amelyek úgy lettek kialakítva, hogy a modell súlyát az emberi beállítások alapján igazítsák. Az emberi visszajelzésekből (RLHF) származó megerősítési tanulástól eltérően a DPO nem igényel jutalommodellt, és egyszerűbb adatokat (bináris beállításokat) használ a betanításhoz. Ez a módszer számítási szempontból könnyebb és gyorsabb, így ugyanolyan hatékony az igazítás során, miközben hatékonyabb. A DPO különösen olyan helyzetekben hasznos, ahol a szubjektív elemek, például a hang, a stílus vagy a konkrét tartalombeállítások fontosak. Örömmel jelentjük be a DPO nyilvános előzetes verzióját az Azure OpenAI Service-ben, kezdve a gpt-4o-2024-08-06
modellel.
A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.
A tárolt befejezésekkel rögzítheti a csevegés befejező munkameneteinek beszélgetési előzményeit, és adatkészletként használhatja az értékeléshez és a finomhangoláshoz.
gpt-4o-2024-11-20
már elérhető a globális standard üzembe helyezéshez a következő helyen:
- USA keleti régiója
- USA 2. keleti régiója
- USA északi középső régiója
- USA déli középső régiója
- USA nyugati régiója
- USA 3. nyugati régiója
- Közép-Svédország
Az adatzóna által kiépített üzembe helyezések ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-telepítési típus, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat a Microsoft által meghatározott adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna kiépített üzembe helyezései fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez a Microsoft által megadott adatzónákon belüli Azure-infrastruktúra használatával. Az adatzóna kiépített üzemelő példányai támogatottak a , gpt-4o-2024-05-13
és gpt-4o-mini-2024-07-18
modellekengpt-4o-2024-08-06
.
További információt az üzembehelyezési típusok útmutatójában talál.
Vision finomhangolás GPT-4o (2024-08-06) most általánosan elérhető (GA).
A látás finomhangolásával képeket adhat a JSONL betanítási adataihoz. Ugyanúgy, ahogy egy vagy több képbemenetet küldhet a csevegés befejezéséhez, ugyanezeket az üzenettípusokat is belefoglalhatja a betanítási adatokba. A rendszerképek URL-címként vagy base64 kódolású rendszerképként is megadhatóak.
A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.
A visszaélések monitorozásának új formáit vezetjük be, amelyek llM-eket használnak az Azure OpenAI szolgáltatás potenciálisan visszaélésszerű használatának észlelésének hatékonyságának javítására, valamint a visszaélések monitorozásának engedélyezésére anélkül, hogy emberi felülvizsgálatra van szükség az utasításokat és kiegészítéseket. További információ: Visszaélések monitorozása.
A tartalombesorolással megjelölt és/vagy vélhetően visszaélésszerű használati minta részeként megjelölt kéréseket és kiegészítéseket egy további felülvizsgálati folyamatnak vetik alá, amely segít megerősíteni a rendszer elemzését, és tájékoztatni a műveleti döntéseket. A visszaélések monitorozási rendszereit kiterjesztettük, hogy az LLM alapértelmezés szerint, szükség esetén pedig az emberek számára is lehetővé tegye a felülvizsgálatot.
Az adatzóna standard üzemelő példányai ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-üzembe helyezési típus, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat a Microsoft által definiált adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna-szabvány magasabb alapértelmezett kvótákat biztosít, mint az Azure földrajzi alapú üzembe helyezési típusai. Az adatzóna standard üzemelő példányai támogatottak a modelleken gpt-4o-2024-05-13
és gpt-4o-mini-2024-07-18
a modellekengpt-4o-2024-08-06
.
További információt az üzembehelyezési típusok útmutatójában talál.
Az Azure OpenAI globális köteg általánosan elérhető.
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
A o1-preview
modellek mostantól o1-mini
elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Azok az ügyfelek, akik már jóváhagyták a modellt, és hozzáféréssel rendelkeznek a modellhez a korai hozzáférésű játszótéren keresztül, nem kell újra alkalmazniuk, automatikusan API-hozzáférést kapnak. A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.
API-támogatás:
Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-preview
lett hozzáadva.
A max_tokens
paraméter elavult, és az új max_completion_tokens
paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens
paraméterrel működnek.
Régió rendelkezésre állása:
A modellek az USA 2. keleti régiójában és a Svédország középső régiójában a standard és globális standard üzembe helyezéshez érhetők el a jóváhagyott ügyfelek számára.
Az Azure OpenAI GPT-4o audio a GPT-4o modellcsalád része, amely támogatja az alacsony késleltetésű, "beszéd, beszéd kihangosító" beszélgetési interakciókat. A GPT-4o audio realtime
API valós idejű, kis késésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas a felhasználó és a modell közötti élő interakciókat, például az ügyfélszolgálati ügynököket, a hangsegédeket és a valós idejű fordítókat érintő használati esetekhez.
A gpt-4o-realtime-preview
modell az USA 2. keleti régiójában és Svédország középső régióiban üzemelő globális üzemelő példányokhoz érhető el.
További információ: GPT-4o valós idejű hangdokumentáció.
A globális köteg mostantól támogatja a GPT-4o-t (2024-08-06). További információt a globális köteg első lépéseinek útmutatójában talál.
Szeptember 19-én, amikor hozzáfér az Azure OpenAI Studióhoz , alapértelmezés szerint nem fogja látni az örökölt AI Foundry portált. Ha szükséges, a felhasználói felület felső sávjában a Következő néhány hétre a Switch to the old look váltógombbal visszatérhet az előző élményhez. Ha visszaáll az örökölt AI Foundry portálra, az segít, ha kitölti a visszajelzési űrlapot, hogy tudassa velünk, miért. Aktívan figyeljük ezt a visszajelzést az új élmény javítása érdekében.
A GPT-4o 2024-08-06 már elérhető az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban üzembe helyezéshez. Globális üzembe helyezésekhez is elérhető.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális üzembe helyezési típusok, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat az adatközpontba, és minden kéréshez a legjobb rendelkezésre állást biztosíthassa. A globális kiépített üzemelő példányok fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez az Azure globális infrastruktúrájának használatával. A globálisan kiépített üzembe helyezéseket és modelleket gpt-4o-2024-08-06
gpt-4o-mini-2024-07-18
támogatjuk.
További információt az üzembehelyezési típusok útmutatójában talál.
Az Azure OpenAI o1-preview
és o1-mini
a modellek célja az érvelési és problémamegoldási feladatok kezelése nagyobb összpontosítással és képességgel. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.
- Összetett kódgenerálás: Képes algoritmusok létrehozására és speciális kódolási feladatok kezelésére a fejlesztők támogatásához.
- Speciális problémamegoldás: Ideális átfogó ötletgyűjtési munkamenetekhez és a sokrétű kihívások kezeléséhez.
- Összetett dokumentum-összehasonlítás: Tökéletes a szerződések, esetfájlok vagy jogi dokumentumok elemzéséhez a finom különbségek azonosításához.
- Utasításkövetés és munkafolyamat-kezelés: Különösen hatékony a rövidebb környezeteket igénylő munkafolyamatok kezelésére.
o1-preview
:o1-preview
a sorozatmodelleko1
jobban alkalmasak.o1-mini
:o1-mini
a sorozatmodelleko1
gyorsabb és olcsóbb.
Modellverzió: 2024-09-12
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A o1
sorozatmodellek jelenleg előzetes verzióban érhetők el, és nem tartalmaznak más modellekben elérhető funkciókat, például a képfelismerést és a strukturált kimeneteket, amelyek a legújabb GPT-4o modellben érhetők el. Sok feladat esetén az általánosan elérhető GPT-4o modellek még mindig megfelelőbbek lehetnek.
Az OpenAI további biztonsági intézkedéseket is beépített a o1
modellekbe, beleértve az új technikákat, amelyekkel a modellek elutasíthatják a nem biztonságos kéréseket. Ezek a fejlesztések teszik elérhetővé a o1
sorozatot a leg robusztusabb modellek közül.
o1-mini
Az o1-preview
USA 2. keleti régiójában az AI Foundry portál korai hozzáférésű játszóterén keresztül korlátozott hozzáférés érhető el. A modellek adatfeldolgozása o1
más régióban fordulhat elő, mint ahol azok használhatók.
A korai hozzáférésű játszótéren való kipróbálásához o1-preview
o1-mini
regisztrálni kell a modelleket, és a hozzáférést a Microsoft jogosultsági feltételei alapján biztosítjuk.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A hozzáférés megadása után a következőkre lesz szüksége:
- Keresse meg https://ai.azure.com/resources és válassza ki az erőforrást a
eastus2
régióban. Ha ebben a régióban nincs Azure OpenAI-erőforrása, létre kell hoznia egyet. - Miután kiválasztotta az
eastus2
Azure OpenAI-erőforrást, a bal felső panelen válassza a Korai hozzáférésű játszótér (előzetes verzió) lehetőséget.
- Az usa minden régiójában és Svédország középső régiójában elérhető standard és globális üzemelő példányokhoz.
- Ez a modell támogatja a strukturált kimeneteket.
A GPT-4o mini már elérhető a kiépített üzembe helyezésekhez Kanada keleti régiójában, az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A GPT-4o finomhangolása mostantól nyilvános előzetes verzióban elérhető az Azure OpenAI-hoz az USA északi középső régiójában és a Svédország középső régiójában.
További információkért tekintse meg blogbejegyzésünket.
Az API-verzió 2024-07-01-preview
a dataplane legújabb szerzői és következtetési API-kiadása. Lecseréli az API-verziót 2024-05-01-preview
, és támogatja a következőket:
- Batch API-támogatás hozzáadva
- Vektortároló adattömb-stratégiai paraméterei
max_num_results
a fájlkereső eszköz kimenetének kell lennie.
További információkért tekintse meg referenciadokumentációnkat
- A GPT-4o mini az USA keleti és svédországi középső régióiban standard és globális standard üzembe helyezéshez érhető el.
- A GPT-4o mini az USA keleti régiójában, Svédország középső régiójában és az USA nyugati régiójában elérhető a globális kötegelt üzembe helyezéshez.
- Új blogbejegyzés a modellértékelések első lépéseiről. Javasoljuk, hogy ezt az útmutatót használja a modellfrissítési és -kivonási folyamat részeként.
2024. augusztus 6-án az OpenAI bejelentette a gpt-4o-modell legújabb verzióját 2024-08-06
. A GPT-4o 2024-08-06
az előző verzió összes képességével rendelkezik, valamint:
- Az összetett strukturált kimenetek támogatásának továbbfejlesztett képessége.
- A maximális kimeneti jogkivonatok száma 4096-ról 16 384-re nőtt.
Az Azure-ügyfelek ma tesztelhetik a GPT-4o-t 2024-08-06
az új AI Foundry korai hozzáférésű játszótéren (előzetes verzió).
Az előző korai hozzáférésű játszótértől eltérően az AI Foundry portál korai hozzáférésű játszótere (előzetes verzió) nem igényel erőforrást egy adott régióban.
Megjegyzés
A korai hozzáférésű játszótéren (előzetes verzió) végrehajtott kérések és kiegészítések bármely Azure OpenAI-régióban feldolgozhatók, és jelenleg percenként 10 kérésre vonatkoznak Azure-előfizetési korlátonként. Ez a korlát a jövőben változhat.
Az Azure OpenAI szolgáltatással való visszaélés monitorozása minden korai hozzáférésű játszótér-felhasználó számára engedélyezve van, még akkor is, ha jóváhagyást ad a módosításra; az alapértelmezett tartalomszűrők engedélyezve vannak, és nem módosíthatók.
A GPT-4o 2024-08-06
teszteléséhez jelentkezzen be az Azure AI korai hozzáférésű játszóterére (előzetes verzió) ezen a hivatkozáson keresztül.
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
A GPT-4o mini finomhangolás mostantól nyilvános előzetes verzióban érhető el Svédország középső régiójában és az USA északi középső régiójában.
Az Asszisztensek fájlkereső eszközének használatáért most további díjakat kell fizetnie. További információkért tekintse meg a díjszabási oldalt .
A GPT-4o mini a legújabb Azure OpenAI-modell, amelyet először 2024. július 18-án jelentettek be:
"A GPT-4o mini lehetővé teszi az ügyfelek számára, hogy lenyűgöző alkalmazásokat nyújtsanak alacsonyabb áron, villámgyorsan. A GPT-4o mini jelentősen intelligensebb, mint a GPT-3.5 Turbo – 82%-os pontszámot ért el a Massive Multitask Language Understanding (MMLU) mérése terén a 70%-hoz képest, és több mint 60%-kal olcsóbb.1 A modell kibővített 128K környezeti ablakot biztosít, és integrálja a GPT-4o továbbfejlesztett többnyelvű képességeit, így jobb minőséget biztosít a nyelveknek a világ minden tájáról."
A modell jelenleg az USA keleti régiójában standard és globális standard üzembe helyezéshez is elérhető.
A modellkvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalt , és a modell elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Az új alapértelmezett tartalomszűrési szabályzat DefaultV2
biztosítja a GPT-modellsorozat (szöveg) legújabb biztonsági és biztonsági megoldásait, beleértve a következőket:
- Prompt Shields for jailbreak attacks on user prompts (filter),
- Védett anyagészlelés szöveghez (szűrőhöz) a modell befejezésekor
- Védett anyagészlelés a kódhoz (megjegyzés) a modell befejezésekor
Bár a meglévő erőforrások és üzemelő példányok tartalomszűrői nem változnak (az alapértelmezett vagy egyéni tartalomszűrési konfigurációk változatlanok maradnak), az új erőforrások és a GPT-környezetek automatikusan öröklik az új tartalomszűrési szabályzatot DefaultV2
. Az ügyfeleknek lehetőségük van váltani a biztonsági alapértékek között, és egyéni tartalomszűrési konfigurációkat hozhatnak létre.
További információért tekintse meg az Alapértelmezett biztonsági szabályzat dokumentációját .
Az API-verzió 2024-06-01
a ga adatsík legújabb következtetési API-kiadása. Lecseréli az API-verziót 2024-02-01
, és támogatja a következőket:
- beágyazások
encoding_format
>dimensions
paraméterek. - csevegés befejezése >
logprobs
top_logprobs
paraméterek.
További információért tekintse meg az adatsík következtetési referenciadokumentációját .
A GPT-4o mostantól a következő globális standard üzemelő példányokhoz érhető el:
- ausztráliaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral git
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- lengyelországcentral
- southafricanorth
- USA déli középső régiója
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
A globális standard kvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalát.
- A 0301-et legkésőbb 2024. október 1-jére frissítették
gpt-35-turbo
. - &
gpt-35-turbo-16k
0613-ra frissítvegpt-35-turbo
2024. október 1-ére. - A >
gpt-4-32k
0314 elavulási dátum 2024. október 1-ről 2025. június 6-ra frissültgpt-4
.
- Az Azure OpenAI finomhangolási számlázása mostantól a betanítási fájlban lévő tokenek számán alapul – a teljes eltelt betanítási idő helyett. Ez jelentős költségcsökkenést eredményezhet egyes betanítási futtatások esetében, és sokkal egyszerűbbé teszi a finomhangolási költségek becslését. További információkért tekintse meg a hivatalos közleményt.
- A GPT-4o mostantól a következőben is elérhető:
- Svédország középső régiója a standard regionális üzembe helyezéshez.
- Kelet-Ausztrália, Kelet-Kanada, Kelet-Japán, Közép-Korea, Közép-Korea, Közép-Svédország, Észak-Svájc, usa 3. nyugati régiója a kiépített üzembe helyezéshez.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A Szálak és fájlok az asszisztensekben mostantól támogatja a CMK-t a következő régióban:
- USA 3. nyugati régiója
gpt-4o
Verzió: 2024-05-13
standard és kiépített üzemelő példányokhoz is elérhető. A kiépített és a standard modell üzembe helyezései szöveges és kép-/látásbeli következtetési kéréseket is elfogadnak.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a kiépített üzemelő példányok modellmátrixát.
Az Assistants API frissítése mostantól nyilvánosan elérhető. A következő frissítéseket tartalmazza:
- Fájlkereső eszköz és vektoros tárolás
- A jogkivonatok használatának kezeléséhez szükséges maximális befejezési és kérési jogkivonat-támogatás .
tool_choice
paramétert, amely arra kényszeríti az Asszisztenst, hogy egy megadott eszközt használjon. Mostantól létrehozhat üzeneteket a segédszerepkörrel , hogy egyéni beszélgetési előzményeket hozzon létre a szálakban.temperature
A ,top_p
response_format
paraméterek támogatása.- Streamelési és lekérdezési támogatás. A Python SDK segédfüggvényeivel futtatásokat hozhat létre, és streamelheti a válaszokat. Lekérdezési SDK-segítőket is hozzáadtunk az objektumállapot-frissítések lekérdezés nélkül való megosztásához.
- Kísérletezzen a Logic Apps és a függvényhívás használatával az Azure OpenAI Studióval. Importálja függvényként a Logic Appsben implementált REST API-kat, és a studio automatikusan meghívja a függvényt (Logic Apps-munkafolyamatként) a felhasználói kérés alapján.
- Az AutoGen by Microsoft Research egy többügynökből álló beszélgetési keretrendszert biztosít, amely lehetővé teszi a nagy méretű nyelvi modell (LLM) munkafolyamatainak kényelmes létrehozását az alkalmazások széles körében. Az Azure OpenAI-asszisztensek mostantól integrálva vannak az AutoGenbe egy új kísérleti ügynökön keresztül
GPTAssistantAgent
, amellyel zökkenőmentesen adhat hozzá asszisztenseket az AutoGen-alapú többügynök-munkafolyamatokhoz. Ez lehetővé teszi, hogy több Olyan Azure OpenAI-asszisztens is legyen, amely feladatra vagy tartományra specializálódott az összetett feladatok együttműködésére és kezelésére. - A finomhangolt
gpt-3.5-turbo-0125
modellek támogatása a következő régiókban:- USA 2. keleti régiója
- Közép-Svédország
- Kiterjesztett regionális támogatás a következő célokra:
- Kelet-Japán
- Az Egyesült Királyság déli régiója
- USA nyugati régiója
- USA 3. nyugati régiója
- Kelet-Norvégia
További információt az asszisztensekről szóló blogbejegyzésben talál.
A GPT-4o ("o is for "omni") az OpenAI legújabb modellje, amely 2024. május 13-án jelent meg.
- A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban.
- A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményt nyújtva az AI-képességekhez.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális ajánlatok, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat az adatközpontba az egyes kérések legjobb rendelkezésre állása mellett. A globális szabvány a legmagasabb alapértelmezett kvótát biztosítja az új modellekhez, és szükségtelenné teszi a terheléselosztást több erőforrás között.
További információt az üzembehelyezési típusok útmutatójában talál.
- A GPT-4 finomhangolása nyilvános előzetes verzióban érhető el.
- Az API-kiadás részeként
2024-05-01-preview
támogatást nyújtott a magokhoz, eseményekhez, teljes érvényesítési statisztikákhoz és ellenőrzőpontokhoz.
Hozzon létre egyéni tartalomszűrőket a DALL-E 2 és 3, a GPT-4 Turbo és a Vision GA (turbo-2024-04-09
) és a GPT-4o üzemelő példányokhoz. Tartalomszűrés
A szűrők aszinkron futtatása a streamelési forgatókönyvek jobb késése érdekében mostantól minden Azure OpenAI-ügyfél számára elérhető. Tartalomszűrés
Az Prompt Shields az Azure OpenAI-modellek által üzemeltetett alkalmazásokat kétféle támadástól védi: közvetlen (jailbreak) és közvetett támadásoktól. A közvetett támadások (más néven indirekt parancssori támadások vagy tartományközi parancssori injektálási támadások) a Generatív AI-modellek által üzemeltetett rendszerek elleni támadástípusok, amelyek akkor fordulhatnak elő, ha egy alkalmazás olyan információkat dolgoz fel, amelyeket nem közvetlenül az alkalmazás fejlesztője vagy a felhasználó készített. Tartalomszűrés
- További információkért tekintse meg az API-verzió életciklusát.
A GPT-4 Turbo legújabb GA kiadása a következő:
gpt-4
Verzió:turbo-2024-04-09
Ez a következő előzetes modellek lecserélése:
gpt-4
Verzió:1106-Preview
gpt-4
Verzió:0125-Preview
gpt-4
Verzió:vision-preview
- Az OpenAI legújabb
0409
turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak. - Az Azure OpenAI legújabb
turbo-2024-04-09
verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküliimage_url
és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.
- Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz
gpt-4
:turbo-2024-04-09
. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.
Fontos
Vision fejlesztések előzetes funkciók, beleértve az optikai karakterfelismerés (OCR), objektum földelés, video parancssorok lesznek kivonva, és már nem érhető el, ha gpt-4
verzió: vision-preview
frissítve turbo-2024-04-09
van. Ha jelenleg ezen előzetes verziójú funkciók bármelyikére támaszkodik, ez az automatikus modellfrissítés kompatibilitástörő változás lesz.
gpt-4
Verzió:turbo-2024-04-09
standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.
Ha az AI Foundry portálon szeretné üzembe helyezni a GA-modellt, válassza ki GPT-4
és válassza ki a turbo-2024-04-09
verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09
GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.
A finomhangolás mostantól két új régióban támogatott az USA 2. keleti régiójában és Svájc nyugati régiójában
A finomhangolás mostantól a következő támogatással érhető el:
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
babbage-002
davinci-002
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
Az egyes régiókban a modellek elérhetőségével és a támogatás finomhangolásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A finomhangolás mostantól támogatja a többfordulós csevegéses betanítási példákat.
Most már használhatja a GPT-4 (0125) modellt az elérhető régiókban az Azure OpenAI On Your Data használatával.
Az Azure OpenAI Studio mostantól egy Kockázat és biztonság irányítópultot biztosít minden olyan üzemelő példányhoz, amely tartalomszűrő-konfigurációt használ. Ezzel ellenőrizheti a szűrési tevékenység eredményeit. Ezután módosíthatja a szűrőkonfigurációt, hogy jobban kiszolgálja az üzleti igényeket, és megfeleljen a felelős AI-alapelveknek.
Kockázatok és biztonság monitorozásának használata
- Most már csatlakozhat egy Elasticsearch vektoradatbázishoz, amelyet az Azure OpenAI On Your Data szolgáltatással használhat.
- Az adatbetöltés során az adattömb méretparaméterével beállíthatja az index adott adattömbjeinek tokenjeinek maximális számát.
Ez a legújabb GA API-kiadás, és az előző 2023-05-15
GA-kiadás lecserélése. Ez a kiadás támogatja az Azure OpenAI GA legújabb funkcióit, például a Whisperet, a DALLE-3-at és a finomhangolást az adatokon.
Az előzetes verziójú funkciókhoz, például az Asszisztensekhez, a szövegfelolvasáshoz (TTS) és az "adatokon" lévő adatforrásokhoz előzetes verziójú API-verzióra van szükség. További információt az API-verzió életciklus-útmutatójában talál.
A Whisper speech to text modell mostantól a REST és a Python esetében is ga. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a Whisperet egy rövid útmutató követésével.
A DALL-E 3 képgenerálási modell mostantól a REST és a Python számára is elérhető. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Most már elérheti a DALL-E 3-at egy Azure OpenAI-erőforrással a vagy AustraliaEast
az East US
Azure-régióban, amellett, hogy SwedenCentral
.
Hozzáadtunk egy lapot, amely nyomon követi a modellek elavulását és kivonását az Azure OpenAI szolgáltatásban. Ez a lap a jelenleg elérhető, elavult és kivezetett modellekről nyújt tájékoztatást.
2024-03-01-preview
ugyanazokkal a funkciókkal rendelkezik, mint 2024-02-15-preview
a beágyazásokhoz, és két új paramétert ad hozzá:
encoding_format
lehetővé teszi a beágyazások létrehozására vonatkozó formátum megadását a (vagybase64
) fájlbanfloat
. Az alapértelmezett értékfloat
.dimensions
lehetővé teszi a kimeneti beágyazások számának beállítását. Ezt a paramétert csak az új, harmadik generációs beágyazási modellek támogatják:text-embedding-3-large
,text-embedding-3-small
. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. Adimensions
paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, a paraméter kihasználásához javasoljuk, hogy frissítsen a legújabb verzióra:pip install openai --upgrade
.
Ha jelenleg egy előzetes verziójú API-verziót használ a legújabb funkciók kihasználásához, javasoljuk, hogy tekintse meg az API-verzió életciklusáról szóló cikket, amely nyomon követi, hogy a jelenlegi API-verzió mennyi ideig lesz támogatott.
A 2024. március 8-ra ütemezett 1106 előzetes verzió gpt-4
0125-ös előzetes verzióra való központi telepítése gpt-4
már nem történik meg. gpt-4
Az 1106-os és 0125-ös előzetes verzió "Automatikus frissítés alapértelmezettre" és "Frissítés lejárt" értékre állítása a modell stabil verziójának kiadása után kezdődik.
A frissítési folyamatról további információt a modellek oldalán talál.
Ez a modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
text-embedding-3-large
text-embedding-3-small
A tesztelés során az OpenAI-jelentések a nagy és a kis harmadik generációs beágyazási modellek is jobb átlagos többnyelvű lekérési teljesítményt nyújtanak a MIRACL-teljesítményteszttel, miközben az angol feladatok teljesítménye továbbra is jobb az MTEB-teljesítményteszttel, mint a második generációs text-embedding-ada-002 modell.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
A GPT-3.5-Turbo modellek (beleértve a 16k-ot is) különböző verziói közötti migrálás egyszerűsítése érdekében az összes GPT-3.5-Turbo-kvótát egyetlen kvótaértékbe összesítjük.
Azoknak az ügyfeleknek, akik a kvóta növelését jóváhagyták, az előző növekedéseket tükröző összesített kvótával fognak rendelkezni.
Minden olyan ügyfél, akinek a modellverziók jelenlegi teljes kihasználtsága kisebb az alapértelmezettnél, alapértelmezés szerint új összesített teljes kvótát kap.
A gpt-4
modell verziója 0125-preview
már elérhető az Usa keleti régiójában, az USA északi középső régiójában és az USA déli középső régiójában található Azure OpenAI szolgáltatásban. A verzióterjesztéssel gpt-4
1106-preview
rendelkező ügyfeleket a következő hetekben automatikusan frissítjük 0125-preview
.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
Az Azure OpenAI mostantól támogatja az OpenAI GPT-jét használó API-t. Az Azure OpenAI Assistants (előzetes verzió) lehetővé teszi az igényeinek megfelelő AI-asszisztensek létrehozását egyéni utasítások és speciális eszközök, például kódértelmezők és egyéni függvények használatával. További információ:
- Gyors útmutató
- Alapelvek
- A Python részletes útmutatója
- Kódértelmező
- Függvényhívás
- Asszisztensek modellje és régióinak rendelkezésre állása
- Assistants Python > REST-referencia
- Asszisztensi minták
Az Azure OpenAI szolgáltatás mostantól támogatja a szövegfelolvasási API-kat az OpenAI hangjával. Az AI által létrehozott beszéd lekérése a megadott szövegből. További információért tekintse meg az áttekintési útmutatót , és próbálja ki a rövid útmutatót.
Megjegyzés
Az Azure AI Speech támogatja az OpenAI szövegfelolvasást is. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.
Mostantól a következő Azure-régióban használhatja az Azure OpenAI On Your Data-t:
- Dél-Afrika északi régiója
- Az Azure OpenAI az Ön adatain mostantól általánosan elérhető.
- Az Azure OpenAI on Your Data teljes VPN- és privát végponttámogatása, beleértve a következő biztonsági támogatásokat: tárfiókok, Azure OpenAI-erőforrások és Azure AI-Search szolgáltatás-erőforrások.
- Új cikk az Azure OpenAI On Your Data konfigurációjának virtuális hálózatokkal és privát végpontokkal történő védelméről.
A GPT-4 Turbo és a Vision az Azure OpenAI szolgáltatásban nyilvános előzetes verzióban érhető el. A GPT-4 Turbo with Vision egy nagy multimodális modell (LMM), amelyet az OpenAI fejlesztett ki, amely képes képek elemzésére és szöveges válaszokat adni a velük kapcsolatos kérdésekre. A természetes nyelvi feldolgozást és a vizuális megértést egyaránt magában foglalja. A továbbfejlesztett móddal az Azure AI Vision funkcióival további megállapításokat hozhat létre a képekből.
- Ismerje meg a GPT-4 Turbo és a Vision képességeit kód nélküli környezetben az Azure OpenAI Playground használatával. További információ a rövid útmutatóban.
- A GPT-4 Turbo és a Vision használatával végzett látásjavítás már elérhető az Azure OpenAI-játszótéren, és támogatja az optikai karakterfelismerést, az objektumok földelését, az adatok hozzáadásának képtámogatását, valamint a videoüzenetek támogatását.
- Hívásokat kezdeményezhet közvetlenül a csevegő API-ba a REST API használatával.
- A régió rendelkezésre állása jelenleg csak ,
SwitzerlandNorth
SwedenCentral
,WestUS
ésAustraliaEast
- Tudjon meg többet a GPT-4 Turbo és a Vision ismert korlátairól és más gyakori kérdésekről.
- Mostantól adatforrásként használhatja az Azure Cosmos DB for MongoDB virtuális magot és URL-címeket/webcímeket az adatok betöltéséhez és a támogatott Azure OpenAI-modellel való csevegéshez.
Mindkét modell az OpenAI legújabb kiadása, továbbfejlesztett utasításkövetéssel, JSON móddal, reprodukálható kimenettel és párhuzamos függvényhívással.
A GPT-4 Turbo Preview maximális környezeti ablaka 128 000 token, és 4096 kimeneti jogkivonatot képes létrehozni. A legfrissebb betanítási adatokkal rendelkezik 2023 áprilisig. Ez a modell előzetes verzióban érhető el, és éles használatra nem ajánlott. Az előzetes verziójú modell összes központi telepítése automatikusan frissül, amint a stabil kiadás elérhetővé válik.
A GPT-3.5-Turbo-1106 maximális környezeti ablaka 16 385 token, és 4096 kimeneti jogkivonatot képes létrehozni.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
A modellek saját egyedi régiónkénti kvótakiosztásokkal rendelkeznek.
A DALL-E 3 az OpenAI legújabb képgenerálási modellje. Jobb képminőséget, összetettebb jeleneteket és jobb teljesítményt nyújt a képeken lévő szövegek renderelése során. Emellett több méretarány-beállítással is rendelkezik. A DALL-E 3 az OpenAI Studióban és a REST API-on keresztül érhető el. Az OpenAI-erőforrásnak az SwedenCentral
Azure-régióban kell lennie.
A DALL-E 3 beépített gyors újraírást tartalmaz a képek javítása, az torzítás csökkentése és a természetes változatok növelése érdekében.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Bővített ügyfélkonfiguráció: Mostantól minden Azure OpenAI-ügyfél konfigurálhatja az összes súlyossági szintet (alacsony, közepes, magas) a gyűlölet, az erőszak, a szexuális és az önsértés kategóriákhoz, beleértve a csak a nagy súlyosságú tartalmak szűrését is. Tartalomszűrők konfigurálása
Tartalom hitelesítő adatai az összes DALL-E modellben: Az összes DALL-E modellből származó AI által létrehozott képek mostantól tartalmaznak egy digitális hitelesítő adatot, amely mesterséges intelligenciával létrehozott módon teszi közzé a tartalmat. A képeszközöket megjelenítő alkalmazások a nyílt forráskód Content Authenticity Initiative SDK használatával jeleníthetik meg a hitelesítő adatokat a mesterséges intelligenciával létrehozott rendszerképeikben. Tartalom hitelesítő adatai az Azure OpenAI-ban
Új RAI-modellek
- Jailbreak-kockázatészlelés: A jailbreak-támadások olyan felhasználói kérések, amelyek a Generatív AI-modellt olyan viselkedések bemutatására késztetik, amelyeket a rendszerüzenetben beállított szabályok elkerülése vagy megszegése érdekében betanított. A jailbreak kockázatészlelési modell nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzetekben és szűrőmodellben érhető el. Felhasználói kéréseken fut.
- Védett anyagszöveg: A védett anyagszöveg ismert szöveges tartalmakat (például dalszövegeket, cikkeket, recepteket és kijelölt webes tartalmakat) ír le, amelyeket nagy nyelvi modellek képesek kiadni. A védett anyag szövegmodellje nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzet- és szűrőmodellben érhető el. LLM-befejezéseken fut.
- Védett anyagkód: A védett anyagkód olyan forráskódot ír le, amely megfelel a nyilvános adattárakból származó forráskódkészletnek, amelyet nagy nyelvi modellek a forrástárak megfelelő idézete nélkül is ki tudnak adni. A védett anyagkódmodell nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzetekben és szűrőmodellben érhető el. LLM-befejezéseken fut.
Tiltólisták: Az ügyfelek mostantól gyorsan testre szabhatják a tartalomszűrők viselkedését a kérések és befejezések esetében, ha egyéni tiltólistát hoznak létre a szűrőikben. Az egyéni tiltólista lehetővé teszi, hogy a szűrő végrehajtsa a műveletet a minták testre szabott listáján, például adott kifejezéseken vagy regex mintákon. Az egyéni blokklistákon kívül a Microsoft profanitási blokklistát (angol) is biztosítunk. Blokklisták használata
gpt-35-turbo-0613
mostantól elérhető a finomhangoláshoz.babbage-002
ésdavinci-002
már elérhetőek a finomhangoláshoz. Ezek a modellek helyettesítik az örökölt ada, babbage, curie és davinci alapmodelleket, amelyek korábban finomhangolhatóak voltak.A rendelkezésre állás finomhangolása bizonyos régiókra korlátozódik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
A finomhangolt modellek eltérő kvótakorlátokkal rendelkeznek, mint a normál modellek.
- Új egyéni paraméterek a lekért dokumentumok számának és szigorúságának meghatározásához.
- A szigorúsági beállítás a küszöbértéket úgy állítja be, hogy a dokumentumok a lekérdezések szempontjából relevánsnak minősüljenek.
- A lekért dokumentumok beállítása megadja a válaszok létrehozásához használt adatindexből származó legmagasabb pontszámú dokumentumok számát.
- Az adatok betöltésének/feltöltésének állapotát az Azure OpenAI Studióban tekintheti meg.
- Privát végpontok és VPN-ek támogatása blobtárolókhoz.
A GPT-4 és a GPT-4-32k mostantól minden Azure OpenAI Service-ügyfél számára elérhető. Az ügyfeleknek már nem kell a GPT-4 és a GPT-4-32k használatára alkalmazniuk a várakozási listát (a korlátozott hozzáférésű regisztrációs követelmények továbbra is érvényesek az összes Azure OpenAI-modellre). A rendelkezésre állás régiónként eltérő lehet. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Az Azure OpenAI Szolgáltatás mostantól támogatja a GPT-3.5 Turbo Instruct modellt. Ez a modell a Completions API-val összehasonlítható text-davinci-003
és használható teljesítménnyel rendelkezik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI Whisper-modellje által működtetett beszédfelolvasási API-kat. Az AI által létrehozott szöveg lekérése a megadott beszédhang alapján. További információért tekintse meg a rövid útmutatót.
Megjegyzés
Az Azure AI Speech az OpenAI Whisper modelljét is támogatja a kötegelt átírási API-val. További információért tekintse meg a Köteg átírási útmutatót. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?
- Az Azure OpenAI mostantól svédországi középső és svájci északi régiókban is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
- Az egyes modellek és régiók maximális alapértelmezett kvótakorlátjának növelése. A számítási feladatoknak ezekre a modellekre és régiókra való migrálása lehetővé teszi a magasabb tokenek percenkénti (TPM) előnyeit.
- Most már üzembe helyezheti az Azure OpenAI-t az adatain a Power Virtual Agentsben.
- Az Azure OpenAI On Your Data mostantól támogatja a privát végpontokat.
- A bizalmas dokumentumokhoz való hozzáférés szűrésének képessége.
- Az index automatikus frissítése ütemezés szerint.
- Vektorkeresési és szemantikai keresési lehetőségek.
- Csevegési előzmények megtekintése az üzembe helyezett webalkalmazásban
- Az Azure OpenAI mostantól támogatja a függvényhívást , hogy a csevegővégzítési API-ban együttműködhessen a függvényekkel.
- Az Azure OpenAI mostantól támogatja az API-kérésenként legfeljebb 16 bemenettel rendelkező tömböket a text-embedding-ada-002 2-es verzióval.
- Az Azure OpenAI mostantól kanada keleti, USA 2. keleti régiójában, Kelet-Japánban és az USA északi középső régiójában is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
- Az Azure OpenAI On Your Data előzetes verzióban érhető el, így olyan OpenAI-modellekkel cseveghet, mint a GPT-35-Turbo és a GPT-4, és az adatok alapján fogadhat válaszokat.
- gpt-35-turbo (0613-es verzió)
- gpt-35-turbo-16k (0613-es verzió)
- gpt-4 (0613-es verzió)
- gpt-4-32k (0613-es verzió)
- Az Azure OpenAI már elérhető az Egyesült Királyság déli régiójában. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
- Tartalomszűrők konfigurálása az Azure OpenAI Szolgáltatással.
- Engedélyezze a széljegyzeteket a tartalomszűrés kategóriájának és súlyossági adatainak megtekintéséhez a GPT-alapú befejezési és csevegés-befejezési hívások részeként.
- A kvóta lehetővé teszi, hogy aktívan kezelje a díjkorlátok kiosztását az előfizetésen belüli üzemelő példányok között.
- Általános rendelkezésre állási támogatás:
- Csevegés befejezése API-verzió
2023-05-15
. - GPT-35-Turbo modellek.
- GPT-4 modellsorozat.
- Csevegés befejezése API-verzió
Ha jelenleg az API-t 2023-03-15-preview
használja, javasoljuk, hogy migráljon a GA 2023-05-15
API-ba. Ha jelenleg API-verziót 2022-12-01
használ, ez az API továbbra is ga marad, de nem tartalmazza a legújabb csevegés-befejezési képességeket.
Fontos
A GPT-35-Turbo modellek jelenlegi verzióinak használata a befejezési végponttal előzetes verzióban marad.
- Az Azure OpenAI már elérhető a franciaországi középső régióban. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
DALL-E 2 nyilvános előzetes verzió. Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI DALL-E 2 modelljén alapuló képgenerálási API-kat. Mesterséges intelligenciával létrehozott képek lekérése a megadott leíró szöveg alapján. További információért tekintse meg a rövid útmutatót.
A testreszabott modellek inaktív üzembe helyezései 15 nap után törlődnek; modellek továbbra is elérhetők maradnak az újbóli üzembe helyezéshez. Ha egy testre szabott (finomhangolt) modell több mint tizenöt (15) napig van üzembe helyezve, amely alatt nem történik befejezési vagy csevegés-befejezési hívás, az üzembe helyezés automatikusan törlődik (és az üzembe helyezésért nem jár további üzemeltetési díj). A mögöttes testreszabott modell továbbra is elérhető marad, és bármikor újra üzembe helyezheti. További információért tekintse meg az útmutatót.
A GPT-4 sorozatú modellek mostantól előzetes verzióban érhetők el az Azure OpenAI-ban. A hozzáférés kéréséhez a meglévő Azure OpenAI-ügyfelek az űrlap kitöltésével jelentkezhetnek. Ezek a modellek jelenleg az USA keleti régiójában és az USA déli középső régiójában érhetők el.
A GPT-35-Turbo és GPT-4 modellekhez készült új csevegés-befejezési API 3/21-es előzetes verzióban jelenik meg. További információkért tekintse meg a frissített rövid útmutatókat és útmutatókat.
GPT-35-Turbo előzetes. További részletekért tekintse meg az útmutatót.
Megnövelt betanítási korlátok a finomhangoláshoz: A betanítási feladat maximális mérete (a betanítási fájlban lévő tokenek) x (az alapidőszakok száma) 2 milliárd token az összes modellhez. A maximális betanítási feladatot 120 óráról 720 órára növeltük.
További használati esetek hozzáadása a meglévő hozzáféréshez. Korábban az új használati esetek hozzáadásának folyamata miatt az ügyfeleknek újra kellett alkalmazniuk a szolgáltatást. Most egy új folyamatot adunk ki, amely lehetővé teszi új használati esetek gyors hozzáadását a szolgáltatás használatához. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi. A meglévő ügyfelek itt bármilyen új használati esetet tanúsíthatnak. Vegye figyelembe, hogy erre akkor van szükség, ha olyan új használati esethez szeretné használni a szolgáltatást, amelyre eredetileg nem jelentkezett.
- .NET SDK(következtetés) előzetes kiadási | minták
- Terraform SDK-frissítés az Azure OpenAI felügyeleti műveleteinek támogatásához.
- A paraméter mostantól támogatja a szöveg beillesztését a
suffix
befejezés végén.
- A tartalomszűrés alapértelmezés szerint be van kapcsolva.
Új cikkek:
Új tanfolyam:
Service GA. Az Azure OpenAI szolgáltatás általánosan elérhető.
Új modellek: A legújabb szöveges modell hozzáadása, text-davinci-003 (USA keleti régiója, Nyugat-Európa), text-ada-embeddings-002 (USA keleti régiója, USA déli középső régiója, Nyugat-Európa)
Az OpenAI legújabb modelljei. Az Azure OpenAI hozzáférést biztosít az összes legújabb modellhez, beleértve a GPT-3.5 sorozatot is.
Új API-verzió (2022-12-01). Ez a frissítés számos kért fejlesztést tartalmaz, többek között a jogkivonat-használati információkat az API-válaszban, a fájlokra vonatkozó továbbfejlesztett hibaüzeneteket, az OpenAI-val való igazítást a létrehozási adatstruktúra finomhangolásához, valamint az utótagparaméter támogatását a finomhangolt feladatok egyéni elnevezésének engedélyezéséhez.
Nagyobb kérelem másodpercenkénti korlát. 50 nem Davinci-modellek esetén. 20 Davinci-modellekhez.
Az üzemelő példányok gyorsabb finomhangolása. Ada és Curie finomhangolt modellek üzembe helyezése 10 perc alatt.
Magasabb betanítási korlátok: 40 M-nyi betanítási jogkivonatok az Ada, a Babbage és a Curie számára. 10M a Davinci.
A visszaélések és a helytelen használatú adatnaplózás módosításának kérése és az emberi felülvizsgálat folyamata. Ma a szolgáltatás naplózza a kérések/válaszok adatait a visszaélés és a visszaélés észlelése céljából, hogy ezek a hatékony modellek ne legyenek visszaélve. Azonban sok ügyfél szigorú adatvédelmi és biztonsági követelményekkel rendelkezik, amelyek nagyobb ellenőrzést igényelnek az adataik felett. Ezeknek a használati eseteknek a támogatásához egy új folyamatot bocsátunk ki az ügyfelek számára a tartalomszűrési szabályzatok módosítására vagy az alacsony kockázatú használati esetek visszaélésnaplózásának kikapcsolására. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi, és a meglévő OpenAI-ügyfelek itt is alkalmazhatók.
Ügyfél által felügyelt kulcs (CMK) titkosítása. A CMK a betanítási adatok és a testreszabott modellek tárolásához használt saját titkosítási kulcsok biztosításával nagyobb irányítást biztosít az ügyfelek számára az adatok Azure OpenAI-ban való kezelése felett. Az ügyfél által kezelt kulcsok (CMK) használata, amely Bring Your Own Key (BYOK, saját kulcs használata) módszerként is ismert, nagyobb rugalmasságot biztosít a hozzáférés-vezérlők létrehozása, rotálása, letiltása és visszavonása terén. Továbbá az adatok védelméhez használt titkosítási kulcsok naplózására is lehetősége van. További információ a inaktív állapotú titkosítási dokumentációnkból.
A Lockbox támogatása
SOC-2 megfelelőség
Naplózás és diagnosztika az Azure Resource Health, a Cost Analysis és a Metrics > Diagnosztikai beállítások használatával.
A Studio fejlesztései. A Studio-munkafolyamat számos használhatósági fejlesztése, köztük az Azure AD-szerepkör támogatása annak szabályozásához, hogy a csapatban kik férhetnek hozzá a finomhangolt modellek létrehozásához és üzembe helyezéséhez.
A create API-kérés finomhangolása az OpenAI sémájának megfelelően lett frissítve.
Előzetes verziójú API-verziók:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
API 2022-12-01-es verzió:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
A tartalomszűrés alapértelmezés szerint átmenetileg ki van kapcsolva . Az Azure con sátormód ration másként működik, mint az Azure OpenAI. Az Azure OpenAI tartalomszűrőket futtat a generációs hívás során, hogy észlelje a káros vagy sértő tartalmakat, és szűrje őket a válaszból. Tudj meg többet
Ezek a modellek 2023 első negyedévében újra engedélyezve lesznek, és alapértelmezés szerint be vannak kapcsolva.
Ügyfélműveletek
- Ha szeretné, hogy ezek be vannak kapcsolva az előfizetéshez, lépjen kapcsolatba az Azure ügyfélszolgálatával .
- Ha szeretné, hogy a módosítások továbbra is ki legyenek kapcsolva, alkalmazza a szűrési módosításokat. (Ez a beállítás csak alacsony kockázatú használati esetekre vonatkozik.)
További információ az Azure OpenAI-t használó mögöttes modellekről.