Az Azure OpenAI szolgáltatás újdonságai
Ez a cikk összefoglalja az Azure OpenAI legújabb kiadásait és főbb dokumentációs frissítéseit.
2024. október
NEW data zone standard deployment type
Az adatzóna standard üzemelő példányai ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-üzembe helyezési típus, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat a Microsoft által definiált adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna-szabvány magasabb alapértelmezett kvótákat biztosít, mint az Azure földrajzi alapú üzembe helyezési típusai. Az adatzóna standard üzemelő példányai támogatottak a modelleken gpt-4o-2024-05-13
és gpt-4o-mini-2024-07-18
a modellekengpt-4o-2024-08-06
.
További információt az üzembehelyezési típusok útmutatójában talál.
Globális Batch GA
Az Azure OpenAI globális köteg általánosan elérhető.
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
o1-preview és o1-mini modellek korlátozott hozzáféréssel
A o1-preview
modellek mostantól o1-mini
elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Azok az ügyfelek, akik már jóváhagyták a modellt, és hozzáféréssel rendelkeznek a modellhez a korai hozzáférésű játszótéren keresztül, nem kell újra alkalmazniuk, automatikusan API-hozzáférést kapnak. A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.
API-támogatás:
Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-preview
lett hozzáadva.
A max_tokens
paraméter elavult, és az új max_completion_tokens
paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens
paraméterrel működnek.
Régió rendelkezésre állása:
A modellek az USA 2. keleti régiójában és a Svédország középső régiójában a standard és globális standard üzembe helyezéshez érhetők el a jóváhagyott ügyfelek számára.
Új GPT-4o Realtime API beszéd- és hangalapú nyilvános előzetes verzióhoz
Az Azure OpenAI GPT-4o audio a GPT-4o modellcsalád része, amely támogatja az alacsony késleltetésű, "beszéd, beszéd kihangosító" beszélgetési interakciókat. A GPT-4o audio realtime
API valós idejű, kis késésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas a felhasználó és a modell közötti élő interakciókat, például az ügyfélszolgálati ügynököket, a hangsegédeket és a valós idejű fordítókat érintő használati esetekhez.
A gpt-4o-realtime-preview
modell az USA 2. keleti régiójában és Svédország középső régióiban üzemelő globális üzemelő példányokhoz érhető el.
További információ: GPT-4o valós idejű hangdokumentáció.
Globális kötegtámogatási frissítések
A globális köteg mostantól támogatja a GPT-4o-t (2024-08-06). További információt a globális köteg első lépéseinek útmutatójában talál.
2024. szeptember
Azure OpenAI Studio UX-frissítések
Szeptember 19-én, amikor hozzáfér az Azure OpenAI Studióhoz , alapértelmezés szerint nem fogja látni az örökölt studio felhasználói felületet. Ha szükséges, a felhasználói felület felső sávjában a Következő néhány hétre a Switch to the old look váltógombbal visszatérhet az előző élményhez. Ha visszaáll az örökölt Studio felhasználói felületre, az segít, ha kitölti a visszajelzési űrlapot, hogy tudassa velünk, miért. Aktívan figyeljük ezt a visszajelzést az új élmény javítása érdekében.
GPT-4o 2024-08-06 kiépített üzembe helyezések
A GPT-4o 2024-08-06 már elérhető az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban üzembe helyezéshez. Globális üzembe helyezésekhez is elérhető.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
ÚJ globális üzembehelyezési típus
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális üzembe helyezési típusok, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat az adatközpontba, és minden kéréshez a legjobb rendelkezésre állást biztosíthassa. A globális kiépített üzemelő példányok fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez az Azure globális infrastruktúrájának használatával. A globálisan kiépített üzembe helyezéseket és modelleket gpt-4o-2024-08-06
gpt-4o-mini-2024-07-18
támogatjuk.
További információt az üzembehelyezési típusok útmutatójában talál.
ÚJ o1-preview és o1-mini modellek korlátozott hozzáféréshez
Az Azure OpenAI o1-preview
és o1-mini
a modellek célja az érvelési és problémamegoldási feladatok kezelése nagyobb összpontosítással és képességgel. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.
Az o1 sorozat főbb képességei
- Összetett kódgenerálás: Képes algoritmusok létrehozására és speciális kódolási feladatok kezelésére a fejlesztők támogatásához.
- Speciális problémamegoldás: Ideális átfogó ötletgyűjtési munkamenetekhez és a sokrétű kihívások kezeléséhez.
- Összetett dokumentum-összehasonlítás: Tökéletes a szerződések, esetfájlok vagy jogi dokumentumok elemzéséhez a finom különbségek azonosításához.
- Utasításkövetés és munkafolyamat-kezelés: Különösen hatékony a rövidebb környezeteket igénylő munkafolyamatok kezelésére.
Modellvariánsok
o1-preview
:o1-preview
a sorozatmodelleko1
jobban alkalmasak.o1-mini
:o1-mini
a sorozatmodelleko1
gyorsabb és olcsóbb.
Modellverzió: 2024-09-12
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Korlátozások
A o1
sorozatmodellek jelenleg előzetes verzióban érhetők el, és nem tartalmaznak más modellekben elérhető funkciókat, például a képfelismerést és a strukturált kimeneteket, amelyek a legújabb GPT-4o modellben érhetők el. Sok feladat esetén az általánosan elérhető GPT-4o modellek még mindig megfelelőbbek lehetnek.
Biztonság
Az OpenAI további biztonsági intézkedéseket is beépített a o1
modellekbe, beleértve az új technikákat, amelyekkel a modellek elutasíthatják a nem biztonságos kéréseket. Ezek a fejlesztések teszik elérhetővé a o1
sorozatot a leg robusztusabb modellek közül.
Elérhetőség
o1-mini
Az o1-preview
USA 2. keleti régiójában az AI Studio korai hozzáférésű játszóterén keresztül korlátozott hozzáférés érhető el. A modellek adatfeldolgozása o1
más régióban fordulhat elő, mint ahol azok használhatók.
A korai hozzáférésű játszótéren való kipróbálásához o1-preview
o1-mini
regisztrálni kell a modelleket, és a hozzáférést a Microsoft jogosultsági feltételei alapján biztosítjuk.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A hozzáférés megadása után a következőkre lesz szüksége:
- Keresse meg https://ai.azure.com/resources és válassza ki az erőforrást a
eastus2
régióban. Ha ebben a régióban nincs Azure OpenAI-erőforrása, létre kell hoznia egyet. - Miután kiválasztotta az
eastus2
Azure OpenAI-erőforrást, a bal felső panelen válassza a Korai hozzáférésű játszótér (előzetes verzió) lehetőséget.
2024. augusztus
GPT-4o 2024-08-06 strukturált kimenetek
- Az usa minden régiójában és Svédország középső régiójában elérhető standard és globális üzemelő példányokhoz.
- Ez a modell támogatja a strukturált kimeneteket.
GPT-4o mini kiépített üzembe helyezések
A GPT-4o mini már elérhető a kiépített üzembe helyezésekhez Kanada keleti régiójában, az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
GPT-4o finomhangolás (nyilvános előzetes verzió)
A GPT-4o finomhangolása mostantól nyilvános előzetes verzióban elérhető az Azure OpenAI-hoz az USA északi középső régiójában és a Svédország középső régiójában.
További információkért tekintse meg blogbejegyzésünket.
Új előzetes verziójú API-kiadás
Az API-verzió 2024-07-01-preview
a dataplane legújabb szerzői és következtetési API-kiadása. Lecseréli az API-verziót 2024-05-01-preview
, és támogatja a következőket:
- Batch API-támogatás hozzáadva
- Vektortároló adattömb-stratégiai paraméterei
max_num_results
a fájlkereső eszköz kimenetének kell lennie.
További információkért tekintse meg referenciadokumentációnkat
GPT-4o mini regionális elérhetőség
- A GPT-4o mini az USA keleti és svédországi középső régióiban standard és globális standard üzembe helyezéshez érhető el.
- A GPT-4o mini az USA keleti régiójában, Svédország középső régiójában és az USA nyugati régiójában elérhető a globális kötegelt üzembe helyezéshez.
Értékelési útmutató
- Új blogbejegyzés a modellértékelések első lépéseiről. Javasoljuk, hogy ezt az útmutatót használja a modellfrissítési és -kivonási folyamat részeként.
A legújabb GPT-4o modell elérhető a korai hozzáférésű játszótéren (előzetes verzió)
2024. augusztus 6-án az OpenAI bejelentette a gpt-4o-modell legújabb verzióját 2024-08-06
. A GPT-4o 2024-08-06
az előző verzió összes képességével rendelkezik, valamint:
- Az összetett strukturált kimenetek támogatásának továbbfejlesztett képessége.
- A maximális kimeneti jogkivonatok száma 4096-ról 16 384-re nőtt.
Az Azure-ügyfelek ma tesztelhetik a GPT-4o-t 2024-08-06
az új AI Studio korai hozzáférésű játszóterén (előzetes verzió).
Az előző korai hozzáférésű játszótértől eltérően az AI Studio korai hozzáférésű játszótere (előzetes verzió) nem igényel erőforrást egy adott régióban.
Feljegyzés
A korai hozzáférésű játszótéren (előzetes verzió) végrehajtott kérések és kiegészítések bármely Azure OpenAI-régióban feldolgozhatók, és jelenleg percenként 10 kérésre vonatkoznak Azure-előfizetési korlátonként. Ez a korlát a jövőben változhat.
Az Azure OpenAI szolgáltatással való visszaélés monitorozása minden korai hozzáférésű játszótér-felhasználó számára engedélyezve van, még akkor is, ha jóváhagyást ad a módosításra; az alapértelmezett tartalomszűrők engedélyezve vannak, és nem módosíthatók.
A GPT-4o 2024-08-06
teszteléséhez jelentkezzen be az Azure AI korai hozzáférésű játszóterére (előzetes verzió) ezen a hivatkozáson keresztül.
A globális kötegtelepítések már elérhetők
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
2024. július
A GPT-4o mini már elérhető a finomhangoláshoz
A GPT-4o mini finomhangolás mostantól nyilvános előzetes verzióban érhető el Svédország középső régiójában és az USA északi középső régiójában.
Az Asszisztensek fájlkeresési eszköz most már kiszámlázva van
Az Asszisztensek fájlkereső eszközének használatáért most további díjakat kell fizetnie. További információkért tekintse meg a díjszabási oldalt .
A GPT-4o minimodell üzembe helyezéshez érhető el
A GPT-4o mini a legújabb Azure OpenAI-modell, amelyet először 2024. július 18-án jelentettek be:
"A GPT-4o mini lehetővé teszi az ügyfelek számára, hogy lenyűgöző alkalmazásokat nyújtsanak alacsonyabb áron, villámgyorsan. A GPT-4o mini jelentősen intelligensebb, mint a GPT-3.5 Turbo – 82%-os pontszámot ért el a Massive Multitask Language Understanding (MMLU) mérése terén a 70%-hoz képest, és több mint 60%-kal olcsóbb.1 A modell kibővített 128K környezeti ablakot biztosít, és integrálja a GPT-4o továbbfejlesztett többnyelvű képességeit, így jobb minőséget biztosít a nyelveknek a világ minden tájáról."
A modell jelenleg az USA keleti régiójában standard és globális standard üzembe helyezéshez is elérhető.
A modellkvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalt , és a modell elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Új felelős AI alapértelmezett tartalomszűrési szabályzat
Az új alapértelmezett tartalomszűrési szabályzat DefaultV2
biztosítja a GPT-modellsorozat (szöveg) legújabb biztonsági és biztonsági megoldásait, beleértve a következőket:
- Prompt Shields for jailbreak attacks on user prompts (filter),
- Védett anyagészlelés szöveghez (szűrőhöz) a modell befejezésekor
- Védett anyagészlelés a kódhoz (megjegyzés) a modell befejezésekor
Bár a meglévő erőforrások és üzemelő példányok tartalomszűrői nem változnak (az alapértelmezett vagy egyéni tartalomszűrési konfigurációk változatlanok maradnak), az új erőforrások és a GPT-környezetek automatikusan öröklik az új tartalomszűrési szabályzatot DefaultV2
. Az ügyfeleknek lehetőségük van váltani a biztonsági alapértékek között, és egyéni tartalomszűrési konfigurációkat hozhatnak létre.
További információért tekintse meg az Alapértelmezett biztonsági szabályzat dokumentációját .
Új GA API-kiadás
Az API-verzió 2024-06-01
a ga adatsík legújabb következtetési API-kiadása. Lecseréli az API-verziót 2024-02-01
, és támogatja a következőket:
- beágyazások
encoding_format
>dimensions
paraméterek. - csevegés befejezése >
logprobs
top_logprobs
paraméterek.
További információért tekintse meg az adatsík következtetési referenciadokumentációját .
A gpt-4o globális standard üzembe helyezéséhez elérhető régiók bővítése
A GPT-4o mostantól a következő globális standard üzemelő példányokhoz érhető el:
- ausztráliaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral git
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- lengyelországcentral
- southafricanorth
- USA déli középső régiója
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
A globális standard kvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalát.
2024. június
A nyugdíjazási dátum frissítései
- A 0301-et legkésőbb 2024. október 1-jére frissítették
gpt-35-turbo
. - &
gpt-35-turbo-16k
0613-ra frissítvegpt-35-turbo
2024. október 1-ére. - A >
gpt-4-32k
0314 elavulási dátum 2024. október 1-ről 2025. június 6-ra frissültgpt-4
.
Jogkivonatalapú számlázás a finomhangoláshoz
- Az Azure OpenAI finomhangolási számlázása mostantól a betanítási fájlban lévő tokenek számán alapul – a teljes eltelt betanítási idő helyett. Ez jelentős költségcsökkenést eredményezhet egyes betanítási futtatások esetében, és sokkal egyszerűbbé teszi a finomhangolási költségek becslését. További információkért tekintse meg a hivatalos közleményt.
A GPT-4o új régiókban jelent meg
- A GPT-4o mostantól a következőben is elérhető:
- Svédország középső régiója a standard regionális üzembe helyezéshez.
- Kelet-Ausztrália, Kelet-Kanada, Kelet-Japán, Közép-Korea, Közép-Korea, Közép-Svédország, Észak-Svájc, usa 3. nyugati régiója a kiépített üzembe helyezéshez.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Ügyfél által felügyelt kulcs (CMK) támogatása asszisztensekhez
A Szálak és fájlok az asszisztensekben mostantól támogatja a CMK-t a következő régióban:
- USA 3. nyugati régiója
2024. május
GPT-4o kiépített üzembe helyezések
gpt-4o
Verzió: 2024-05-13
standard és kiépített üzemelő példányokhoz is elérhető. A kiépített és a standard modell üzembe helyezései szöveges és kép-/látásbeli következtetési kéréseket is elfogadnak.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a kiépített üzemelő példányok modellmátrixát.
Asszisztensek v2 (előzetes verzió)
Az Assistants API frissítése mostantól nyilvánosan elérhető. A következő frissítéseket tartalmazza:
- Fájlkereső eszköz és vektoros tárolás
- A jogkivonatok használatának kezeléséhez szükséges maximális befejezési és kérési jogkivonat-támogatás .
tool_choice
paramétert, amely arra kényszeríti az Asszisztenst, hogy egy megadott eszközt használjon. Mostantól létrehozhat üzeneteket a segédszerepkörrel , hogy egyéni beszélgetési előzményeket hozzon létre a szálakban.temperature
A ,top_p
response_format
paraméterek támogatása.- Streamelési és lekérdezési támogatás. A Python SDK segédfüggvényeivel futtatásokat hozhat létre, és streamelheti a válaszokat. Lekérdezési SDK-segítőket is hozzáadtunk az objektumállapot-frissítések lekérdezés nélkül való megosztásához.
- Kísérletezzen a Logic Apps és a függvényhívás használatával az Azure OpenAI Studióval. Importálja függvényként a Logic Appsben implementált REST API-kat, és a studio automatikusan meghívja a függvényt (Logic Apps-munkafolyamatként) a felhasználói kérés alapján.
- Az AutoGen by Microsoft Research egy többügynökből álló beszélgetési keretrendszert biztosít, amely lehetővé teszi a nagy méretű nyelvi modell (LLM) munkafolyamatainak kényelmes létrehozását az alkalmazások széles körében. Az Azure OpenAI-asszisztensek mostantól integrálva vannak az AutoGenbe egy új kísérleti ügynökön keresztül
GPTAssistantAgent
, amellyel zökkenőmentesen adhat hozzá asszisztenseket az AutoGen-alapú többügynök-munkafolyamatokhoz. Ez lehetővé teszi, hogy több Olyan Azure OpenAI-asszisztens is legyen, amely feladatra vagy tartományra specializálódott az összetett feladatok együttműködésére és kezelésére. - A finomhangolt
gpt-3.5-turbo-0125
modellek támogatása a következő régiókban:- USA 2. keleti régiója
- Közép-Svédország
- Kiterjesztett regionális támogatás a következő célokra:
- Kelet-Japán
- Az Egyesült Királyság déli régiója
- USA nyugati régiója
- USA 3. nyugati régiója
- Kelet-Norvégia
További információt az asszisztensekről szóló blogbejegyzésben talál.
GPT-4o modell általános rendelkezésre állása (GA)
A GPT-4o ("o is for "omni") az OpenAI legújabb modellje, amely 2024. május 13-án jelent meg.
- A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban.
- A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményt nyújtva az AI-képességekhez.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
Globális standard üzembehelyezési típus (előzetes verzió)
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális ajánlatok, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat az adatközpontba az egyes kérések legjobb rendelkezésre állása mellett. A globális szabvány a legmagasabb alapértelmezett kvótát biztosítja az új modellekhez, és szükségtelenné teszi a terheléselosztást több erőforrás között.
További információt az üzembehelyezési típusok útmutatójában talál.
Frissítések finomhangolása
- A GPT-4 finomhangolása nyilvános előzetes verzióban érhető el.
- Az API-kiadás részeként
2024-05-01-preview
támogatást nyújtott a magokhoz, eseményekhez, teljes érvényesítési statisztikákhoz és ellenőrzőpontokhoz.
DALL-E és GPT-4 Turbo Vision GA konfigurálható tartalomszűrők
Hozzon létre egyéni tartalomszűrőket a DALL-E 2 és 3, a GPT-4 Turbo és a Vision GA (turbo-2024-04-09
) és a GPT-4o üzemelő példányokhoz. Tartalomszűrés
Aszinkron szűrő minden Azure OpenAI-ügyfél számára elérhető
A szűrők aszinkron futtatása a streamelési forgatókönyvek jobb késése érdekében mostantól minden Azure OpenAI-ügyfél számára elérhető. Tartalomszűrés
Javaslati pajzsok
Az Prompt Shields az Azure OpenAI-modellek által üzemeltetett alkalmazásokat kétféle támadástól védi: közvetlen (jailbreak) és közvetett támadásoktól. A közvetett támadások (más néven indirekt parancssori támadások vagy tartományközi parancssori injektálási támadások) a Generatív AI-modellek által üzemeltetett rendszerek elleni támadástípusok, amelyek akkor fordulhatnak elő, ha egy alkalmazás olyan információkat dolgoz fel, amelyeket nem közvetlenül az alkalmazás fejlesztője vagy a felhasználó készített. Tartalomszűrés
2024-05-01-preview API-kiadás
- További információkért tekintse meg az API-verzió életciklusát.
GPT-4 Turbo modell általános elérhetősége (GA)
A GPT-4 Turbo legújabb GA kiadása a következő:
gpt-4
Verzió:turbo-2024-04-09
Ez a következő előzetes modellek lecserélése:
gpt-4
Verzió:1106-Preview
gpt-4
Verzió:0125-Preview
gpt-4
Verzió:vision-preview
Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek
- Az OpenAI legújabb
0409
turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak. - Az Azure OpenAI legújabb
turbo-2024-04-09
verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküliimage_url
és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.
Különbségek a gpt-4 vision-preview-tól
- Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz
gpt-4
:turbo-2024-04-09
. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.
GPT-4 Turbo kiosztott felügyelt rendelkezésre állás
gpt-4
Verzió:turbo-2024-04-09
standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.
A GPT-4 Turbo üzembe helyezése a Vision GA-val
Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4
, majd válassza ki a turbo-2024-04-09
verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09
GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.
2024. április
A finomhangolás mostantól két új régióban támogatott az USA 2. keleti régiójában és Svájc nyugati régiójában
A finomhangolás mostantól a következő támogatással érhető el:
USA 2. keleti régiója
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
Nyugat-Svájc
babbage-002
davinci-002
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
Az egyes régiókban a modellek elérhetőségével és a támogatás finomhangolásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Többfordulós csevegési példák
A finomhangolás mostantól támogatja a többfordulós csevegéses betanítási példákat.
A GPT-4 (0125) elérhető az Azure OpenAI on Your Data szolgáltatáshoz
Most már használhatja a GPT-4 (0125) modellt az elérhető régiókban az Azure OpenAI On Your Data használatával.
2024. március
Kockázatok és biztonság monitorozása az Azure OpenAI Studióban
Az Azure OpenAI Studio mostantól egy Kockázat és biztonság irányítópultot biztosít minden olyan üzemelő példányhoz, amely tartalomszűrő-konfigurációt használ. Ezzel ellenőrizheti a szűrési tevékenység eredményeit. Ezután módosíthatja a szűrőkonfigurációt, hogy jobban kiszolgálja az üzleti igényeket, és megfeleljen a felelős AI-alapelveknek.
Kockázatok és biztonság monitorozásának használata
Az Azure OpenAI on Your Data frissítései
- Most már csatlakozhat egy Elasticsearch vektoradatbázishoz, amelyet az Azure OpenAI On Your Data szolgáltatással használhat.
- Az adatbetöltés során az adattömb méretparaméterével beállíthatja az index adott adattömbjeinek tokenjeinek maximális számát.
Megjelent a 2024-02-01 általános rendelkezésre állási (GA) API
Ez a legújabb GA API-kiadás, és az előző 2023-05-15
GA-kiadás lecserélése. Ez a kiadás támogatja az Azure OpenAI GA legújabb funkcióit, például a Whisperet, a DALLE-3-at és a finomhangolást az adatokon.
Az előzetes verziójú funkciókhoz, például az Asszisztensekhez, a szövegfelolvasáshoz (TTS) és az "adatokon" lévő adatforrásokhoz előzetes verziójú API-verzióra van szükség. További információt az API-verzió életciklus-útmutatójában talál.
Suttogva általános rendelkezésre állás (GA)
A Whisper speech to text modell mostantól a REST és a Python esetében is ga. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a Whisperet egy rövid útmutató követésével.
DALL-E 3 általános rendelkezésre állás (GA)
A DALL-E 3 képgenerálási modell mostantól a REST és a Python számára is elérhető. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Új regionális támogatás a DALL-E 3-hoz
Most már elérheti a DALL-E 3-at egy Azure OpenAI-erőforrással a vagy AustraliaEast
az East US
Azure-régióban, amellett, hogy SwedenCentral
.
Modell-elavulások és kivonások
Hozzáadtunk egy lapot, amely nyomon követi a modellek elavulását és kivonását az Azure OpenAI szolgáltatásban. Ez a lap a jelenleg elérhető, elavult és kivezetett modellekről nyújt tájékoztatást.
Megjelent a 2024-03-01-preview API
2024-03-01-preview
ugyanazokkal a funkciókkal rendelkezik, mint 2024-02-15-preview
a beágyazásokhoz, és két új paramétert ad hozzá:
encoding_format
lehetővé teszi a beágyazások létrehozására vonatkozó formátum megadását a (vagybase64
) fájlbanfloat
. Az alapértelmezett értékfloat
.dimensions
lehetővé teszi a kimeneti beágyazások számának beállítását. Ezt a paramétert csak az új, harmadik generációs beágyazási modellek támogatják:text-embedding-3-large
,text-embedding-3-small
. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. Adimensions
paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, a paraméter kihasználásához javasoljuk, hogy frissítsen a legújabb verzióra:pip install openai --upgrade
.
Ha jelenleg egy előzetes verziójú API-verziót használ a legújabb funkciók kihasználásához, javasoljuk, hogy tekintse meg az API-verzió életciklusáról szóló cikket, amely nyomon követi, hogy a jelenlegi API-verzió mennyi ideig lesz támogatott.
Frissítés a GPT-4-1106-Preview frissítési csomagokra
A 2024. március 8-ra ütemezett 1106 előzetes verzió gpt-4
0125-ös előzetes verzióra való központi telepítése gpt-4
már nem történik meg. gpt-4
Az 1106-os és 0125-ös előzetes verzió "Automatikus frissítés alapértelmezettre" és "Frissítés lejárt" értékre állítása a modell stabil verziójának kiadása után kezdődik.
A frissítési folyamatról további információt a modellek oldalán talál.
2024. február
GPT-3.5-turbo-0125 modell elérhető
Ez a modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
Harmadik generációs beágyazási modellek érhetők el
text-embedding-3-large
text-embedding-3-small
A tesztelés során az OpenAI-jelentések a nagy és a kis harmadik generációs beágyazási modellek is jobb átlagos többnyelvű lekérési teljesítményt nyújtanak a MIRACL-teljesítményteszttel, miközben az angol feladatok teljesítménye továbbra is jobb az MTEB-teljesítményteszttel, mint a második generációs text-embedding-ada-002 modell.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
GPT-3.5 Turbo kvótakonszolidáció
A GPT-3.5-Turbo modellek (beleértve a 16k-ot is) különböző verziói közötti migrálás egyszerűsítése érdekében az összes GPT-3.5-Turbo-kvótát egyetlen kvótaértékbe összesítjük.
Azoknak az ügyfeleknek, akik a kvóta növelését jóváhagyták, az előző növekedéseket tükröző összesített kvótával fognak rendelkezni.
Minden olyan ügyfél, akinek a modellverziók jelenlegi teljes kihasználtsága kisebb az alapértelmezettnél, alapértelmezés szerint új összesített teljes kvótát kap.
GPT-4-0125-preview modell elérhető
A gpt-4
modell verziója 0125-preview
már elérhető az Usa keleti régiójában, az USA északi középső régiójában és az USA déli középső régiójában található Azure OpenAI szolgáltatásban. A verzióterjesztéssel gpt-4
1106-preview
rendelkező ügyfeleket a következő hetekben automatikusan frissítjük 0125-preview
.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
Az Assistants API nyilvános előzetes verziója
Az Azure OpenAI mostantól támogatja az OpenAI GPT-jét használó API-t. Az Azure OpenAI Assistants (előzetes verzió) lehetővé teszi az igényeinek megfelelő AI-asszisztensek létrehozását egyéni utasítások és speciális eszközök, például kódértelmezők és egyéni függvények használatával. További információ:
- Gyors útmutató
- Alapelvek
- A Python részletes útmutatója
- Kódértelmező
- Függvényhívás
- Asszisztensek modellje és régióinak rendelkezésre állása
- Assistants Python > REST-referencia
- Asszisztensi minták
OpenAI text to speech voices public preview
Az Azure OpenAI szolgáltatás mostantól támogatja a szövegfelolvasási API-kat az OpenAI hangjával. Az AI által létrehozott beszéd lekérése a megadott szövegből. További információért tekintse meg az áttekintési útmutatót , és próbálja ki a rövid útmutatót.
Feljegyzés
Az Azure AI Speech támogatja az OpenAI szövegfelolvasást is. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.
Új finomhangolási képességek és modelltámogatás
Új regionális támogatás az Azure OpenAI on Your Data szolgáltatáshoz
Mostantól a következő Azure-régióban használhatja az Azure OpenAI On Your Data-t:
- Dél-Afrika északi régiója
Az Azure OpenAI on Your Data általános rendelkezésre állása
- Az Azure OpenAI az Ön adatain mostantól általánosan elérhető.
2023. december
Azure OpenAI az adatokon
- Az Azure OpenAI on Your Data teljes VPN- és privát végponttámogatása, beleértve a következő biztonsági támogatásokat: tárfiókok, Azure OpenAI-erőforrások és Azure AI-Search szolgáltatás-erőforrások.
- Új cikk az Azure OpenAI on Your Data biztonságos használatához az adatok virtuális hálózatokkal és privát végpontokkal való védelmével.
A GPT-4 Turbo és a Vision már elérhető
A GPT-4 Turbo és a Vision az Azure OpenAI szolgáltatásban nyilvános előzetes verzióban érhető el. A GPT-4 Turbo with Vision egy nagy multimodális modell (LMM), amelyet az OpenAI fejlesztett ki, amely képes képek elemzésére és szöveges válaszokat adni a velük kapcsolatos kérdésekre. A természetes nyelvi feldolgozást és a vizuális megértést egyaránt magában foglalja. A továbbfejlesztett móddal az Azure AI Vision funkcióival további megállapításokat hozhat létre a képekből.
- Ismerje meg a GPT-4 Turbo és a Vision képességeit kód nélküli környezetben az Azure OpenAI Playground használatával. További információ a rövid útmutatóban.
- A GPT-4 Turbo és a Vision használatával végzett látásjavítás már elérhető az Azure OpenAI-játszótéren, és támogatja az optikai karakterfelismerést, az objektumok földelését, az adatok hozzáadásának képtámogatását, valamint a videoüzenetek támogatását.
- Hívásokat kezdeményezhet közvetlenül a csevegő API-ba a REST API használatával.
- A régió rendelkezésre állása jelenleg csak ,
SwitzerlandNorth
SwedenCentral
,WestUS
ésAustraliaEast
- Tudjon meg többet a GPT-4 Turbo és a Vision ismert korlátairól és más gyakori kérdésekről.
2023. november
Új adatforrás-támogatás az Azure OpenAI On Your Data szolgáltatásban
- Mostantól adatforrásként használhatja az Azure Cosmos DB for MongoDB virtuális magot és URL-címeket/webcímeket az adatok betöltéséhez és a támogatott Azure OpenAI-modellel való csevegéshez.
GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 megjelent
Mindkét modell az OpenAI legújabb kiadása, továbbfejlesztett utasításkövetéssel, JSON móddal, reprodukálható kimenettel és párhuzamos függvényhívással.
A GPT-4 Turbo Preview maximális környezeti ablaka 128 000 token, és 4096 kimeneti jogkivonatot képes létrehozni. A legfrissebb betanítási adatokkal rendelkezik 2023 áprilisig. Ez a modell előzetes verzióban érhető el, és éles használatra nem ajánlott. Az előzetes verziójú modell összes központi telepítése automatikusan frissül, amint a stabil kiadás elérhetővé válik.
A GPT-3.5-Turbo-1106 maximális környezeti ablaka 16 385 token, és 4096 kimeneti jogkivonatot képes létrehozni.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
A modellek saját egyedi régiónkénti kvótakiosztásokkal rendelkeznek.
DALL-E 3 nyilvános előzetes verzió
A DALL-E 3 az OpenAI legújabb képgenerálási modellje. Jobb képminőséget, összetettebb jeleneteket és jobb teljesítményt nyújt a képeken lévő szövegek renderelése során. Emellett több méretarány-beállítással is rendelkezik. A DALL-E 3 az OpenAI Studióban és a REST API-on keresztül érhető el. Az OpenAI-erőforrásnak az SwedenCentral
Azure-régióban kell lennie.
A DALL-E 3 beépített gyors újraírást tartalmaz a képek javítása, az torzítás csökkentése és a természetes változatok növelése érdekében.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Felelős AI
Bővített ügyfélkonfiguráció: Mostantól minden Azure OpenAI-ügyfél konfigurálhatja az összes súlyossági szintet (alacsony, közepes, magas) a gyűlölet, az erőszak, a szexuális és az önsértés kategóriákhoz, beleértve a csak a nagy súlyosságú tartalmak szűrését is. Tartalomszűrők konfigurálása
Tartalom hitelesítő adatai az összes DALL-E modellben: Az összes DALL-E modellből származó AI által létrehozott képek mostantól tartalmaznak egy digitális hitelesítő adatot, amely mesterséges intelligenciával létrehozott módon teszi közzé a tartalmat. A képeszközöket megjelenítő alkalmazások a nyílt forráskód Content Authenticity Initiative SDK használatával jeleníthetik meg a hitelesítő adatokat a mesterséges intelligenciával létrehozott rendszerképeikben. Tartalom hitelesítő adatai az Azure OpenAI-ban
Új RAI-modellek
- Jailbreak-kockázatészlelés: A jailbreak-támadások olyan felhasználói kérések, amelyek a Generatív AI-modellt olyan viselkedések bemutatására késztetik, amelyeket a rendszerüzenetben beállított szabályok elkerülése vagy megszegése érdekében betanított. A jailbreak kockázatészlelési modell nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzetekben és szűrőmodellben érhető el. Felhasználói kéréseken fut.
- Védett anyagszöveg: A védett anyagszöveg ismert szöveges tartalmakat (például dalszövegeket, cikkeket, recepteket és kijelölt webes tartalmakat) ír le, amelyeket nagy nyelvi modellek képesek kiadni. A védett anyag szövegmodellje nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzet- és szűrőmodellben érhető el. LLM-befejezéseken fut.
- Védett anyagkód: A védett anyagkód olyan forráskódot ír le, amely megfelel a nyilvános adattárakból származó forráskódkészletnek, amelyet nagy nyelvi modellek a forrástárak megfelelő idézete nélkül is ki tudnak adni. A védett anyagkódmodell nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzetekben és szűrőmodellben érhető el. LLM-befejezéseken fut.
Tiltólisták: Az ügyfelek mostantól gyorsan testre szabhatják a tartalomszűrők viselkedését a kérések és befejezések esetében, ha egyéni tiltólistát hoznak létre a szűrőikben. Az egyéni tiltólista lehetővé teszi, hogy a szűrő végrehajtsa a műveletet a minták testre szabott listáján, például adott kifejezéseken vagy regex mintákon. Az egyéni blokklistákon kívül a Microsoft profanitási blokklistát (angol) is biztosítunk. Blokklisták használata
Október 2023.
Új finomhangolási modellek (előzetes verzió)
gpt-35-turbo-0613
mostantól elérhető a finomhangoláshoz.babbage-002
ésdavinci-002
már elérhetőek a finomhangoláshoz. Ezek a modellek helyettesítik az örökölt ada, babbage, curie és davinci alapmodelleket, amelyek korábban finomhangolhatóak voltak.A rendelkezésre állás finomhangolása bizonyos régiókra korlátozódik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
A finomhangolt modellek eltérő kvótakorlátokkal rendelkeznek, mint a normál modellek.
Azure OpenAI az adatokon
- Új egyéni paraméterek a lekért dokumentumok számának és szigorúságának meghatározásához.
- A szigorúsági beállítás a küszöbértéket úgy állítja be, hogy a dokumentumok a lekérdezések szempontjából relevánsnak minősüljenek.
- A lekért dokumentumok beállítása megadja a válaszok létrehozásához használt adatindexből származó legmagasabb pontszámú dokumentumok számát.
- Az adatok betöltésének/feltöltésének állapotát az Azure OpenAI Studióban tekintheti meg.
- Privát végpontok és VPN-ek támogatása blobtárolókhoz.
2023. szeptember
GPT-4
A GPT-4 és a GPT-4-32k mostantól minden Azure OpenAI Service-ügyfél számára elérhető. Az ügyfeleknek már nem kell a GPT-4 és a GPT-4-32k használatára alkalmazniuk a várakozási listát (a korlátozott hozzáférésű regisztrációs követelmények továbbra is érvényesek az összes Azure OpenAI-modellre). A rendelkezésre állás régiónként eltérő lehet. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
GPT-3.5 Turbo Instruct
Az Azure OpenAI Szolgáltatás mostantól támogatja a GPT-3.5 Turbo Instruct modellt. Ez a modell a Completions API-val összehasonlítható text-davinci-003
és használható teljesítménnyel rendelkezik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
A Whisper nyilvános előzetes verziója
Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI Whisper-modellje által működtetett beszédfelolvasási API-kat. Az AI által létrehozott szöveg lekérése a megadott beszédhang alapján. További információért tekintse meg a rövid útmutatót.
Feljegyzés
Az Azure AI Speech az OpenAI Whisper modelljét is támogatja a kötegelt átírási API-val. További információért tekintse meg a Köteg átírási útmutatót. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?
Új régiók
- Az Azure OpenAI mostantól svédországi középső és svájci északi régiókban is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Regionális kvótakorlátok növekedése
- Az egyes modellek és régiók maximális alapértelmezett kvótakorlátjának növelése. A számítási feladatoknak ezekre a modellekre és régiókra való migrálása lehetővé teszi a magasabb tokenek percenkénti (TPM) előnyeit.
2023. augusztus
Az Azure OpenAI saját adatainak (előzetes verzió) frissítései
- Most már üzembe helyezheti az Azure OpenAI-t az adatain a Power Virtual Agentsben.
- Az Azure OpenAI On Your Data mostantól támogatja a privát végpontokat.
- A bizalmas dokumentumokhoz való hozzáférés szűrésének képessége.
- Az index automatikus frissítése ütemezés szerint.
- Vektorkeresési és szemantikai keresési lehetőségek.
- Csevegési előzmények megtekintése az üzembe helyezett webalkalmazásban
2023. július
Függvényhívás támogatása
- Az Azure OpenAI mostantól támogatja a függvényhívást , hogy a csevegővégzítési API-ban együttműködhessen a függvényekkel.
Bemeneti tömb beágyazásának növelése
- Az Azure OpenAI mostantól támogatja az API-kérésenként legfeljebb 16 bemenettel rendelkező tömböket a text-embedding-ada-002 2-es verzióval.
Új régiók
- Az Azure OpenAI mostantól kanada keleti, USA 2. keleti régiójában, Kelet-Japánban és az USA északi középső régiójában is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
2023. június
Az Azure OpenAI használata saját adatokon (előzetes verzió)
- Az Azure OpenAI On Your Data előzetes verzióban érhető el, így olyan OpenAI-modellekkel cseveghet, mint a GPT-35-Turbo és a GPT-4, és az adatok alapján fogadhat válaszokat.
A gpt-35-turbo és a gpt-4 modellek új verziói
- gpt-35-turbo (0613-es verzió)
- gpt-35-turbo-16k (0613-es verzió)
- gpt-4 (0613-es verzió)
- gpt-4-32k (0613-es verzió)
Az Egyesült Királyság déli régiója
- Az Azure OpenAI már elérhető az Egyesült Királyság déli régiójában. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Tartalomszűrés és széljegyzetek (előzetes verzió)
- Tartalomszűrők konfigurálása az Azure OpenAI Szolgáltatással.
- Engedélyezze a széljegyzeteket a tartalomszűrés kategóriájának és súlyossági adatainak megtekintéséhez a GPT-alapú befejezési és csevegés-befejezési hívások részeként.
Kvóta
- A kvóta lehetővé teszi, hogy aktívan kezelje a díjkorlátok kiosztását az előfizetésen belüli üzemelő példányok között.
2023. május
Java > JavaScript SDK-támogatás
Az Azure OpenAI-csevegés befejezésének általános rendelkezésre állása (GA)
- Általános rendelkezésre állási támogatás:
- Csevegés befejezése API-verzió
2023-05-15
. - GPT-35-Turbo modellek.
- GPT-4 modellsorozat.
- Csevegés befejezése API-verzió
Ha jelenleg az API-t 2023-03-15-preview
használja, javasoljuk, hogy migráljon a GA 2023-05-15
API-ba. Ha jelenleg API-verziót 2022-12-01
használ, ez az API továbbra is ga marad, de nem tartalmazza a legújabb csevegés-befejezési képességeket.
Fontos
A GPT-35-Turbo modellek jelenlegi verzióinak használata a befejezési végponttal előzetes verzióban marad.
Közép-Franciaország
- Az Azure OpenAI már elérhető a franciaországi középső régióban. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
2023. április
DALL-E 2 nyilvános előzetes verzió. Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI DALL-E 2 modelljén alapuló képgenerálási API-kat. Mesterséges intelligenciával létrehozott képek lekérése a megadott leíró szöveg alapján. További információért tekintse meg a rövid útmutatót.
A testreszabott modellek inaktív üzembe helyezései 15 nap után törlődnek; modellek továbbra is elérhetők maradnak az újbóli üzembe helyezéshez. Ha egy testre szabott (finomhangolt) modell több mint tizenöt (15) napig van üzembe helyezve, amely alatt nem történik befejezési vagy csevegés-befejezési hívás, az üzembe helyezés automatikusan törlődik (és az üzembe helyezésért nem jár további üzemeltetési díj). A mögöttes testreszabott modell továbbra is elérhető marad, és bármikor újra üzembe helyezheti. További információért tekintse meg az útmutatót.
2023. március
A GPT-4 sorozatú modellek mostantól előzetes verzióban érhetők el az Azure OpenAI-ban. A hozzáférés kéréséhez a meglévő Azure OpenAI-ügyfelek az űrlap kitöltésével jelentkezhetnek. Ezek a modellek jelenleg az USA keleti régiójában és az USA déli középső régiójában érhetők el.
A GPT-35-Turbo és GPT-4 modellekhez készült új csevegés-befejezési API 3/21-es előzetes verzióban jelenik meg. További információkért tekintse meg a frissített rövid útmutatókat és útmutatókat.
GPT-35-Turbo előzetes. További részletekért tekintse meg az útmutatót.
Megnövelt betanítási korlátok a finomhangoláshoz: A betanítási feladat maximális mérete (a betanítási fájlban lévő tokenek) x (az alapidőszakok száma) 2 milliárd token az összes modellhez. A maximális betanítási feladatot 120 óráról 720 órára növeltük.
További használati esetek hozzáadása a meglévő hozzáféréshez. Korábban az új használati esetek hozzáadásának folyamata miatt az ügyfeleknek újra kellett alkalmazniuk a szolgáltatást. Most egy új folyamatot adunk ki, amely lehetővé teszi új használati esetek gyors hozzáadását a szolgáltatás használatához. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi. A meglévő ügyfelek itt bármilyen új használati esetet tanúsíthatnak. Vegye figyelembe, hogy erre akkor van szükség, ha olyan új használati esethez szeretné használni a szolgáltatást, amelyre eredetileg nem jelentkezett.
február 2023.
Új funkciók
- .NET SDK(következtetés) előzetes kiadási | minták
- Terraform SDK-frissítés az Azure OpenAI felügyeleti műveleteinek támogatásához.
- A paraméter mostantól támogatja a szöveg beillesztését a
suffix
befejezés végén.
Frissítések
- A tartalomszűrés alapértelmezés szerint be van kapcsolva.
Új cikkek:
Új tanfolyam:
2023. január
Új funkciók
Service GA. Az Azure OpenAI szolgáltatás általánosan elérhető.
Új modellek: A legújabb szöveges modell hozzáadása, text-davinci-003 (USA keleti régiója, Nyugat-Európa), text-ada-embeddings-002 (USA keleti régiója, USA déli középső régiója, Nyugat-Európa)
2022. december
Új funkciók
Az OpenAI legújabb modelljei. Az Azure OpenAI hozzáférést biztosít az összes legújabb modellhez, beleértve a GPT-3.5 sorozatot is.
Új API-verzió (2022-12-01). Ez a frissítés számos kért fejlesztést tartalmaz, többek között a jogkivonat-használati információkat az API-válaszban, a fájlokra vonatkozó továbbfejlesztett hibaüzeneteket, az OpenAI-val való igazítást a létrehozási adatstruktúra finomhangolásához, valamint az utótagparaméter támogatását a finomhangolt feladatok egyéni elnevezésének engedélyezéséhez.
Nagyobb kérelem másodpercenkénti korlát. 50 nem Davinci-modellek esetén. 20 Davinci-modellekhez.
Az üzemelő példányok gyorsabb finomhangolása. Ada és Curie finomhangolt modellek üzembe helyezése 10 perc alatt.
Magasabb betanítási korlátok: 40 M-nyi betanítási jogkivonatok az Ada, a Babbage és a Curie számára. 10M a Davinci.
A visszaélések és a helytelen használatú adatnaplózás módosításának kérése és az emberi felülvizsgálat folyamata. Ma a szolgáltatás naplózza a kérések/válaszok adatait a visszaélés és a visszaélés észlelése céljából, hogy ezek a hatékony modellek ne legyenek visszaélve. Azonban sok ügyfél szigorú adatvédelmi és biztonsági követelményekkel rendelkezik, amelyek nagyobb ellenőrzést igényelnek az adataik felett. Ezeknek a használati eseteknek a támogatásához egy új folyamatot bocsátunk ki az ügyfelek számára a tartalomszűrési szabályzatok módosítására vagy az alacsony kockázatú használati esetek visszaélésnaplózásának kikapcsolására. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi, és a meglévő OpenAI-ügyfelek itt is alkalmazhatók.
Ügyfél által felügyelt kulcs (CMK) titkosítása. A CMK a betanítási adatok és a testreszabott modellek tárolásához használt saját titkosítási kulcsok biztosításával nagyobb irányítást biztosít az ügyfelek számára az adatok Azure OpenAI-ban való kezelése felett. Az ügyfél által kezelt kulcsok (CMK) használata, amely Bring Your Own Key (BYOK, saját kulcs használata) módszerként is ismert, nagyobb rugalmasságot biztosít a hozzáférés-vezérlők létrehozása, rotálása, letiltása és visszavonása terén. Továbbá az adatok védelméhez használt titkosítási kulcsok naplózására is lehetősége van. További információ a inaktív állapotú titkosítási dokumentációnkból.
A Lockbox támogatása
SOC-2 megfelelőség
Naplózás és diagnosztika az Azure Resource Health, a Cost Analysis és a Metrics > Diagnosztikai beállítások használatával.
A Studio fejlesztései. A Studio-munkafolyamat számos használhatósági fejlesztése, köztük az Azure AD-szerepkör támogatása annak szabályozásához, hogy a csapatban kik férhetnek hozzá a finomhangolt modellek létrehozásához és üzembe helyezéséhez.
Módosítások (kompatibilitástörő)
A create API-kérés finomhangolása az OpenAI sémájának megfelelően lett frissítve.
Előzetes verziójú API-verziók:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
API 2022-12-01-es verzió:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
A tartalomszűrés alapértelmezés szerint átmenetileg ki van kapcsolva . Az Azure con sátormód ration másként működik, mint az Azure OpenAI. Az Azure OpenAI tartalomszűrőket futtat a generációs hívás során, hogy észlelje a káros vagy sértő tartalmakat, és szűrje őket a válaszból. Tudj meg többet
Ezek a modellek 2023 első negyedévében újra engedélyezve lesznek, és alapértelmezés szerint be vannak kapcsolva.
Ügyfélműveletek
- Ha szeretné, hogy ezek be vannak kapcsolva az előfizetéshez, lépjen kapcsolatba az Azure ügyfélszolgálatával .
- Ha szeretné, hogy a módosítások továbbra is ki legyenek kapcsolva, alkalmazza a szűrési módosításokat. (Ez a beállítás csak alacsony kockázatú használati esetekre vonatkozik.)
Következő lépések
További információ az Azure OpenAI-t használó mögöttes modellekről.