esemény
Intelligens alkalmazások létrehozása
márc. 17. 21 - márc. 21. 10
Csatlakozzon a meetup sorozathoz, hogy valós használati esetek alapján, skálázható AI-megoldásokat hozzon létre más fejlesztőkkel és szakértőkkel.
RegisztrációEzt a böngészőt már nem támogatjuk.
Frissítsen a Microsoft Edge-re, hogy kihasználhassa a legújabb funkciókat, a biztonsági frissítéseket és a technikai támogatást.
Ez a cikk az Azure OpenAI Szolgáltatás legújabb kiadásainak és főbb dokumentációs frissítéseinek összegzését tartalmazza.
o3-mini
már elérhető a globális szabványhoz, és a regisztrált korlátozott hozzáférésű ügyfelek számára az adatzóna standard üzemelő példányaihoz. Az adatszabvány üzembehelyezési régiói jelenleg csak Egyesült Államok régiók.
További információt az érvelési modell útmutatójában talál.
A gpt-4o-mini-audio-preview
(2024-12-17) modell a legújabb hangkiegészítési modell. További információkért tekintse meg a hanggenerálási rövid útmutatót.
A gpt-4o-mini-realtime-preview
(2024-12-17) modell a legújabb valós idejű hangmodell. A valós idejű modellek ugyanazt a mögöttes GPT-4o hangmodellt használják, mint a befejezési API, de alacsony késésű, valós idejű hang interakciókra van optimalizálva. További információkért tekintse meg a valós idejű hangalapú gyorsútmutatót.
Az elérhető modellekről további információt a modellek és a verziók dokumentációjában talál.
o3-mini
(2025-01-31) a legújabb érvelési modell, amely továbbfejlesztett érvelési képességeket kínál. További információt az érvelési modell útmutatójában talál.
A gpt-4o-audio-preview
modell már elérhető az USA 2. keleti régiójában és Svédország középső régióiban történő globális üzembe helyezéshez. Használja a modellt a gpt-4o-audio-preview
hanggeneráláshoz.
A gpt-4o-audio-preview
modell bevezeti a hangmoderitást a meglévő /chat/completions
API-ba. A hangmodell kibővíti az AI-alkalmazások lehetőségeit a szöveg- és hangalapú interakciókban és a hangelemzésben. A modellben gpt-4o-audio-preview
támogatott módok a következők: szöveg, hang és szöveg + hang. További információkért tekintse meg a hanggenerálási rövid útmutatót.
Megjegyzés
A Realtime API ugyanazt a mögöttes GPT-4o hangmodellt használja, mint a befejezési API, de alacsony késleltetésű, valós idejű hang interakciókra van optimalizálva.
A gpt-4o-realtime-preview
modell 2024-12-17-es verziója az USA 2. keleti régiójában és Svédország középső régióiban üzemelő globális üzemelő példányokhoz érhető el. Valós idejű hang interakciókhoz használja a gpt-4o-realtime-preview
2024-12-17-es verziójú modellt a gpt-4o-realtime-preview
2024-10-01-es verzió helyett.
gpt-4o-realtime-preview
gyorsítótárazásának támogatása hozzáadva.gpt-4o-realtime-preview
modellek most a következő hangokat támogatják: "ötvözet", "hamu", "ballada", "korall", "echo", "zsálya", "csillám", "vers".gpt-4o-realtime-preview
modellhez. Az egyes gpt-4o-realtime-preview
modellek üzembe helyezésének sebességkorlátjai 100 000 TPM és 1K RPM. Az előzetes verzióban előfordulhat, hogy az Azure AI Foundry portál és az API-k pontatlanul mutatnak eltérő díjszabási korlátokat. Még ha más sebességkorlátot is próbál beállítani, a tényleges sebességkorlát 100 000 TPM és 1K RPM lesz.További információ: GPT-4o valós idejű hang gyorsútmutató és útmutató.
A legújabb o1
modell már elérhető AZ API-hozzáféréshez és a modell üzembe helyezéséhez.
Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva. Azok az ügyfelek, akik korábban alkalmazták és hozzáféréssel o1-preview
rendelkeztek, nem kell újból alkalmazniuk őket, mivel automatikusan szerepelnek a legújabb modell várakozási listájában.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Ha többet szeretne megtudni a speciális o1
sorozatmodellekről, tekintse meg az o1 sorozatok érvelési modelljeinek első lépéseit.
Modell | Régió |
---|---|
o1 (Verzió: 2024-12-17) |
USA2 keleti régiója (globális szabvány) Svédország középső régiója (Global Standard) |
A közvetlen preferenciák optimalizálása (DPO) egy új igazítási technika a nagy nyelvi modellekhez, amelyek úgy lettek kialakítva, hogy a modell súlyát az emberi beállítások alapján igazítsák. Az emberi visszajelzésekből (RLHF) származó megerősítési tanulástól eltérően a DPO nem igényel jutalommodellt, és egyszerűbb adatokat (bináris beállításokat) használ a betanításhoz. Ez a módszer számítási szempontból könnyebb és gyorsabb, így ugyanolyan hatékony az igazítás során, miközben hatékonyabb. A DPO különösen olyan helyzetekben hasznos, ahol a szubjektív elemek, például a hang, a stílus vagy a konkrét tartalombeállítások fontosak. Örömmel jelentjük be a DPO nyilvános előzetes verzióját az Azure OpenAI Service-ben, kezdve a gpt-4o-2024-08-06
modellel.
A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.
A tárolt befejezésekkel rögzítheti a csevegés befejező munkameneteinek beszélgetési előzményeit, és adatkészletként használhatja az értékeléshez és a finomhangoláshoz.
gpt-4o-2024-11-20
már elérhető a globális standard üzembe helyezéshez a következő helyen:
Az adatzóna által kiépített üzembe helyezések ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-telepítési típus, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat a Microsoft által meghatározott adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna kiépített üzembe helyezései fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez a Microsoft által megadott adatzónákon belüli Azure-infrastruktúra használatával. Az adatzóna kiépített üzemelő példányai támogatottak a , gpt-4o-2024-05-13
és gpt-4o-mini-2024-07-18
modellekengpt-4o-2024-08-06
.
További információt az üzembehelyezési típusok útmutatójában talál.
Vision finomhangolás GPT-4o (2024-08-06) most általánosan elérhető (GA).
A látás finomhangolásával képeket adhat a JSONL betanítási adataihoz. Ugyanúgy, ahogy egy vagy több képbemenetet küldhet a csevegés befejezéséhez, ugyanezeket az üzenettípusokat is belefoglalhatja a betanítási adatokba. A rendszerképek URL-címként vagy base64 kódolású rendszerképként is megadhatóak.
A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.
A visszaélések monitorozásának új formáit vezetjük be, amelyek llM-eket használnak az Azure OpenAI szolgáltatás potenciálisan visszaélésszerű használatának észlelésének hatékonyságának javítására, valamint a visszaélések monitorozásának engedélyezésére anélkül, hogy emberi felülvizsgálatra van szükség az utasításokat és kiegészítéseket. További információ: Visszaélések monitorozása.
A tartalombesorolással megjelölt és/vagy vélhetően visszaélésszerű használati minta részeként megjelölt kéréseket és kiegészítéseket egy további felülvizsgálati folyamatnak vetik alá, amely segít megerősíteni a rendszer elemzését, és tájékoztatni a műveleti döntéseket. A visszaélések monitorozási rendszereit kiterjesztettük, hogy az LLM alapértelmezés szerint, szükség esetén pedig az emberek számára is lehetővé tegye a felülvizsgálatot.
Az adatzóna standard üzemelő példányai ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-üzembe helyezési típus, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat a Microsoft által definiált adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna-szabvány magasabb alapértelmezett kvótákat biztosít, mint az Azure földrajzi alapú üzembe helyezési típusai. Az adatzóna standard üzemelő példányai támogatottak a modelleken gpt-4o-2024-05-13
és gpt-4o-mini-2024-07-18
a modellekengpt-4o-2024-08-06
.
További információt az üzembehelyezési típusok útmutatójában talál.
Az Azure OpenAI globális köteg általánosan elérhető.
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
A o1-preview
modellek mostantól o1-mini
elérhetők API-hozzáféréshez és modelltelepítéshez.
Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
Azok az ügyfelek, akik már jóváhagyták a modellt, és hozzáféréssel rendelkeznek a modellhez a korai hozzáférésű játszótéren keresztül, nem kell újra alkalmazniuk, automatikusan API-hozzáférést kapnak. A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.
API-támogatás:
Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-preview
lett hozzáadva.
A max_tokens
paraméter elavult, és az új max_completion_tokens
paraméterre cserélődött.
o1 sorozatú modellek csak a max_completion_tokens
paraméterrel működnek.
Régió rendelkezésre állása:
A modellek az USA 2. keleti régiójában és a Svédország középső régiójában a standard és globális standard üzembe helyezéshez érhetők el a jóváhagyott ügyfelek számára.
Az Azure OpenAI GPT-4o audio a GPT-4o modellcsalád része, amely támogatja az alacsony késleltetésű, "beszéd, beszéd kihangosító" beszélgetési interakciókat. A GPT-4o audio realtime
API valós idejű, kis késésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas a felhasználó és a modell közötti élő interakciókat, például az ügyfélszolgálati ügynököket, a hangsegédeket és a valós idejű fordítókat érintő használati esetekhez.
A gpt-4o-realtime-preview
modell az USA 2. keleti régiójában és Svédország középső régióiban üzemelő globális üzemelő példányokhoz érhető el.
További információkért tekintse meg a GPT-4o valós idejű hangalapú gyorsútmutatót.
A globális köteg mostantól támogatja a GPT-4o-t (2024-08-06). További információt a globális köteg első lépéseinek útmutatójában talál.
2024. szeptember 19-én az Azure OpenAI Studio megnyitásakor alapértelmezés szerint nem jelenik meg az örökölt Azure OpenAI Studio. Ha szükséges, a felhasználói felület felső sávjában a Következő néhány hétre a Switch to the old look váltógombbal visszatérhet az előző élményhez. Ha visszaáll az örökölt Azure AI Foundry portálra, az segít, ha kitölti a visszajelzési űrlapot, hogy tudassa velünk, miért. Aktívan figyeljük ezt a visszajelzést az új élmény javítása érdekében.
A GPT-4o 2024-08-06 már elérhető az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban üzembe helyezéshez. Globális üzembe helyezésekhez is elérhető.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális üzembe helyezési típusok, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat az adatközpontba, és minden kéréshez a legjobb rendelkezésre állást biztosíthassa. A globális kiépített üzemelő példányok fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez az Azure globális infrastruktúrájának használatával. A globálisan kiépített üzembe helyezéseket és modelleket gpt-4o-2024-08-06
gpt-4o-mini-2024-07-18
támogatjuk.
További információt az üzembehelyezési típusok útmutatójában talál.
Az Azure OpenAI o1-preview
és o1-mini
a modellek célja az érvelési és problémamegoldási feladatok kezelése nagyobb összpontosítással és képességgel. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.
o1-preview
: o1-preview
a sorozatmodellek o1
jobban alkalmasak.o1-mini
: o1-mini
a sorozatmodellek o1
gyorsabb és olcsóbb.Modellverzió: 2024-09-12
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A o1
sorozatmodellek jelenleg előzetes verzióban érhetők el, és nem tartalmaznak más modellekben elérhető funkciókat, például a képfelismerést és a strukturált kimeneteket, amelyek a legújabb GPT-4o modellben érhetők el. Sok feladat esetén az általánosan elérhető GPT-4o modellek még mindig megfelelőbbek lehetnek.
Az OpenAI további biztonsági intézkedéseket is beépített a o1
modellekbe, beleértve az új technikákat, amelyekkel a modellek elutasíthatják a nem biztonságos kéréseket. Ezek a fejlesztések teszik elérhetővé a o1
sorozatot a leg robusztusabb modellek közül.
o1-mini
Az o1-preview
AZURE AI Foundry portál korai hozzáférésű játszóterén keresztül korlátozott hozzáférés érhető el az USA 2. keleti régiójában. A modellek adatfeldolgozása o1
más régióban fordulhat elő, mint ahol azok használhatók.
A korai hozzáférésű játszótéren való kipróbálásához o1-preview
o1-mini
regisztrálni kell a modelleket, és a hozzáférést a Microsoft jogosultsági feltételei alapján biztosítjuk.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A hozzáférés megadása után a következőkre lesz szüksége:
eastus2
régióban. Ha ebben a régióban nincs Azure OpenAI-erőforrása, létre kell hoznia egyet.eastus2
Azure OpenAI-erőforrást, a bal felső panelen válassza a Korai hozzáférésű játszótér (előzetes verzió) lehetőséget.A GPT-4o mini már elérhető a kiépített üzembe helyezésekhez Kanada keleti régiójában, az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban.
A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A GPT-4o finomhangolása mostantól nyilvános előzetes verzióban elérhető az Azure OpenAI-hoz az USA északi középső régiójában és a Svédország középső régiójában.
További információkért tekintse meg blogbejegyzésünket.
Az API-verzió 2024-07-01-preview
a dataplane legújabb szerzői és következtetési API-kiadása. Lecseréli az API-verziót 2024-05-01-preview
, és támogatja a következőket:
max_num_results
a fájlkereső eszköz kimenetének kell lennie.További információkért tekintse meg referenciadokumentációnkat
2024. augusztus 6-án az OpenAI bejelentette a gpt-4o-modell legújabb verzióját 2024-08-06
. A GPT-4o 2024-08-06
az előző verzió összes képességével rendelkezik, valamint:
Az Azure-ügyfelek ma tesztelhetik a GPT-4o-t 2024-08-06
az új Azure AI Foundry korai hozzáférésű játszótéren (előzetes verzió).
Az előző korai hozzáférésű játszótértől eltérően az Azure AI Foundry portál korai hozzáférésű játszótere (előzetes verzió) nem igényel erőforrást egy adott régióban.
Megjegyzés
A korai hozzáférésű játszótéren (előzetes verzió) végrehajtott kérések és kiegészítések bármely Azure OpenAI-régióban feldolgozhatók, és jelenleg percenként 10 kérésre vonatkoznak Azure-előfizetési korlátonként. Ez a korlát a jövőben változhat.
Az Azure OpenAI szolgáltatással való visszaélés monitorozása minden korai hozzáférésű játszótér-felhasználó számára engedélyezve van, még akkor is, ha jóváhagyást ad a módosításra; az alapértelmezett tartalomszűrők engedélyezve vannak, és nem módosíthatók.
A GPT-4o 2024-08-06
teszteléséhez jelentkezzen be az Azure AI korai hozzáférésű játszóterére (előzetes verzió) ezen a hivatkozáson keresztül.
Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.
Főbb használati esetek:
Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.
Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.
Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.
Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.
Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.
Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.
Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.
További információ a globális kötegtelepítések használatának megkezdéséről.
A GPT-4o mini finomhangolás mostantól nyilvános előzetes verzióban érhető el Svédország középső régiójában és az USA északi középső régiójában.
Az Asszisztensek fájlkereső eszközének használatáért most további díjakat kell fizetnie. További információkért tekintse meg a díjszabási oldalt .
A GPT-4o mini a legújabb Azure OpenAI-modell, amelyet először 2024. július 18-án jelentettek be:
"A GPT-4o mini lehetővé teszi az ügyfelek számára, hogy lenyűgöző alkalmazásokat nyújtsanak alacsonyabb áron, villámgyorsan. A GPT-4o mini jelentősen intelligensebb, mint a GPT-3.5 Turbo – 82%-os pontszámot ért el a Massive Multitask Language Understanding (MMLU) mérése terén a 70%-hoz képest, és több mint 60%-kal olcsóbb.1 A modell kibővített 128K környezeti ablakot biztosít, és integrálja a GPT-4o továbbfejlesztett többnyelvű képességeit, így jobb minőséget biztosít a nyelveknek a világ minden tájáról."
A modell jelenleg az USA keleti régiójában standard és globális standard üzembe helyezéshez is elérhető.
A modellkvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalt , és a modell elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
Az új alapértelmezett tartalomszűrési szabályzat DefaultV2
biztosítja a GPT-modellsorozat (szöveg) legújabb biztonsági és biztonsági megoldásait, beleértve a következőket:
Bár a meglévő erőforrások és üzemelő példányok tartalomszűrői nem változnak (az alapértelmezett vagy egyéni tartalomszűrési konfigurációk változatlanok maradnak), az új erőforrások és a GPT-környezetek automatikusan öröklik az új tartalomszűrési szabályzatot DefaultV2
. Az ügyfeleknek lehetőségük van váltani a biztonsági alapértékek között, és egyéni tartalomszűrési konfigurációkat hozhatnak létre.
További információért tekintse meg az Alapértelmezett biztonsági szabályzat dokumentációját .
Az API-verzió 2024-06-01
a ga adatsík legújabb következtetési API-kiadása. Lecseréli az API-verziót 2024-02-01
, és támogatja a következőket:
encoding_format
> dimensions
paraméterek.logprobs
top_logprobs
paraméterek.További információért tekintse meg az adatsík következtetési referenciadokumentációját .
A GPT-4o mostantól a következő globális standard üzemelő példányokhoz érhető el:
A globális standard kvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalát.
gpt-35-turbo
.gpt-35-turbo-16k
0613-ra frissítve gpt-35-turbo
2024. október 1-ére.gpt-4-32k
0314 elavulási dátum 2024. október 1-ről 2025. június 6-ra frissült gpt-4
.A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A Szálak és fájlok az asszisztensekben mostantól támogatja a CMK-t a következő régióban:
gpt-4o
Verzió: 2024-05-13
standard és kiépített üzemelő példányokhoz is elérhető. A kiépített és a standard modell üzembe helyezései szöveges és kép-/látásbeli következtetési kéréseket is elfogadnak.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a kiépített üzemelő példányok modellmátrixát.
Az Assistants API frissítése mostantól nyilvánosan elérhető. A következő frissítéseket tartalmazza:
tool_choice
paramétert, amely arra kényszeríti az Asszisztenst, hogy egy megadott eszközt használjon.
Mostantól létrehozhat üzeneteket a segédszerepkörrel , hogy egyéni beszélgetési előzményeket hozzon létre a szálakban.temperature
A , top_p
response_format
paraméterek támogatása.GPTAssistantAgent
, amellyel zökkenőmentesen adhat hozzá asszisztenseket az AutoGen-alapú többügynök-munkafolyamatokhoz. Ez lehetővé teszi, hogy több Olyan Azure OpenAI-asszisztens is legyen, amely feladatra vagy tartományra specializálódott az összetett feladatok együttműködésére és kezelésére.gpt-3.5-turbo-0125
modellek támogatása a következő régiókban: További információt az asszisztensekről szóló blogbejegyzésben talál.
A GPT-4o ("o is for "omni") az OpenAI legújabb modellje, amely 2024. május 13-án jelent meg.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális ajánlatok, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat az adatközpontba az egyes kérések legjobb rendelkezésre állása mellett. A globális szabvány a legmagasabb alapértelmezett kvótát biztosítja az új modellekhez, és szükségtelenné teszi a terheléselosztást több erőforrás között.
További információt az üzembehelyezési típusok útmutatójában talál.
2024-05-01-preview
támogatást nyújtott a magokhoz, eseményekhez, teljes érvényesítési statisztikákhoz és ellenőrzőpontokhoz.Hozzon létre egyéni tartalomszűrőket a DALL-E 2 és 3, a GPT-4 Turbo és a Vision GA (turbo-2024-04-09
) és a GPT-4o üzemelő példányokhoz.
Tartalomszűrés
A szűrők aszinkron futtatása a streamelési forgatókönyvek jobb késése érdekében mostantól minden Azure OpenAI-ügyfél számára elérhető. Tartalomszűrés
Az Prompt Shields az Azure OpenAI-modellek által üzemeltetett alkalmazásokat kétféle támadástól védi: közvetlen (jailbreak) és közvetett támadásoktól. A közvetett támadások (más néven indirekt parancssori támadások vagy tartományközi parancssori injektálási támadások) a Generatív AI-modellek által üzemeltetett rendszerek elleni támadástípusok, amelyek akkor fordulhatnak elő, ha egy alkalmazás olyan információkat dolgoz fel, amelyeket nem közvetlenül az alkalmazás fejlesztője vagy a felhasználó készített. Tartalomszűrés
A GPT-4 Turbo legújabb GA kiadása a következő:
gpt-4
Verzió:turbo-2024-04-09
Ez a következő előzetes modellek lecserélése:
gpt-4
Verzió:1106-Preview
gpt-4
Verzió:0125-Preview
gpt-4
Verzió:vision-preview
0409
turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak.turbo-2024-04-09
verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküli image_url
és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.gpt-4
:turbo-2024-04-09
. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.Fontos
Vision fejlesztések előzetes funkciók, beleértve az optikai karakterfelismerés (OCR), objektum földelés, video parancssorok lesznek kivonva, és már nem érhető el, ha gpt-4
verzió: vision-preview
frissítve turbo-2024-04-09
van. Ha jelenleg ezen előzetes verziójú funkciók bármelyikére támaszkodik, ez az automatikus modellfrissítés kompatibilitástörő változás lesz.
gpt-4
Verzió:turbo-2024-04-09
standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.A GA-modell üzembe helyezéséhez az Azure AI Foundry portálon válassza ki GPT-4
, majd válassza ki a turbo-2024-04-09
verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09
GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.
A finomhangolás mostantól a következő támogatással érhető el:
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)babbage-002
davinci-002
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)Az egyes régiókban a modellek elérhetőségével és a támogatás finomhangolásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.
A finomhangolás mostantól támogatja a többfordulós csevegéses betanítási példákat.
Most már használhatja a GPT-4 (0125) modellt az elérhető régiókban az Azure OpenAI On Your Data használatával.
Az Azure OpenAI Studio mostantól egy Kockázat és biztonság irányítópultot biztosít minden olyan üzemelő példányhoz, amely tartalomszűrő-konfigurációt használ. Ezzel ellenőrizheti a szűrési tevékenység eredményeit. Ezután módosíthatja a szűrőkonfigurációt, hogy jobban kiszolgálja az üzleti igényeket, és megfeleljen a felelős AI-alapelveknek.
Kockázatok és biztonság monitorozásának használata
Ez a legújabb GA API-kiadás, és az előző 2023-05-15
GA-kiadás lecserélése. Ez a kiadás támogatja az Azure OpenAI GA legújabb funkcióit, például a Whisperet, a DALLE-3-at és a finomhangolást az adatokon.
Az előzetes verziójú funkciókhoz, például az Asszisztensekhez, a szövegfelolvasáshoz (TTS) és az "adatokon" lévő adatforrásokhoz előzetes verziójú API-verzióra van szükség. További információt az API-verzió életciklus-útmutatójában talál.
A Whisper speech to text modell mostantól a REST és a Python esetében is ga. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a Whisperet egy rövid útmutató követésével.
A DALL-E 3 képgenerálási modell mostantól a REST és a Python számára is elérhető. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Most már elérheti a DALL-E 3-at egy Azure OpenAI-erőforrással a vagy AustraliaEast
az East US
Azure-régióban, amellett, hogy SwedenCentral
.
Hozzáadtunk egy lapot, amely nyomon követi a modellek elavulását és kivonását az Azure OpenAI szolgáltatásban. Ez a lap a jelenleg elérhető, elavult és kivezetett modellekről nyújt tájékoztatást.
2024-03-01-preview
ugyanazokkal a funkciókkal rendelkezik, mint 2024-02-15-preview
a beágyazásokhoz, és két új paramétert ad hozzá:
encoding_format
lehetővé teszi a beágyazások létrehozására vonatkozó formátum megadását a (vagybase64
) fájlbanfloat
. Az alapértelmezett érték float
.dimensions
lehetővé teszi a kimeneti beágyazások számának beállítását. Ezt a paramétert csak az új, harmadik generációs beágyazási modellek támogatják: text-embedding-3-large
, text-embedding-3-small
. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions
paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, a paraméter kihasználásához javasoljuk, hogy frissítsen a legújabb verzióra: pip install openai --upgrade
.Ha jelenleg egy előzetes verziójú API-verziót használ a legújabb funkciók kihasználásához, javasoljuk, hogy tekintse meg az API-verzió életciklusáról szóló cikket, amely nyomon követi, hogy a jelenlegi API-verzió mennyi ideig lesz támogatott.
A 2024. március 8-ra ütemezett 1106 előzetes verzió gpt-4
0125-ös előzetes verzióra való központi telepítése gpt-4
már nem történik meg.
gpt-4
Az 1106-os és 0125-ös előzetes verzió "Automatikus frissítés alapértelmezettre" és "Frissítés lejárt" értékre állítása a modell stabil verziójának kiadása után kezdődik.
A frissítési folyamatról további információt a modellek oldalán talál.
Ez a modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
text-embedding-3-large
text-embedding-3-small
A tesztelés során az OpenAI-jelentések a nagy és a kis harmadik generációs beágyazási modellek is jobb átlagos többnyelvű lekérési teljesítményt nyújtanak a MIRACL-teljesítményteszttel, miközben az angol feladatok teljesítménye továbbra is jobb az MTEB-teljesítményteszttel, mint a második generációs text-embedding-ada-002 modell.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
A GPT-3.5-Turbo modellek (beleértve a 16k-ot is) különböző verziói közötti migrálás egyszerűsítése érdekében az összes GPT-3.5-Turbo-kvótát egyetlen kvótaértékbe összesítjük.
Azoknak az ügyfeleknek, akik a kvóta növelését jóváhagyták, az előző növekedéseket tükröző összesített kvótával fognak rendelkezni.
Minden olyan ügyfél, akinek a modellverziók jelenlegi teljes kihasználtsága kisebb az alapértelmezettnél, alapértelmezés szerint új összesített teljes kvótát kap.
A gpt-4
modell verziója 0125-preview
már elérhető az Usa keleti régiójában, az USA északi középső régiójában és az USA déli középső régiójában található Azure OpenAI szolgáltatásban. A verzióterjesztéssel gpt-4
1106-preview
rendelkező ügyfeleket a következő hetekben automatikusan frissítjük 0125-preview
.
A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.
Az Azure OpenAI mostantól támogatja az OpenAI GPT-jét használó API-t. Az Azure OpenAI Assistants (előzetes verzió) lehetővé teszi az igényeinek megfelelő AI-asszisztensek létrehozását egyéni utasítások és speciális eszközök, például kódértelmezők és egyéni függvények használatával. További információ:
Az Azure OpenAI szolgáltatás mostantól támogatja a szövegfelolvasási API-kat az OpenAI hangjával. Az AI által létrehozott beszéd lekérése a megadott szövegből. További információért tekintse meg az áttekintési útmutatót , és próbálja ki a rövid útmutatót.
Megjegyzés
Az Azure AI Speech támogatja az OpenAI szövegfelolvasást is. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.
Mostantól a következő Azure-régióban használhatja az Azure OpenAI On Your Data-t:
A GPT-4 Turbo és a Vision az Azure OpenAI szolgáltatásban nyilvános előzetes verzióban érhető el. A GPT-4 Turbo with Vision egy nagy multimodális modell (LMM), amelyet az OpenAI fejlesztett ki, amely képes képek elemzésére és szöveges válaszokat adni a velük kapcsolatos kérdésekre. A természetes nyelvi feldolgozást és a vizuális megértést egyaránt magában foglalja. A továbbfejlesztett móddal az Azure AI Vision funkcióival további megállapításokat hozhat létre a képekből.
SwitzerlandNorth
SwedenCentral
, WestUS
ésAustraliaEast
Mindkét modell az OpenAI legújabb kiadása, továbbfejlesztett utasításkövetéssel, JSON móddal, reprodukálható kimenettel és párhuzamos függvényhívással.
A GPT-4 Turbo Preview maximális környezeti ablaka 128 000 token, és 4096 kimeneti jogkivonatot képes létrehozni. A legfrissebb betanítási adatokkal rendelkezik 2023 áprilisig. Ez a modell előzetes verzióban érhető el, és éles használatra nem ajánlott. Az előzetes verziójú modell összes központi telepítése automatikusan frissül, amint a stabil kiadás elérhetővé válik.
A GPT-3.5-Turbo-1106 maximális környezeti ablaka 16 385 token, és 4096 kimeneti jogkivonatot képes létrehozni.
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.
A modellek saját egyedi régiónkénti kvótakiosztásokkal rendelkeznek.
A DALL-E 3 az OpenAI legújabb képgenerálási modellje. Jobb képminőséget, összetettebb jeleneteket és jobb teljesítményt nyújt a képeken lévő szövegek renderelése során. Emellett több méretarány-beállítással is rendelkezik. A DALL-E 3 az OpenAI Studióban és a REST API-on keresztül érhető el. Az OpenAI-erőforrásnak az SwedenCentral
Azure-régióban kell lennie.
A DALL-E 3 beépített gyors újraírást tartalmaz a képek javítása, az torzítás csökkentése és a természetes változatok növelése érdekében.
Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.
Bővített ügyfélkonfiguráció: Mostantól minden Azure OpenAI-ügyfél konfigurálhatja az összes súlyossági szintet (alacsony, közepes, magas) a gyűlölet, az erőszak, a szexuális és az önsértés kategóriákhoz, beleértve a csak a nagy súlyosságú tartalmak szűrését is. Tartalomszűrők konfigurálása
Tartalom hitelesítő adatai az összes DALL-E modellben: Az összes DALL-E modellből származó AI által létrehozott képek mostantól tartalmaznak egy digitális hitelesítő adatot, amely mesterséges intelligenciával létrehozott módon teszi közzé a tartalmat. A képeszközöket megjelenítő alkalmazások a nyílt forráskód Content Authenticity Initiative SDK használatával jeleníthetik meg a hitelesítő adatokat a mesterséges intelligenciával létrehozott rendszerképeikben. Tartalom hitelesítő adatai az Azure OpenAI-ban
Új RAI-modellek
Tiltólisták: Az ügyfelek mostantól gyorsan testre szabhatják a tartalomszűrők viselkedését a kérések és befejezések esetében, ha egyéni tiltólistát hoznak létre a szűrőikben. Az egyéni tiltólista lehetővé teszi, hogy a szűrő végrehajtsa a műveletet a minták testre szabott listáján, például adott kifejezéseken vagy regex mintákon. Az egyéni blokklistákon kívül a Microsoft profanitási blokklistát (angol) is biztosítunk. Blokklisták használata
gpt-35-turbo-0613
mostantól elérhető a finomhangoláshoz.
babbage-002
és davinci-002
már elérhetőek a finomhangoláshoz. Ezek a modellek helyettesítik az örökölt ada, babbage, curie és davinci alapmodelleket, amelyek korábban finomhangolhatóak voltak.
A rendelkezésre állás finomhangolása bizonyos régiókra korlátozódik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
A finomhangolt modellek eltérő kvótakorlátokkal rendelkeznek, mint a normál modellek.
A GPT-4 és a GPT-4-32k mostantól minden Azure OpenAI Service-ügyfél számára elérhető. Az ügyfeleknek már nem kell a GPT-4 és a GPT-4-32k használatára alkalmazniuk a várakozási listát (a korlátozott hozzáférésű regisztrációs követelmények továbbra is érvényesek az összes Azure OpenAI-modellre). A rendelkezésre állás régiónként eltérő lehet. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Az Azure OpenAI Szolgáltatás mostantól támogatja a GPT-3.5 Turbo Instruct modellt. Ez a modell a Completions API-val összehasonlítható text-davinci-003
és használható teljesítménnyel rendelkezik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.
Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI Whisper-modellje által működtetett beszédfelolvasási API-kat. Az AI által létrehozott szöveg lekérése a megadott beszédhang alapján. További információért tekintse meg a rövid útmutatót.
Megjegyzés
Az Azure AI Speech az OpenAI Whisper modelljét is támogatja a kötegelt átírási API-val. További információért tekintse meg a Köteg átírási útmutatót. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?
2023-05-15
.Ha jelenleg az API-t 2023-03-15-preview
használja, javasoljuk, hogy migráljon a GA 2023-05-15
API-ba. Ha jelenleg API-verziót 2022-12-01
használ, ez az API továbbra is ga marad, de nem tartalmazza a legújabb csevegés-befejezési képességeket.
Fontos
A GPT-35-Turbo modellek jelenlegi verzióinak használata a befejezési végponttal előzetes verzióban marad.
DALL-E 2 nyilvános előzetes verzió. Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI DALL-E 2 modelljén alapuló képgenerálási API-kat. Mesterséges intelligenciával létrehozott képek lekérése a megadott leíró szöveg alapján. További információért tekintse meg a rövid útmutatót.
A testreszabott modellek inaktív üzembe helyezései 15 nap után törlődnek; modellek továbbra is elérhetők maradnak az újbóli üzembe helyezéshez. Ha egy testre szabott (finomhangolt) modell több mint tizenöt (15) napig van üzembe helyezve, amely alatt nem történik befejezési vagy csevegés-befejezési hívás, az üzembe helyezés automatikusan törlődik (és az üzembe helyezésért nem jár további üzemeltetési díj). A mögöttes testreszabott modell továbbra is elérhető marad, és bármikor újra üzembe helyezheti. További információért tekintse meg az útmutatót.
A GPT-4 sorozatú modellek mostantól előzetes verzióban érhetők el az Azure OpenAI-ban. A hozzáférés kéréséhez a meglévő Azure OpenAI-ügyfelek az űrlap kitöltésével jelentkezhetnek. Ezek a modellek jelenleg az USA keleti régiójában és az USA déli középső régiójában érhetők el.
A GPT-35-Turbo és GPT-4 modellekhez készült új csevegés-befejezési API 3/21-es előzetes verzióban jelenik meg. További információért tekintse meg a frissített rövid útmutatókat és útmutatókat.
GPT-35-Turbo előzetes. További információért tekintse meg az útmutatót.
Megnövelt betanítási korlátok a finomhangoláshoz: A betanítási feladat maximális mérete (a betanítási fájlban lévő tokenek) x (az alapidőszakok száma) 2 milliárd token az összes modellhez. A maximális betanítási feladatot 120 óráról 720 órára növeltük.
További használati esetek hozzáadása a meglévő hozzáféréshez. Korábban az új használati esetek hozzáadásának folyamata miatt az ügyfeleknek újra kellett alkalmazniuk a szolgáltatást. Most egy új folyamatot adunk ki, amely lehetővé teszi új használati esetek gyors hozzáadását a szolgáltatás használatához. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi. A meglévő ügyfelek itt bármilyen új használati esetet tanúsíthatnak. Vegye figyelembe, hogy erre akkor van szükség, ha olyan új használati esethez szeretné használni a szolgáltatást, amelyre eredetileg nem jelentkezett.
suffix
befejezés végén.Új cikkek:
Új tanfolyam:
Service GA. Az Azure OpenAI szolgáltatás általánosan elérhető.
Új modellek: A legújabb szöveges modell hozzáadása, text-davinci-003 (USA keleti régiója, Nyugat-Európa), text-ada-embeddings-002 (USA keleti régiója, USA déli középső régiója, Nyugat-Európa)
Az OpenAI legújabb modelljei. Az Azure OpenAI hozzáférést biztosít az összes legújabb modellhez, beleértve a GPT-3.5 sorozatot is.
Új API-verzió (2022-12-01). Ez a frissítés számos kért fejlesztést tartalmaz, többek között a jogkivonat-használati információkat az API-válaszban, a fájlokra vonatkozó továbbfejlesztett hibaüzeneteket, az OpenAI-val való igazítást a létrehozási adatstruktúra finomhangolásához, valamint az utótagparaméter támogatását a finomhangolt feladatok egyéni elnevezésének engedélyezéséhez.
Nagyobb kérelem másodpercenkénti korlát. 50 nem Davinci-modellek esetén. 20 Davinci-modellekhez.
Az üzemelő példányok gyorsabb finomhangolása. Ada és Curie finomhangolt modellek üzembe helyezése 10 perc alatt.
Magasabb betanítási korlátok: 40 M-nyi betanítási jogkivonatok az Ada, a Babbage és a Curie számára. 10M a Davinci.
A visszaélések és a helytelen használatú adatnaplózás módosításának kérése és az emberi felülvizsgálat folyamata. Ma a szolgáltatás naplózza a kérések/válaszok adatait a visszaélés és a visszaélés észlelése céljából, hogy ezek a hatékony modellek ne legyenek visszaélve. Azonban sok ügyfél szigorú adatvédelmi és biztonsági követelményekkel rendelkezik, amelyek nagyobb ellenőrzést igényelnek az adataik felett. Ezeknek a használati eseteknek a támogatásához egy új folyamatot bocsátunk ki az ügyfelek számára a tartalomszűrési szabályzatok módosítására vagy az alacsony kockázatú használati esetek visszaélésnaplózásának kikapcsolására. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi, és a meglévő OpenAI-ügyfelek itt is alkalmazhatók.
Ügyfél által felügyelt kulcs (CMK) titkosítása. A CMK a betanítási adatok és a testreszabott modellek tárolásához használt saját titkosítási kulcsok biztosításával nagyobb irányítást biztosít az ügyfelek számára az adatok Azure OpenAI-ban való kezelése felett. Az ügyfél által kezelt kulcsok (CMK) használata, amely Bring Your Own Key (BYOK, saját kulcs használata) módszerként is ismert, nagyobb rugalmasságot biztosít a hozzáférés-vezérlők létrehozása, rotálása, letiltása és visszavonása terén. Továbbá az adatok védelméhez használt titkosítási kulcsok naplózására is lehetősége van. További információ a inaktív állapotú titkosítási dokumentációnkból.
A Lockbox támogatása
SOC-2 megfelelőség
Naplózás és diagnosztika az Azure Resource Health, a Cost Analysis és a Metrics > Diagnosztikai beállítások használatával.
A Studio fejlesztései. A Studio-munkafolyamat számos használhatósági fejlesztése, köztük az Azure AD-szerepkör támogatása annak szabályozásához, hogy a csapatban kik férhetnek hozzá a finomhangolt modellek létrehozásához és üzembe helyezéséhez.
A create API-kérés finomhangolása az OpenAI sémájának megfelelően lett frissítve.
Előzetes verziójú API-verziók:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
API 2022-12-01-es verzió:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
A tartalomszűrés alapértelmezés szerint átmenetileg ki van kapcsolva . Az Azure con sátormód ration másként működik, mint az Azure OpenAI. Az Azure OpenAI tartalomszűrőket futtat a generációs hívás során, hogy észlelje a káros vagy sértő tartalmakat, és szűrje őket a válaszból. Tudj meg többet
Ezek a modellek 2023 első negyedévében újra engedélyezve lesznek, és alapértelmezés szerint be vannak kapcsolva.
Ügyfélműveletek
További információ az Azure OpenAI-t használó mögöttes modellekről.
esemény
Intelligens alkalmazások létrehozása
márc. 17. 21 - márc. 21. 10
Csatlakozzon a meetup sorozathoz, hogy valós használati esetek alapján, skálázható AI-megoldásokat hozzon létre más fejlesztőkkel és szakértőkkel.
RegisztrációOktatás
Tanúsítvány
Microsoft Certified: Az Azure AI alapjai - Certifications
A Microsoft Azure szoftvereinek és szolgáltatásainak fejlesztésével kapcsolatos alapvető AI-fogalmak bemutatása AI-megoldások létrehozásához.