Olvasás angol nyelven

Megosztás a következőn keresztül:


Az Azure OpenAI szolgáltatás újdonságai

Ez a cikk összefoglalja az Azure OpenAI legújabb kiadásait és főbb dokumentációs frissítéseit.

2024. december

o1 korlátozott hozzáférésre kiadott érvelési modell

A legújabb o1 modell már elérhető AZ API-hozzáféréshez és a modell üzembe helyezéséhez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva. Azok az ügyfelek, akik korábban alkalmazták és hozzáféréssel o1-previewrendelkeztek, nem kell újból alkalmazniuk őket, mivel automatikusan szerepelnek a legújabb modell várakozási listájában.

Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás

Ha többet szeretne megtudni a speciális o1 sorozatmodellekről, tekintse meg az o1 sorozatok érvelési modelljeinek első lépéseit.

Régiónkénti elérhetőség

Modell Régió
o1
(Verzió: 2024-12-17)
USA2 keleti régiója (globális szabvány)
Svédország középső régiója (Global Standard)

Finomhangolás beállítása (előzetes verzió)

A közvetlen preferenciák optimalizálása (DPO) egy új igazítási technika a nagy nyelvi modellekhez, amelyek úgy lettek kialakítva, hogy a modell súlyát az emberi beállítások alapján igazítsák. Az emberi visszajelzésekből (RLHF) származó megerősítési tanulástól eltérően a DPO nem igényel jutalommodellt, és egyszerűbb adatokat (bináris beállításokat) használ a betanításhoz. Ez a módszer számítási szempontból könnyebb és gyorsabb, így ugyanolyan hatékony az igazítás során, miközben hatékonyabb. A DPO különösen olyan helyzetekben hasznos, ahol a szubjektív elemek, például a hang, a stílus vagy a konkrét tartalombeállítások fontosak. Örömmel jelentjük be a DPO nyilvános előzetes verzióját az Azure OpenAI Service-ben, kezdve a gpt-4o-2024-08-06 modellel.

A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.

Tárolt befejezések > desztilláció

A tárolt befejezésekkel rögzítheti a csevegés befejező munkameneteinek beszélgetési előzményeit, és adatkészletként használhatja az értékeléshez és a finomhangoláshoz.

GPT-4o 2024-11-20

gpt-4o-2024-11-20már elérhető a globális standard üzembe helyezéshez a következő helyen:

  • USA keleti régiója
  • USA 2. keleti régiója
  • USA északi középső régiója
  • USA déli középső régiója
  • USA nyugati régiója
  • USA 3. nyugati régiója
  • Közép-Svédország

NEW data zone provisioned deployment type

Az adatzóna által kiépített üzembe helyezések ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-telepítési típus, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat a Microsoft által meghatározott adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna kiépített üzembe helyezései fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez a Microsoft által megadott adatzónákon belüli Azure-infrastruktúra használatával. Az adatzóna kiépített üzemelő példányai támogatottak a , gpt-4o-2024-05-13és gpt-4o-mini-2024-07-18 modellekengpt-4o-2024-08-06.

További információt az üzembehelyezési típusok útmutatójában talál.

2024. november

Látás finomhangolása – GA

Vision finomhangolás GPT-4o (2024-08-06) most általánosan elérhető (GA).

A látás finomhangolásával képeket adhat a JSONL betanítási adataihoz. Ugyanúgy, ahogy egy vagy több képbemenetet küldhet a csevegés befejezéséhez, ugyanezeket az üzenettípusokat is belefoglalhatja a betanítási adatokba. A rendszerképek URL-címként vagy base64 kódolású rendszerképként is megadhatóak.

A modellrégió rendelkezésre állásának finomhangolásához tekintse meg a modellek oldalát.

ÚJ AI-visszaélések monitorozása

A visszaélések monitorozásának új formáit vezetjük be, amelyek llM-eket használnak az Azure OpenAI szolgáltatás potenciálisan visszaélésszerű használatának észlelésének hatékonyságának javítására, valamint a visszaélések monitorozásának engedélyezésére anélkül, hogy emberi felülvizsgálatra van szükség az utasításokat és kiegészítéseket. További információ: Visszaélések monitorozása.

A tartalombesorolással megjelölt és/vagy vélhetően visszaélésszerű használati minta részeként megjelölt kéréseket és kiegészítéseket egy további felülvizsgálati folyamatnak vetik alá, amely segít megerősíteni a rendszer elemzését, és tájékoztatni a műveleti döntéseket. A visszaélések monitorozási rendszereit kiterjesztettük, hogy az LLM alapértelmezés szerint, szükség esetén pedig az emberek számára is lehetővé tegye a felülvizsgálatot.

2024. október

NEW data zone standard deployment type

Az adatzóna standard üzemelő példányai ugyanabban az Azure OpenAI-erőforrásban érhetők el, mint az összes többi Azure OpenAI-üzembe helyezési típus, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat a Microsoft által definiált adatzónán belüli adatközpontba, a lehető legjobb rendelkezésre állással az egyes kérésekhez. Az adatzóna-szabvány magasabb alapértelmezett kvótákat biztosít, mint az Azure földrajzi alapú üzembe helyezési típusai. Az adatzóna standard üzemelő példányai támogatottak a modelleken gpt-4o-2024-05-13és gpt-4o-mini-2024-07-18 a modellekengpt-4o-2024-08-06.

További információt az üzembehelyezési típusok útmutatójában talál.

Globális Batch GA

Az Azure OpenAI globális köteg általánosan elérhető.

Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.

Főbb használati esetek:

  • Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.

  • Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.

  • Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.

  • Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.

  • Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.

  • Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.

  • Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.

További információ a globális kötegtelepítések használatának megkezdéséről.

o1-preview és o1-mini modellek korlátozott hozzáféréssel

A o1-preview modellek mostantól o1-mini elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.

Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás

Azok az ügyfelek, akik már jóváhagyták a modellt, és hozzáféréssel rendelkeznek a modellhez a korai hozzáférésű játszótéren keresztül, nem kell újra alkalmazniuk, automatikusan API-hozzáférést kapnak. A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.

API-támogatás:

Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-previewlett hozzáadva.

A max_tokens paraméter elavult, és az új max_completion_tokens paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens paraméterrel működnek.

Régió rendelkezésre állása:

A modellek az USA 2. keleti régiójában és a Svédország középső régiójában a standard és globális standard üzembe helyezéshez érhetők el a jóváhagyott ügyfelek számára.

Új GPT-4o Realtime API beszéd- és hangalapú nyilvános előzetes verzióhoz

Az Azure OpenAI GPT-4o audio a GPT-4o modellcsalád része, amely támogatja az alacsony késleltetésű, "beszéd, beszéd kihangosító" beszélgetési interakciókat. A GPT-4o audio realtime API valós idejű, kis késésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas a felhasználó és a modell közötti élő interakciókat, például az ügyfélszolgálati ügynököket, a hangsegédeket és a valós idejű fordítókat érintő használati esetekhez.

A gpt-4o-realtime-preview modell az USA 2. keleti régiójában és Svédország középső régióiban üzemelő globális üzemelő példányokhoz érhető el.

További információ: GPT-4o valós idejű hangdokumentáció.

Globális kötegtámogatási frissítések

A globális köteg mostantól támogatja a GPT-4o-t (2024-08-06). További információt a globális köteg első lépéseinek útmutatójában talál.

2024. szeptember

Azure OpenAI Studio UX-frissítések

Szeptember 19-én, amikor hozzáfér az Azure OpenAI Studióhoz , alapértelmezés szerint nem fogja látni az örökölt AI Foundry portált. Ha szükséges, a felhasználói felület felső sávjában a Következő néhány hétre a Switch to the old look váltógombbal visszatérhet az előző élményhez. Ha visszaáll az örökölt AI Foundry portálra, az segít, ha kitölti a visszajelzési űrlapot, hogy tudassa velünk, miért. Aktívan figyeljük ezt a visszajelzést az új élmény javítása érdekében.

GPT-4o 2024-08-06 kiépített üzembe helyezések

A GPT-4o 2024-08-06 már elérhető az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban üzembe helyezéshez. Globális üzembe helyezésekhez is elérhető.

A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.

ÚJ globális üzembehelyezési típus

A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális üzembe helyezési típusok, de lehetővé teszik az Azure globális infrastruktúrájának használatát, hogy dinamikusan irányíthassa a forgalmat az adatközpontba, és minden kéréshez a legjobb rendelkezésre állást biztosíthassa. A globális kiépített üzemelő példányok fenntartott modellfeldolgozási kapacitást biztosítanak a magas és kiszámítható átviteli sebességhez az Azure globális infrastruktúrájának használatával. A globálisan kiépített üzembe helyezéseket és modelleket gpt-4o-2024-08-06 gpt-4o-mini-2024-07-18 támogatjuk.

További információt az üzembehelyezési típusok útmutatójában talál.

ÚJ o1-preview és o1-mini modellek korlátozott hozzáféréshez

Az Azure OpenAI o1-preview és o1-mini a modellek célja az érvelési és problémamegoldási feladatok kezelése nagyobb összpontosítással és képességgel. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.

Az o1 sorozat főbb képességei

  • Összetett kódgenerálás: Képes algoritmusok létrehozására és speciális kódolási feladatok kezelésére a fejlesztők támogatásához.
  • Speciális problémamegoldás: Ideális átfogó ötletgyűjtési munkamenetekhez és a sokrétű kihívások kezeléséhez.
  • Összetett dokumentum-összehasonlítás: Tökéletes a szerződések, esetfájlok vagy jogi dokumentumok elemzéséhez a finom különbségek azonosításához.
  • Utasításkövetés és munkafolyamat-kezelés: Különösen hatékony a rövidebb környezeteket igénylő munkafolyamatok kezelésére.

Modellvariánsok

  • o1-preview: o1-preview a sorozatmodellek o1 jobban alkalmasak.
  • o1-mini: o1-mini a sorozatmodellek o1 gyorsabb és olcsóbb.

Modellverzió: 2024-09-12

Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás

Korlátozások

A o1 sorozatmodellek jelenleg előzetes verzióban érhetők el, és nem tartalmaznak más modellekben elérhető funkciókat, például a képfelismerést és a strukturált kimeneteket, amelyek a legújabb GPT-4o modellben érhetők el. Sok feladat esetén az általánosan elérhető GPT-4o modellek még mindig megfelelőbbek lehetnek.

Biztonság

Az OpenAI további biztonsági intézkedéseket is beépített a o1 modellekbe, beleértve az új technikákat, amelyekkel a modellek elutasíthatják a nem biztonságos kéréseket. Ezek a fejlesztések teszik elérhetővé a o1 sorozatot a leg robusztusabb modellek közül.

Elérhetőség

o1-mini Az o1-preview USA 2. keleti régiójában az AI Foundry portál korai hozzáférésű játszóterén keresztül korlátozott hozzáférés érhető el. A modellek adatfeldolgozása o1 más régióban fordulhat elő, mint ahol azok használhatók.

A korai hozzáférésű játszótéren való kipróbálásához o1-preview o1-mini regisztrálni kell a modelleket, és a hozzáférést a Microsoft jogosultsági feltételei alapján biztosítjuk.

Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás

A hozzáférés megadása után a következőkre lesz szüksége:

  1. Keresse meg https://ai.azure.com/resources és válassza ki az erőforrást a eastus2 régióban. Ha ebben a régióban nincs Azure OpenAI-erőforrása, létre kell hoznia egyet.
  2. Miután kiválasztotta az eastus2 Azure OpenAI-erőforrást, a bal felső panelen válassza a Korai hozzáférésű játszótér (előzetes verzió) lehetőséget.

2024. augusztus

GPT-4o 2024-08-06 strukturált kimenetek

GPT-4o mini kiépített üzembe helyezések

A GPT-4o mini már elérhető a kiépített üzembe helyezésekhez Kanada keleti régiójában, az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában és a középső Svédországban.

A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.

GPT-4o finomhangolás (nyilvános előzetes verzió)

A GPT-4o finomhangolása mostantól nyilvános előzetes verzióban elérhető az Azure OpenAI-hoz az USA északi középső régiójában és a Svédország középső régiójában.

További információkért tekintse meg blogbejegyzésünket.

Új előzetes verziójú API-kiadás

Az API-verzió 2024-07-01-preview a dataplane legújabb szerzői és következtetési API-kiadása. Lecseréli az API-verziót 2024-05-01-preview , és támogatja a következőket:

További információkért tekintse meg referenciadokumentációnkat

GPT-4o mini regionális elérhetőség

  • A GPT-4o mini az USA keleti és svédországi középső régióiban standard és globális standard üzembe helyezéshez érhető el.
  • A GPT-4o mini az USA keleti régiójában, Svédország középső régiójában és az USA nyugati régiójában elérhető a globális kötegelt üzembe helyezéshez.

Értékelési útmutató

A legújabb GPT-4o modell elérhető a korai hozzáférésű játszótéren (előzetes verzió)

2024. augusztus 6-án az OpenAI bejelentette a gpt-4o-modell legújabb verzióját 2024-08-06. A GPT-4o 2024-08-06 az előző verzió összes képességével rendelkezik, valamint:

  • Az összetett strukturált kimenetek támogatásának továbbfejlesztett képessége.
  • A maximális kimeneti jogkivonatok száma 4096-ról 16 384-re nőtt.

Az Azure-ügyfelek ma tesztelhetik a GPT-4o-t 2024-08-06 az új AI Foundry korai hozzáférésű játszótéren (előzetes verzió).

Az előző korai hozzáférésű játszótértől eltérően az AI Foundry portál korai hozzáférésű játszótere (előzetes verzió) nem igényel erőforrást egy adott régióban.

Megjegyzés

A korai hozzáférésű játszótéren (előzetes verzió) végrehajtott kérések és kiegészítések bármely Azure OpenAI-régióban feldolgozhatók, és jelenleg percenként 10 kérésre vonatkoznak Azure-előfizetési korlátonként. Ez a korlát a jövőben változhat.

Az Azure OpenAI szolgáltatással való visszaélés monitorozása minden korai hozzáférésű játszótér-felhasználó számára engedélyezve van, még akkor is, ha jóváhagyást ad a módosításra; az alapértelmezett tartalomszűrők engedélyezve vannak, és nem módosíthatók.

A GPT-4o 2024-08-06teszteléséhez jelentkezzen be az Azure AI korai hozzáférésű játszóterére (előzetes verzió) ezen a hivatkozáson keresztül.

A globális kötegtelepítések már elérhetők

Az Azure OpenAI Batch API nagy léptékű és nagy mennyiségű feldolgozási feladatok hatékony kezelésére lett kialakítva. A kérések aszinkron csoportjainak feldolgozása külön kvótával, 24 órás célfordulással, 50%-kal kevesebb költséggel, mint a globális szabvány. Kötegelt feldolgozás esetén ahelyett, hogy egyszerre egy kérést küldené el, nagy számú kérést küldhet egyetlen fájlban. A globális kötegkérelmek külön, enqueued tokenkvótával rendelkeznek, így elkerülhetők az online számítási feladatok zavarai.

Főbb használati esetek:

  • Nagy léptékű adatfeldolgozás: A kiterjedt adathalmazok gyors elemzése párhuzamosan.

  • Tartalomgenerálás: Nagy mennyiségű szöveget, például termékleírásokat vagy cikkeket hozhat létre.

  • Dokumentum áttekintése és összegzése: Automatizálja a hosszadalmas dokumentumok áttekintését és összegzését.

  • Ügyfélszolgálati automatizálás: Számos lekérdezés egyidejű kezelése a gyorsabb válaszok érdekében.

  • Adatkinyerés és -elemzés: Adatok kinyerése és elemzése nagy mennyiségű strukturálatlan adatból.

  • Természetes nyelvi feldolgozással (NLP) kapcsolatos feladatok: Olyan feladatokat hajthat végre, mint a hangulatelemzés vagy a fordítás nagy adathalmazokon.

  • Marketing és személyre szabás: Személyre szabott tartalmak és javaslatok létrehozása nagy méretekben.

További információ a globális kötegtelepítések használatának megkezdéséről.

2024. július

A GPT-4o mini már elérhető a finomhangoláshoz

A GPT-4o mini finomhangolás mostantól nyilvános előzetes verzióban érhető el Svédország középső régiójában és az USA északi középső régiójában.

Az Asszisztensek fájlkeresési eszköz most már kiszámlázva van

Az Asszisztensek fájlkereső eszközének használatáért most további díjakat kell fizetnie. További információkért tekintse meg a díjszabási oldalt .

A GPT-4o minimodell üzembe helyezéshez érhető el

A GPT-4o mini a legújabb Azure OpenAI-modell, amelyet először 2024. július 18-án jelentettek be:

"A GPT-4o mini lehetővé teszi az ügyfelek számára, hogy lenyűgöző alkalmazásokat nyújtsanak alacsonyabb áron, villámgyorsan. A GPT-4o mini jelentősen intelligensebb, mint a GPT-3.5 Turbo – 82%-os pontszámot ért el a Massive Multitask Language Understanding (MMLU) mérése terén a 70%-hoz képest, és több mint 60%-kal olcsóbb.1 A modell kibővített 128K környezeti ablakot biztosít, és integrálja a GPT-4o továbbfejlesztett többnyelvű képességeit, így jobb minőséget biztosít a nyelveknek a világ minden tájáról."

A modell jelenleg az USA keleti régiójában standard és globális standard üzembe helyezéshez is elérhető.

A modellkvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalt , és a modell elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.

Új felelős AI alapértelmezett tartalomszűrési szabályzat

Az új alapértelmezett tartalomszűrési szabályzat DefaultV2 biztosítja a GPT-modellsorozat (szöveg) legújabb biztonsági és biztonsági megoldásait, beleértve a következőket:

  • Prompt Shields for jailbreak attacks on user prompts (filter),
  • Védett anyagészlelés szöveghez (szűrőhöz) a modell befejezésekor
  • Védett anyagészlelés a kódhoz (megjegyzés) a modell befejezésekor

Bár a meglévő erőforrások és üzemelő példányok tartalomszűrői nem változnak (az alapértelmezett vagy egyéni tartalomszűrési konfigurációk változatlanok maradnak), az új erőforrások és a GPT-környezetek automatikusan öröklik az új tartalomszűrési szabályzatot DefaultV2. Az ügyfeleknek lehetőségük van váltani a biztonsági alapértékek között, és egyéni tartalomszűrési konfigurációkat hozhatnak létre.

További információért tekintse meg az Alapértelmezett biztonsági szabályzat dokumentációját .

Új GA API-kiadás

Az API-verzió 2024-06-01 a ga adatsík legújabb következtetési API-kiadása. Lecseréli az API-verziót 2024-02-01 , és támogatja a következőket:

  • beágyazások encoding_format > dimensions paraméterek.
  • csevegés befejezése > logprobs top_logprobs paraméterek.

További információért tekintse meg az adatsík következtetési referenciadokumentációját .

A gpt-4o globális standard üzembe helyezéséhez elérhető régiók bővítése

A GPT-4o mostantól a következő globális standard üzemelő példányokhoz érhető el:

  • ausztráliaeast
  • brazilsouth
  • canadaeast
  • eastus
  • eastus2
  • francecentral git
  • germanywestcentral
  • japaneast
  • koreacentral
  • northcentralus
  • norwayeast
  • lengyelországcentral
  • southafricanorth
  • USA déli középső régiója
  • southindia
  • swedencentral
  • switzerlandnorth
  • uksouth
  • westeurope
  • westus
  • westus3

A globális standard kvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok oldalát.

2024. június

A nyugdíjazási dátum frissítései

  • A 0301-et legkésőbb 2024. október 1-jére frissítették gpt-35-turbo .
  • & gpt-35-turbo-16k0613-ra frissítve gpt-35-turbo 2024. október 1-ére.
  • A > gpt-4-32k 0314 elavulási dátum 2024. október 1-ről 2025. június 6-ra frissült gpt-4 .

A modell elavultságával és kivonásával kapcsolatos legfrissebb információkért tekintse meg a modell nyugdíjazási útmutatójában .

Jogkivonatalapú számlázás a finomhangoláshoz

  • Az Azure OpenAI finomhangolási számlázása mostantól a betanítási fájlban lévő tokenek számán alapul – a teljes eltelt betanítási idő helyett. Ez jelentős költségcsökkenést eredményezhet egyes betanítási futtatások esetében, és sokkal egyszerűbbé teszi a finomhangolási költségek becslését. További információkért tekintse meg a hivatalos közleményt.

A GPT-4o új régiókban jelent meg

  • A GPT-4o mostantól a következőben is elérhető:
    • Svédország középső régiója a standard regionális üzembe helyezéshez.
    • Kelet-Ausztrália, Kelet-Kanada, Kelet-Japán, Közép-Korea, Közép-Korea, Közép-Svédország, Észak-Svájc, usa 3. nyugati régiója a kiépített üzembe helyezéshez.

A modell rendelkezésre állásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.

Ügyfél által felügyelt kulcs (CMK) támogatása asszisztensekhez

A Szálak és fájlok az asszisztensekben mostantól támogatja a CMK-t a következő régióban:

  • USA 3. nyugati régiója

2024. május

GPT-4o kiépített üzembe helyezések

gpt-4o Verzió: 2024-05-13 standard és kiépített üzemelő példányokhoz is elérhető. A kiépített és a standard modell üzembe helyezései szöveges és kép-/látásbeli következtetési kéréseket is elfogadnak. A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a kiépített üzemelő példányok modellmátrixát.

Asszisztensek v2 (előzetes verzió)

Az Assistants API frissítése mostantól nyilvánosan elérhető. A következő frissítéseket tartalmazza:

  • Fájlkereső eszköz és vektoros tárolás
  • A jogkivonatok használatának kezeléséhez szükséges maximális befejezési és kérési jogkivonat-támogatás .
  • tool_choiceparamétert, amely arra kényszeríti az Asszisztenst, hogy egy megadott eszközt használjon. Mostantól létrehozhat üzeneteket a segédszerepkörrel , hogy egyéni beszélgetési előzményeket hozzon létre a szálakban.
  • temperatureA , top_presponse_format paraméterek támogatása.
  • Streamelési és lekérdezési támogatás. A Python SDK segédfüggvényeivel futtatásokat hozhat létre, és streamelheti a válaszokat. Lekérdezési SDK-segítőket is hozzáadtunk az objektumállapot-frissítések lekérdezés nélkül való megosztásához.
  • Kísérletezzen a Logic Apps és a függvényhívás használatával az Azure OpenAI Studióval. Importálja függvényként a Logic Appsben implementált REST API-kat, és a studio automatikusan meghívja a függvényt (Logic Apps-munkafolyamatként) a felhasználói kérés alapján.
  • Az AutoGen by Microsoft Research egy többügynökből álló beszélgetési keretrendszert biztosít, amely lehetővé teszi a nagy méretű nyelvi modell (LLM) munkafolyamatainak kényelmes létrehozását az alkalmazások széles körében. Az Azure OpenAI-asszisztensek mostantól integrálva vannak az AutoGenbe egy új kísérleti ügynökön keresztül GPTAssistantAgent, amellyel zökkenőmentesen adhat hozzá asszisztenseket az AutoGen-alapú többügynök-munkafolyamatokhoz. Ez lehetővé teszi, hogy több Olyan Azure OpenAI-asszisztens is legyen, amely feladatra vagy tartományra specializálódott az összetett feladatok együttműködésére és kezelésére.
  • A finomhangolt gpt-3.5-turbo-0125 modellek támogatása a következő régiókban:
    • USA 2. keleti régiója
    • Közép-Svédország
  • Kiterjesztett regionális támogatás a következő célokra:
    • Kelet-Japán
    • Az Egyesült Királyság déli régiója
    • USA nyugati régiója
    • USA 3. nyugati régiója
    • Kelet-Norvégia

További információt az asszisztensekről szóló blogbejegyzésben talál.

GPT-4o modell általános rendelkezésre állása (GA)

A GPT-4o ("o is for "omni") az OpenAI legújabb modellje, amely 2024. május 13-án jelent meg.

  • A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban.
  • A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményt nyújtva az AI-képességekhez.

A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.

Globális standard üzembehelyezési típus (előzetes verzió)

A globális üzemelő példányok ugyanabban az Azure OpenAI-erőforrásokban érhetők el, mint a nem globális ajánlatok, de lehetővé teszik az Azure globális infrastruktúrájának kihasználását, hogy dinamikusan irányíthassa a forgalmat az adatközpontba az egyes kérések legjobb rendelkezésre állása mellett. A globális szabvány a legmagasabb alapértelmezett kvótát biztosítja az új modellekhez, és szükségtelenné teszi a terheléselosztást több erőforrás között.

További információt az üzembehelyezési típusok útmutatójában talál.

Frissítések finomhangolása

DALL-E és GPT-4 Turbo Vision GA konfigurálható tartalomszűrők

Hozzon létre egyéni tartalomszűrőket a DALL-E 2 és 3, a GPT-4 Turbo és a Vision GA (turbo-2024-04-09) és a GPT-4o üzemelő példányokhoz. Tartalomszűrés

Aszinkron szűrő minden Azure OpenAI-ügyfél számára elérhető

A szűrők aszinkron futtatása a streamelési forgatókönyvek jobb késése érdekében mostantól minden Azure OpenAI-ügyfél számára elérhető. Tartalomszűrés

Javaslati pajzsok

Az Prompt Shields az Azure OpenAI-modellek által üzemeltetett alkalmazásokat kétféle támadástól védi: közvetlen (jailbreak) és közvetett támadásoktól. A közvetett támadások (más néven indirekt parancssori támadások vagy tartományközi parancssori injektálási támadások) a Generatív AI-modellek által üzemeltetett rendszerek elleni támadástípusok, amelyek akkor fordulhatnak elő, ha egy alkalmazás olyan információkat dolgoz fel, amelyeket nem közvetlenül az alkalmazás fejlesztője vagy a felhasználó készített. Tartalomszűrés

2024-05-01-preview API-kiadás

GPT-4 Turbo modell általános elérhetősége (GA)

A GPT-4 Turbo legújabb GA kiadása a következő:

  • gpt-4Verzió: turbo-2024-04-09

Ez a következő előzetes modellek lecserélése:

  • gpt-4Verzió: 1106-Preview
  • gpt-4Verzió: 0125-Preview
  • gpt-4Verzió: vision-preview

Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek

  • Az OpenAI legújabb 0409 turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak.
  • Az Azure OpenAI legújabb turbo-2024-04-09 verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküli image_url és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.

Különbségek a gpt-4 vision-preview-tól

  • Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz gpt-4 : turbo-2024-04-09. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.

Fontos

Vision fejlesztések előzetes funkciók, beleértve az optikai karakterfelismerés (OCR), objektum földelés, video parancssorok lesznek kivonva, és már nem érhető el, ha gpt-4 verzió: vision-preview frissítve turbo-2024-04-09van. Ha jelenleg ezen előzetes verziójú funkciók bármelyikére támaszkodik, ez az automatikus modellfrissítés kompatibilitástörő változás lesz.

GPT-4 Turbo kiosztott felügyelt rendelkezésre állás

  • gpt-4Verzió: turbo-2024-04-09 standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.

A GPT-4 Turbo üzembe helyezése a Vision GA-val

Ha az AI Foundry portálon szeretné üzembe helyezni a GA-modellt, válassza ki GPT-4 és válassza ki a turbo-2024-04-09 verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09 GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.

2024. április

A finomhangolás mostantól két új régióban támogatott az USA 2. keleti régiójában és Svájc nyugati régiójában

A finomhangolás mostantól a következő támogatással érhető el:

USA 2. keleti régiója

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Nyugat-Svájc

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Az egyes régiókban a modellek elérhetőségével és a támogatás finomhangolásával kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát.

Többfordulós csevegési példák

A finomhangolás mostantól támogatja a többfordulós csevegéses betanítási példákat.

A GPT-4 (0125) elérhető az Azure OpenAI on Your Data szolgáltatáshoz

Most már használhatja a GPT-4 (0125) modellt az elérhető régiókban az Azure OpenAI On Your Data használatával.

2024. március

Kockázatok és biztonság monitorozása az Azure OpenAI Studióban

Az Azure OpenAI Studio mostantól egy Kockázat és biztonság irányítópultot biztosít minden olyan üzemelő példányhoz, amely tartalomszűrő-konfigurációt használ. Ezzel ellenőrizheti a szűrési tevékenység eredményeit. Ezután módosíthatja a szűrőkonfigurációt, hogy jobban kiszolgálja az üzleti igényeket, és megfeleljen a felelős AI-alapelveknek.

Kockázatok és biztonság monitorozásának használata

Az Azure OpenAI on Your Data frissítései

  • Most már csatlakozhat egy Elasticsearch vektoradatbázishoz, amelyet az Azure OpenAI On Your Data szolgáltatással használhat.
  • Az adatbetöltés során az adattömb méretparaméterével beállíthatja az index adott adattömbjeinek tokenjeinek maximális számát.

Megjelent a 2024-02-01 általános rendelkezésre állási (GA) API

Ez a legújabb GA API-kiadás, és az előző 2023-05-15 GA-kiadás lecserélése. Ez a kiadás támogatja az Azure OpenAI GA legújabb funkcióit, például a Whisperet, a DALLE-3-at és a finomhangolást az adatokon.

Az előzetes verziójú funkciókhoz, például az Asszisztensekhez, a szövegfelolvasáshoz (TTS) és az "adatokon" lévő adatforrásokhoz előzetes verziójú API-verzióra van szükség. További információt az API-verzió életciklus-útmutatójában talál.

Suttogva általános rendelkezésre állás (GA)

A Whisper speech to text modell mostantól a REST és a Python esetében is ga. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.

Próbálja ki a Whisperet egy rövid útmutató követésével.

DALL-E 3 általános rendelkezésre állás (GA)

A DALL-E 3 képgenerálási modell mostantól a REST és a Python számára is elérhető. Az ügyfélkódtár SDK-k jelenleg még nyilvános előzetes verzióban érhetők el.

Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.

Új regionális támogatás a DALL-E 3-hoz

Most már elérheti a DALL-E 3-at egy Azure OpenAI-erőforrással a vagy AustraliaEast az East US Azure-régióban, amellett, hogy SwedenCentral.

Modell-elavulások és kivonások

Hozzáadtunk egy lapot, amely nyomon követi a modellek elavulását és kivonását az Azure OpenAI szolgáltatásban. Ez a lap a jelenleg elérhető, elavult és kivezetett modellekről nyújt tájékoztatást.

Megjelent a 2024-03-01-preview API

2024-03-01-preview ugyanazokkal a funkciókkal rendelkezik, mint 2024-02-15-preview a beágyazásokhoz, és két új paramétert ad hozzá:

  • encoding_formatlehetővé teszi a beágyazások létrehozására vonatkozó formátum megadását a (vagybase64) fájlbanfloat. Az alapértelmezett érték float.
  • dimensions lehetővé teszi a kimeneti beágyazások számának beállítását. Ezt a paramétert csak az új, harmadik generációs beágyazási modellek támogatják: text-embedding-3-large, text-embedding-3-small. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, a paraméter kihasználásához javasoljuk, hogy frissítsen a legújabb verzióra: pip install openai --upgrade.

Ha jelenleg egy előzetes verziójú API-verziót használ a legújabb funkciók kihasználásához, javasoljuk, hogy tekintse meg az API-verzió életciklusáról szóló cikket, amely nyomon követi, hogy a jelenlegi API-verzió mennyi ideig lesz támogatott.

Frissítés a GPT-4-1106-Preview frissítési csomagokra

A 2024. március 8-ra ütemezett 1106 előzetes verzió gpt-4 0125-ös előzetes verzióra való központi telepítése gpt-4 már nem történik meg. gpt-4 Az 1106-os és 0125-ös előzetes verzió "Automatikus frissítés alapértelmezettre" és "Frissítés lejárt" értékre állítása a modell stabil verziójának kiadása után kezdődik.

A frissítési folyamatról további információt a modellek oldalán talál.

2024. február

GPT-3.5-turbo-0125 modell elérhető

Ez a modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.

A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.

Harmadik generációs beágyazási modellek érhetők el

  • text-embedding-3-large
  • text-embedding-3-small

A tesztelés során az OpenAI-jelentések a nagy és a kis harmadik generációs beágyazási modellek is jobb átlagos többnyelvű lekérési teljesítményt nyújtanak a MIRACL-teljesítményteszttel, miközben az angol feladatok teljesítménye továbbra is jobb az MTEB-teljesítményteszttel, mint a második generációs text-embedding-ada-002 modell.

A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.

GPT-3.5 Turbo kvótakonszolidáció

A GPT-3.5-Turbo modellek (beleértve a 16k-ot is) különböző verziói közötti migrálás egyszerűsítése érdekében az összes GPT-3.5-Turbo-kvótát egyetlen kvótaértékbe összesítjük.

  • Azoknak az ügyfeleknek, akik a kvóta növelését jóváhagyták, az előző növekedéseket tükröző összesített kvótával fognak rendelkezni.

  • Minden olyan ügyfél, akinek a modellverziók jelenlegi teljes kihasználtsága kisebb az alapértelmezettnél, alapértelmezés szerint új összesített teljes kvótát kap.

GPT-4-0125-preview modell elérhető

A gpt-4 modell verziója 0125-preview már elérhető az Usa keleti régiójában, az USA északi középső régiójában és az USA déli középső régiójában található Azure OpenAI szolgáltatásban. A verzióterjesztéssel gpt-4 1106-preview rendelkező ügyfeleket a következő hetekben automatikusan frissítjük 0125-preview .

A modell regionális elérhetőségével és frissítéseivel kapcsolatos információkért tekintse meg a modellek oldalát.

Az Assistants API nyilvános előzetes verziója

Az Azure OpenAI mostantól támogatja az OpenAI GPT-jét használó API-t. Az Azure OpenAI Assistants (előzetes verzió) lehetővé teszi az igényeinek megfelelő AI-asszisztensek létrehozását egyéni utasítások és speciális eszközök, például kódértelmezők és egyéni függvények használatával. További információ:

OpenAI text to speech voices public preview

Az Azure OpenAI szolgáltatás mostantól támogatja a szövegfelolvasási API-kat az OpenAI hangjával. Az AI által létrehozott beszéd lekérése a megadott szövegből. További információért tekintse meg az áttekintési útmutatót , és próbálja ki a rövid útmutatót.

Megjegyzés

Az Azure AI Speech támogatja az OpenAI szövegfelolvasást is. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.

Új finomhangolási képességek és modelltámogatás

Új regionális támogatás az Azure OpenAI on Your Data szolgáltatáshoz

Mostantól a következő Azure-régióban használhatja az Azure OpenAI On Your Data-t:

  • Dél-Afrika északi régiója

Az Azure OpenAI on Your Data általános rendelkezésre állása

2023. december

Azure OpenAI az adatokon

  • Az Azure OpenAI on Your Data teljes VPN- és privát végponttámogatása, beleértve a következő biztonsági támogatásokat: tárfiókok, Azure OpenAI-erőforrások és Azure AI-Search szolgáltatás-erőforrások.
  • Új cikk az Azure OpenAI On Your Data konfigurációjának virtuális hálózatokkal és privát végpontokkal történő védelméről.

A GPT-4 Turbo és a Vision már elérhető

A GPT-4 Turbo és a Vision az Azure OpenAI szolgáltatásban nyilvános előzetes verzióban érhető el. A GPT-4 Turbo with Vision egy nagy multimodális modell (LMM), amelyet az OpenAI fejlesztett ki, amely képes képek elemzésére és szöveges válaszokat adni a velük kapcsolatos kérdésekre. A természetes nyelvi feldolgozást és a vizuális megértést egyaránt magában foglalja. A továbbfejlesztett móddal az Azure AI Vision funkcióival további megállapításokat hozhat létre a képekből.

  • Ismerje meg a GPT-4 Turbo és a Vision képességeit kód nélküli környezetben az Azure OpenAI Playground használatával. További információ a rövid útmutatóban.
  • A GPT-4 Turbo és a Vision használatával végzett látásjavítás már elérhető az Azure OpenAI-játszótéren, és támogatja az optikai karakterfelismerést, az objektumok földelését, az adatok hozzáadásának képtámogatását, valamint a videoüzenetek támogatását.
  • Hívásokat kezdeményezhet közvetlenül a csevegő API-ba a REST API használatával.
  • A régió rendelkezésre állása jelenleg csak , SwitzerlandNorthSwedenCentral, WestUSésAustraliaEast
  • Tudjon meg többet a GPT-4 Turbo és a Vision ismert korlátairól és más gyakori kérdésekről.

2023. november

Új adatforrás-támogatás az Azure OpenAI On Your Data szolgáltatásban

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 megjelent

Mindkét modell az OpenAI legújabb kiadása, továbbfejlesztett utasításkövetéssel, JSON móddal, reprodukálható kimenettel és párhuzamos függvényhívással.

  • A GPT-4 Turbo Preview maximális környezeti ablaka 128 000 token, és 4096 kimeneti jogkivonatot képes létrehozni. A legfrissebb betanítási adatokkal rendelkezik 2023 áprilisig. Ez a modell előzetes verzióban érhető el, és éles használatra nem ajánlott. Az előzetes verziójú modell összes központi telepítése automatikusan frissül, amint a stabil kiadás elérhetővé válik.

  • A GPT-3.5-Turbo-1106 maximális környezeti ablaka 16 385 token, és 4096 kimeneti jogkivonatot képes létrehozni.

A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a modellek oldalát.

A modellek saját egyedi régiónkénti kvótakiosztásokkal rendelkeznek.

DALL-E 3 nyilvános előzetes verzió

A DALL-E 3 az OpenAI legújabb képgenerálási modellje. Jobb képminőséget, összetettebb jeleneteket és jobb teljesítményt nyújt a képeken lévő szövegek renderelése során. Emellett több méretarány-beállítással is rendelkezik. A DALL-E 3 az OpenAI Studióban és a REST API-on keresztül érhető el. Az OpenAI-erőforrásnak az SwedenCentral Azure-régióban kell lennie.

A DALL-E 3 beépített gyors újraírást tartalmaz a képek javítása, az torzítás csökkentése és a természetes változatok növelése érdekében.

Próbálja ki a DALL-E 3-at egy rövid útmutató követésével.

Felelős AI

  • Bővített ügyfélkonfiguráció: Mostantól minden Azure OpenAI-ügyfél konfigurálhatja az összes súlyossági szintet (alacsony, közepes, magas) a gyűlölet, az erőszak, a szexuális és az önsértés kategóriákhoz, beleértve a csak a nagy súlyosságú tartalmak szűrését is. Tartalomszűrők konfigurálása

  • Tartalom hitelesítő adatai az összes DALL-E modellben: Az összes DALL-E modellből származó AI által létrehozott képek mostantól tartalmaznak egy digitális hitelesítő adatot, amely mesterséges intelligenciával létrehozott módon teszi közzé a tartalmat. A képeszközöket megjelenítő alkalmazások a nyílt forráskód Content Authenticity Initiative SDK használatával jeleníthetik meg a hitelesítő adatokat a mesterséges intelligenciával létrehozott rendszerképeikben. Tartalom hitelesítő adatai az Azure OpenAI-ban

  • Új RAI-modellek

    • Jailbreak-kockázatészlelés: A jailbreak-támadások olyan felhasználói kérések, amelyek a Generatív AI-modellt olyan viselkedések bemutatására késztetik, amelyeket a rendszerüzenetben beállított szabályok elkerülése vagy megszegése érdekében betanított. A jailbreak kockázatészlelési modell nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzetekben és szűrőmodellben érhető el. Felhasználói kéréseken fut.
    • Védett anyagszöveg: A védett anyagszöveg ismert szöveges tartalmakat (például dalszövegeket, cikkeket, recepteket és kijelölt webes tartalmakat) ír le, amelyeket nagy nyelvi modellek képesek kiadni. A védett anyag szövegmodellje nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzet- és szűrőmodellben érhető el. LLM-befejezéseken fut.
    • Védett anyagkód: A védett anyagkód olyan forráskódot ír le, amely megfelel a nyilvános adattárakból származó forráskódkészletnek, amelyet nagy nyelvi modellek a forrástárak megfelelő idézete nélkül is ki tudnak adni. A védett anyagkódmodell nem kötelező (alapértelmezés szerint ki van kapcsolva), és széljegyzetekben és szűrőmodellben érhető el. LLM-befejezéseken fut.

    Tartalomszűrők konfigurálása

  • Tiltólisták: Az ügyfelek mostantól gyorsan testre szabhatják a tartalomszűrők viselkedését a kérések és befejezések esetében, ha egyéni tiltólistát hoznak létre a szűrőikben. Az egyéni tiltólista lehetővé teszi, hogy a szűrő végrehajtsa a műveletet a minták testre szabott listáján, például adott kifejezéseken vagy regex mintákon. Az egyéni blokklistákon kívül a Microsoft profanitási blokklistát (angol) is biztosítunk. Blokklisták használata

Október 2023.

Új finomhangolási modellek (előzetes verzió)

Azure OpenAI az adatokon

  • Új egyéni paraméterek a lekért dokumentumok számának és szigorúságának meghatározásához.
    • A szigorúsági beállítás a küszöbértéket úgy állítja be, hogy a dokumentumok a lekérdezések szempontjából relevánsnak minősüljenek.
    • A lekért dokumentumok beállítása megadja a válaszok létrehozásához használt adatindexből származó legmagasabb pontszámú dokumentumok számát.
  • Az adatok betöltésének/feltöltésének állapotát az Azure OpenAI Studióban tekintheti meg.
  • Privát végpontok és VPN-ek támogatása blobtárolókhoz.

2023. szeptember

GPT-4

A GPT-4 és a GPT-4-32k mostantól minden Azure OpenAI Service-ügyfél számára elérhető. Az ügyfeleknek már nem kell a GPT-4 és a GPT-4-32k használatára alkalmazniuk a várakozási listát (a korlátozott hozzáférésű regisztrációs követelmények továbbra is érvényesek az összes Azure OpenAI-modellre). A rendelkezésre állás régiónként eltérő lehet. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.

GPT-3.5 Turbo Instruct

Az Azure OpenAI Szolgáltatás mostantól támogatja a GPT-3.5 Turbo Instruct modellt. Ez a modell a Completions API-val összehasonlítható text-davinci-003 és használható teljesítménnyel rendelkezik. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.

A Whisper nyilvános előzetes verziója

Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI Whisper-modellje által működtetett beszédfelolvasási API-kat. Az AI által létrehozott szöveg lekérése a megadott beszédhang alapján. További információért tekintse meg a rövid útmutatót.

Megjegyzés

Az Azure AI Speech az OpenAI Whisper modelljét is támogatja a kötegelt átírási API-val. További információért tekintse meg a Köteg átírási útmutatót. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?

Új régiók

  • Az Azure OpenAI mostantól svédországi középső és svájci északi régiókban is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.

Regionális kvótakorlátok növekedése

  • Az egyes modellek és régiók maximális alapértelmezett kvótakorlátjának növelése. A számítási feladatoknak ezekre a modellekre és régiókra való migrálása lehetővé teszi a magasabb tokenek percenkénti (TPM) előnyeit.

2023. augusztus

Az Azure OpenAI saját adatainak (előzetes verzió) frissítései

2023. július

Függvényhívás támogatása

Bemeneti tömb beágyazásának növelése

Új régiók

  • Az Azure OpenAI mostantól kanada keleti, USA 2. keleti régiójában, Kelet-Japánban és az USA északi középső régiójában is elérhető. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.

2023. június

Az Azure OpenAI használata saját adatokon (előzetes verzió)

  • Az Azure OpenAI On Your Data előzetes verzióban érhető el, így olyan OpenAI-modellekkel cseveghet, mint a GPT-35-Turbo és a GPT-4, és az adatok alapján fogadhat válaszokat.

A gpt-35-turbo és a gpt-4 modellek új verziói

  • gpt-35-turbo (0613-es verzió)
  • gpt-35-turbo-16k (0613-es verzió)
  • gpt-4 (0613-es verzió)
  • gpt-4-32k (0613-es verzió)

Az Egyesült Királyság déli régiója

  • Az Azure OpenAI már elérhető az Egyesült Királyság déli régiójában. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.

Tartalomszűrés és széljegyzetek (előzetes verzió)

Kvóta

2023. május

Java > JavaScript SDK-támogatás

  • Az Azure OpenAI előzetes verziójú SDK-k javaScripthez és Java-hoz nyújtanak támogatást.

Az Azure OpenAI-csevegés befejezésének általános rendelkezésre állása (GA)

  • Általános rendelkezésre állási támogatás:
    • Csevegés befejezése API-verzió 2023-05-15.
    • GPT-35-Turbo modellek.
    • GPT-4 modellsorozat.

Ha jelenleg az API-t 2023-03-15-preview használja, javasoljuk, hogy migráljon a GA 2023-05-15 API-ba. Ha jelenleg API-verziót 2022-12-01 használ, ez az API továbbra is ga marad, de nem tartalmazza a legújabb csevegés-befejezési képességeket.

Fontos

A GPT-35-Turbo modellek jelenlegi verzióinak használata a befejezési végponttal előzetes verzióban marad.

Közép-Franciaország

  • Az Azure OpenAI már elérhető a franciaországi középső régióban. A modellek elérhetőségével kapcsolatos legfrissebb információkért tekintse meg a modellek oldalát az egyes régiókban.

2023. április

  • DALL-E 2 nyilvános előzetes verzió. Az Azure OpenAI szolgáltatás mostantól támogatja az OpenAI DALL-E 2 modelljén alapuló képgenerálási API-kat. Mesterséges intelligenciával létrehozott képek lekérése a megadott leíró szöveg alapján. További információért tekintse meg a rövid útmutatót.

  • A testreszabott modellek inaktív üzembe helyezései 15 nap után törlődnek; modellek továbbra is elérhetők maradnak az újbóli üzembe helyezéshez. Ha egy testre szabott (finomhangolt) modell több mint tizenöt (15) napig van üzembe helyezve, amely alatt nem történik befejezési vagy csevegés-befejezési hívás, az üzembe helyezés automatikusan törlődik (és az üzembe helyezésért nem jár további üzemeltetési díj). A mögöttes testreszabott modell továbbra is elérhető marad, és bármikor újra üzembe helyezheti. További információért tekintse meg az útmutatót.

2023. március

  • A GPT-4 sorozatú modellek mostantól előzetes verzióban érhetők el az Azure OpenAI-ban. A hozzáférés kéréséhez a meglévő Azure OpenAI-ügyfelek az űrlap kitöltésével jelentkezhetnek. Ezek a modellek jelenleg az USA keleti régiójában és az USA déli középső régiójában érhetők el.

  • A GPT-35-Turbo és GPT-4 modellekhez készült új csevegés-befejezési API 3/21-es előzetes verzióban jelenik meg. További információkért tekintse meg a frissített rövid útmutatókat és útmutatókat.

  • GPT-35-Turbo előzetes. További részletekért tekintse meg az útmutatót.

  • Megnövelt betanítási korlátok a finomhangoláshoz: A betanítási feladat maximális mérete (a betanítási fájlban lévő tokenek) x (az alapidőszakok száma) 2 milliárd token az összes modellhez. A maximális betanítási feladatot 120 óráról 720 órára növeltük.

  • További használati esetek hozzáadása a meglévő hozzáféréshez. Korábban az új használati esetek hozzáadásának folyamata miatt az ügyfeleknek újra kellett alkalmazniuk a szolgáltatást. Most egy új folyamatot adunk ki, amely lehetővé teszi új használati esetek gyors hozzáadását a szolgáltatás használatához. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi. A meglévő ügyfelek itt bármilyen új használati esetet tanúsíthatnak. Vegye figyelembe, hogy erre akkor van szükség, ha olyan új használati esethez szeretné használni a szolgáltatást, amelyre eredetileg nem jelentkezett.

február 2023.

Új funkciók

Frissítések

  • A tartalomszűrés alapértelmezés szerint be van kapcsolva.

Új cikkek:

Új tanfolyam:

2023. január

Új funkciók

  • Service GA. Az Azure OpenAI szolgáltatás általánosan elérhető.

  • Új modellek: A legújabb szöveges modell hozzáadása, text-davinci-003 (USA keleti régiója, Nyugat-Európa), text-ada-embeddings-002 (USA keleti régiója, USA déli középső régiója, Nyugat-Európa)

2022. december

Új funkciók

  • Az OpenAI legújabb modelljei. Az Azure OpenAI hozzáférést biztosít az összes legújabb modellhez, beleértve a GPT-3.5 sorozatot is.

  • Új API-verzió (2022-12-01). Ez a frissítés számos kért fejlesztést tartalmaz, többek között a jogkivonat-használati információkat az API-válaszban, a fájlokra vonatkozó továbbfejlesztett hibaüzeneteket, az OpenAI-val való igazítást a létrehozási adatstruktúra finomhangolásához, valamint az utótagparaméter támogatását a finomhangolt feladatok egyéni elnevezésének engedélyezéséhez. ​

  • Nagyobb kérelem másodpercenkénti korlát. 50 nem Davinci-modellek esetén. 20 Davinci-modellekhez.

  • Az üzemelő példányok gyorsabb finomhangolása. Ada és Curie finomhangolt modellek üzembe helyezése 10 perc alatt.

  • Magasabb betanítási korlátok: 40 M-nyi betanítási jogkivonatok az Ada, a Babbage és a Curie számára. 10M a Davinci.

  • A visszaélések és a helytelen használatú adatnaplózás módosításának kérése és az emberi felülvizsgálat folyamata. Ma a szolgáltatás naplózza a kérések/válaszok adatait a visszaélés és a visszaélés észlelése céljából, hogy ezek a hatékony modellek ne legyenek visszaélve. Azonban sok ügyfél szigorú adatvédelmi és biztonsági követelményekkel rendelkezik, amelyek nagyobb ellenőrzést igényelnek az adataik felett. Ezeknek a használati eseteknek a támogatásához egy új folyamatot bocsátunk ki az ügyfelek számára a tartalomszűrési szabályzatok módosítására vagy az alacsony kockázatú használati esetek visszaélésnaplózásának kikapcsolására. Ez a folyamat az Azure AI-szolgáltatásokban létrehozott korlátozott hozzáférésű folyamatot követi, és a meglévő OpenAI-ügyfelek itt is alkalmazhatók.

  • Ügyfél által felügyelt kulcs (CMK) titkosítása. A CMK a betanítási adatok és a testreszabott modellek tárolásához használt saját titkosítási kulcsok biztosításával nagyobb irányítást biztosít az ügyfelek számára az adatok Azure OpenAI-ban való kezelése felett. Az ügyfél által kezelt kulcsok (CMK) használata, amely Bring Your Own Key (BYOK, saját kulcs használata) módszerként is ismert, nagyobb rugalmasságot biztosít a hozzáférés-vezérlők létrehozása, rotálása, letiltása és visszavonása terén. Továbbá az adatok védelméhez használt titkosítási kulcsok naplózására is lehetősége van. További információ a inaktív állapotú titkosítási dokumentációnkból.

  • A Lockbox támogatása

  • SOC-2 megfelelőség

  • Naplózás és diagnosztika az Azure Resource Health, a Cost Analysis és a Metrics > Diagnosztikai beállítások használatával.

  • A Studio fejlesztései. A Studio-munkafolyamat számos használhatósági fejlesztése, köztük az Azure AD-szerepkör támogatása annak szabályozásához, hogy a csapatban kik férhetnek hozzá a finomhangolt modellek létrehozásához és üzembe helyezéséhez.

Módosítások (kompatibilitástörő)

A create API-kérés finomhangolása az OpenAI sémájának megfelelően lett frissítve.

Előzetes verziójú API-verziók:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API 2022-12-01-es verzió:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

A tartalomszűrés alapértelmezés szerint átmenetileg ki van kapcsolva . Az Azure con sátormód ration másként működik, mint az Azure OpenAI. Az Azure OpenAI tartalomszűrőket futtat a generációs hívás során, hogy észlelje a káros vagy sértő tartalmakat, és szűrje őket a válaszból. Tudj meg többet

Ezek a modellek 2023 első negyedévében újra engedélyezve lesznek, és alapértelmezés szerint be vannak kapcsolva. ​

Ügyfélműveletek

Következő lépések

További információ az Azure OpenAI-t használó mögöttes modellekről.