Mi az Az Azure OpenAI Szolgáltatás?

Cikk
11/02/2024

Az Azure OpenAI szolgáltatás REST API-hozzáférést biztosít az OpenAI hatékony nyelvi modelljeihez, például o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo with Vision, GPT-4, GPT-3.5-Turbo és Embeddings modellsorozatokhoz. Ezek a modellek könnyen adaptálhatók az adott feladathoz, beleértve a tartalomgenerálást, az összegzést, a képfelismerést, a szemantikai keresést és a természetes nyelvet a kódfordításhoz. A felhasználók REST API-kkal, Python SDK-val vagy az Azure AI Studióban érhetik el a szolgáltatást.

Funkciók áttekintése

Szolgáltatás	Azure OpenAI
Elérhető modellek	o1-preview & o1-mini – (Korlátozott hozzáférés – Hozzáférés kérése) GPT-4o > GPT-4o mini GPT-4 sorozat (beleértve a GPT-4 Turbo with Vision) GPT-3.5-Turbo sorozat Beágyazási sorozat További információ a Modellek oldalon.
Finomhangolás	`GPT-4o-mini` (előzetes verzió) `GPT-4` (előzetes verzió) `GPT-3.5-Turbo` (0613) `babbage-002` `davinci-002`.
Ár	Itt érhető el A GPT-4 Turbo with Vision szolgáltatással kapcsolatos részletekért tekintse meg a speciális díjszabási információkat.
Virtuális hálózat támogatása és privát kapcsolat támogatása	Igen.
Felügyelt identitás	Igen, a Microsoft Entra-azonosítón keresztül
Felhasználói felület	Azure Portal fiók- és erőforrás-kezeléshez, Azure AI Studio modellfeltáráshoz és finomhangoláshoz
Modell regionális rendelkezésre állása	Modell rendelkezésre állása
Tartalomszűrés	A kérések és kiegészítések kiértékelése a tartalomszabályzatunk alapján történik automatizált rendszerekkel. A rendszer szűri a nagy súlyosságú tartalmakat.

Felelős AI

A Microsoftnál elkötelezettek vagyunk a mesterséges intelligencia fejlődése mellett, amelyet az emberek elé helyező alapelvek vezérelnek. Az Azure OpenAI-ban elérhető generatív modellek jelentős potenciális előnyökkel járnak, de gondos tervezés és átgondolt megoldások nélkül az ilyen modellek helytelen vagy akár káros tartalmakat is eredményezhetnek. A Microsoft jelentős beruházásokat hajtott végre a visszaélések és a nem szándékos károk elleni védelem érdekében, beleértve a Microsoft felelősségteljes MI-használatra vonatkozó alapelveinek beépítését, a szolgáltatás használatára vonatkozó magatartási kódex elfogadását, az ügyfeleket támogató tartalomszűrők kiépítését, valamint a felelős AI-információk és útmutatás biztosítását, amelyeket az ügyfeleknek figyelembe kell venniük az Azure OpenAI használata során.

Hogyan hozzáférni az Azure OpenAI-hoz?

A legtöbb Azure OpenAI-modell eléréséhez nincs szükség korlátozott hozzáférésű regisztrációs űrlapra. További információ az Azure OpenAI Korlátozott hozzáférésű lapon.

Az Azure OpenAI és az OpenAI összehasonlítása

Az Azure OpenAI szolgáltatás speciális nyelvi AI-t biztosít az ügyfeleknek az OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper és szöveg beszédmodellekkel az Azure biztonsági és vállalati ígéretével. Az Azure OpenAI az OpenAI-val közösen fejleszti az API-kat, biztosítva a kompatibilitást és az egyikről a másikra való zökkenőmentes átmenetet.

Az Azure OpenAI-val az ügyfelek a Microsoft Azure biztonsági képességeit kapják, miközben ugyanazokat a modelleket futtatják, mint az OpenAI. Az Azure OpenAI privát hálózatkezelést, regionális rendelkezésre állást és felelős AI-tartalomszűrést kínál.

Fő fogalmak

Kérések > kitöltések

A befejezési végpont az API-szolgáltatás fő összetevője. Ez az API hozzáférést biztosít a modell szövegbeviteli, szövegkiírási felületéhez. A felhasználóknak egyszerűen meg kell adniuk az angol szöveg parancsot tartalmazó bemeneti kérést, és a modell szövegkimenetet hoz létre.

Íme egy példa egy egyszerű kérdésre és befejezésre:

Kérdés: """ count to 5 in a for loop """

Befejezés: for i in range(1, 6): print(i)

Tokenek

Szöveges jogkivonatok

Az Azure OpenAI a jogkivonatokra lebontva dolgozza fel a szöveget. A tokenek lehetnek szavak vagy csak karaktersorozatok. A "hamburger" szó például a "sonka", a "bur" és a "ger" jogkivonatra oszlik, míg egy rövid és gyakori szó, mint a "körte" egyetlen token. Számos jogkivonat egy szóközzel kezdődik, például " hello" és "bye".

Az adott kérésben feldolgozott tokenek teljes száma a bemeneti, kimeneti és kérési paraméterek hosszától függ. A feldolgozott jogkivonatok mennyisége a modellek válaszkésésén és átviteli sebességén is hatással lesz.

Kép jogkivonatai

Az Azure OpenAI képfeldolgozási képességei a GPT-4o, a GPT-4o mini és a GPT-4 Turbo with Vision modellek használatával kép jogkivonatokkal határozzák meg a képbemenetek által felhasznált tokenek teljes számát. A felhasznált tokenek számát két fő tényező alapján számítjuk ki: a kép részletességi szintje (alacsony vagy magas) és a kép mérete alapján. A jogkivonatok költségeinek kiszámítása a következőképpen történik:

Kis felbontású mód
- Az alacsony részletesség lehetővé teszi, hogy az API gyorsabban válaszoljon olyan forgatókönyvekre, amelyekhez nincs szükség nagy képfelbontási elemzésre. Az alacsony részletességű képekhez használt jogkivonatok a következők:
  - GPT-4o és GPT-4 Turbo a Vision használatával: Képenként 85 token átalánydíja, mérettől függetlenül.
  - GPT-4o mini: Képenként 2833 token átalánydíja, mérettől függetlenül.
- Példa: 4096 x 8192 kép (alacsony részletességű): A költség rögzített 85 jogkivonat, mivel alacsony részletességű kép, és a méret nem befolyásolja ebben a módban a költségeket.
Nagy felbontású mód
- Az alacsony részletesség lehetővé teszi, hogy az API részletesebben elemezze a képeket. A rendszer a kép jogkivonatait a kép méretei alapján számítja ki. A számítás a következő lépéseket foglalja magában:
  1. Kép átméretezése: A rendszer úgy méretezi át a képet, hogy elférjen egy 2048 x 2048 képpontos négyzeten belül. Ha a legrövidebb oldal nagyobb, mint 768 képpont, a rendszer tovább átméretezi a képet, hogy a legrövidebb oldal 768 képpont hosszú legyen. Az átméretezés során az oldalarány megmarad.
  2. Csempeszámítás: Az átméretezés után a rendszer a képet 512 x 512 képpontos csempékre osztja. A részleges csempék teljes csempére vannak kerekítve. A csempék száma határozza meg a jogkivonat teljes költségét.
  3. Jogkivonat számítása:
    - GPT-4o és GPT-4 Turbo vision: Minden 512 x 512 képpontos csempe 170 tokenbe kerül. A rendszer további 85 alapjogkivonatot ad hozzá az összeghez.
    - GPT-4o mini: Minden 512 x 512 képpontos csempe 5667 tokenbe kerül. A rendszer további 2833 alapjogkivonatot ad hozzá az összeghez.
- Példa: 2048 x 4096 kép (nagy részletességgel):
  1. A kép eredetileg 1024 x 2048 képpont méretűre van átméretezve, hogy elférjen a 2048 x 2048 képpontos négyzeten belül.
  2. A kép további átméretezése 768 x 1536 képpontra, hogy a legrövidebb oldal legfeljebb 768 képpont hosszú legyen.
  3. A kép 2 x 3 csempére van osztva, egyenként 512 x 512 képpontra.
  4. Végső számítás:
    - A GPT-4o és a GPT-4 Turbo with Vision esetében a token teljes költsége csempénként 6 csempe x 170 token + 85 alap jogkivonat = 1105 token.
    - A GPT-4o mini esetében a token teljes költsége csempénként 6 csempe x 5667 token + 2833 alap jogkivonat = 36835 token.

Források

Az Azure OpenAI egy új termékajánlat az Azure-ban. Az Azure OpenAI használatbavétele ugyanúgy történik, mint bármely más Azure-termék, ahol erőforrást vagy szolgáltatáspéldányt hoz létre az Azure-előfizetésben. További információ az Azure erőforrás-kezelési tervéről.

Központi telepítés

Miután létrehozott egy Azure OpenAI-erőforrást, üzembe kell helyeznie egy modellt, mielőtt elkezdené az API-hívások indítását és a szöveg létrehozását. Ez a művelet az üzembehelyezési API-k használatával végezhető el. Ezek az API-k lehetővé teszik a használni kívánt modell megadását.

Parancssori tervezés

Az OpenAI GPT-3, GPT-3.5 és GPT-4 modelljei parancssori alapúak. A parancssor-alapú modellek esetében a felhasználó szöveges üzenetek beírásával kezeli a modellt, amely a szöveg kiegészítésével válaszol. Ezzel a kiegészítéssel a modell a bevitt szöveget folytatja.

Bár ezek a modellek rendkívül hatékonyak, a viselkedésük nagyon érzékeny a bevitelre. Így a gyors tervezés fontos képesség a fejlesztéshez.

A gyors építés nehéz lehet. A gyakorlatban a kérés úgy működik, hogy a modell súlyait a kívánt feladat elvégzéséhez konfigurálja, de ez inkább művészet, mint tudomány, gyakran tapasztalatot és intuíciót igényel egy sikeres kérés létrehozásához.

Modellek

A szolgáltatás több különböző modellhez biztosít hozzáférést a felhasználóknak. Minden modell más-más képességet és árpontot biztosít.

A DALL-E modellek (néhány előzetes verzióban, lásd a modelleket) képeket hoznak létre a felhasználó által biztosított szöveges kérésekből.

A Whisper-modellek a beszéd szöveggé való átírására és fordítására használhatók.

A jelenleg előzetes verzióban elérhető szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.

További információ az egyes modellekről a modellek koncepcióoldalán.

Következő lépések

További információ az Azure OpenAI-t használó mögöttes modellekről.

Megosztás a következőn keresztül: