Mi az Az Azure OpenAI Szolgáltatás?
Az Azure OpenAI szolgáltatás REST API-hozzáférést biztosít az OpenAI hatékony nyelvi modelljeihez, például o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo with Vision, GPT-4, GPT-3.5-Turbo és Embeddings modellsorozatokhoz. Ezek a modellek könnyen adaptálhatók az adott feladathoz, beleértve a tartalomgenerálást, az összegzést, a képfelismerést, a szemantikai keresést és a természetes nyelvet a kódfordításhoz. A felhasználók REST API-kkal, Python SDK-val vagy az Azure AI Studióban érhetik el a szolgáltatást.
Funkciók áttekintése
Szolgáltatás | Azure OpenAI |
---|---|
Elérhető modellek | o1-preview & o1-mini – (Korlátozott hozzáférés – Hozzáférés kérése) GPT-4o > GPT-4o mini GPT-4 sorozat (beleértve a GPT-4 Turbo with Vision) GPT-3.5-Turbo sorozat Beágyazási sorozat További információ a Modellek oldalon. |
Finomhangolás | GPT-4o-mini (előzetes verzió) GPT-4 (előzetes verzió) GPT-3.5-Turbo (0613) babbage-002 davinci-002 . |
Ár | Itt érhető el A GPT-4 Turbo with Vision szolgáltatással kapcsolatos részletekért tekintse meg a speciális díjszabási információkat. |
Virtuális hálózat támogatása és privát kapcsolat támogatása | Igen. |
Felügyelt identitás | Igen, a Microsoft Entra-azonosítón keresztül |
Felhasználói felület | Azure Portal fiók- és erőforrás-kezeléshez, Azure AI Studio modellfeltáráshoz és finomhangoláshoz |
Modell regionális rendelkezésre állása | Modell rendelkezésre állása |
Tartalomszűrés | A kérések és kiegészítések kiértékelése a tartalomszabályzatunk alapján történik automatizált rendszerekkel. A rendszer szűri a nagy súlyosságú tartalmakat. |
Felelős AI
A Microsoftnál elkötelezettek vagyunk a mesterséges intelligencia fejlődése mellett, amelyet az emberek elé helyező alapelvek vezérelnek. Az Azure OpenAI-ban elérhető generatív modellek jelentős potenciális előnyökkel járnak, de gondos tervezés és átgondolt megoldások nélkül az ilyen modellek helytelen vagy akár káros tartalmakat is eredményezhetnek. A Microsoft jelentős beruházásokat hajtott végre a visszaélések és a nem szándékos károk elleni védelem érdekében, beleértve a Microsoft felelősségteljes MI-használatra vonatkozó alapelveinek beépítését, a szolgáltatás használatára vonatkozó magatartási kódex elfogadását, az ügyfeleket támogató tartalomszűrők kiépítését, valamint a felelős AI-információk és útmutatás biztosítását, amelyeket az ügyfeleknek figyelembe kell venniük az Azure OpenAI használata során.
Hogyan hozzáférni az Azure OpenAI-hoz?
A legtöbb Azure OpenAI-modell eléréséhez nincs szükség korlátozott hozzáférésű regisztrációs űrlapra. További információ az Azure OpenAI Korlátozott hozzáférésű lapon.
Az Azure OpenAI és az OpenAI összehasonlítása
Az Azure OpenAI szolgáltatás speciális nyelvi AI-t biztosít az ügyfeleknek az OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper és szöveg beszédmodellekkel az Azure biztonsági és vállalati ígéretével. Az Azure OpenAI az OpenAI-val közösen fejleszti az API-kat, biztosítva a kompatibilitást és az egyikről a másikra való zökkenőmentes átmenetet.
Az Azure OpenAI-val az ügyfelek a Microsoft Azure biztonsági képességeit kapják, miközben ugyanazokat a modelleket futtatják, mint az OpenAI. Az Azure OpenAI privát hálózatkezelést, regionális rendelkezésre állást és felelős AI-tartalomszűrést kínál.
Fő fogalmak
Kérések > kitöltések
A befejezési végpont az API-szolgáltatás fő összetevője. Ez az API hozzáférést biztosít a modell szövegbeviteli, szövegkiírási felületéhez. A felhasználóknak egyszerűen meg kell adniuk az angol szöveg parancsot tartalmazó bemeneti kérést, és a modell szövegkimenetet hoz létre.
Íme egy példa egy egyszerű kérdésre és befejezésre:
Kérdés:
""" count to 5 in a for loop """
Befejezés:
for i in range(1, 6): print(i)
Tokenek
Szöveges jogkivonatok
Az Azure OpenAI a jogkivonatokra lebontva dolgozza fel a szöveget. A tokenek lehetnek szavak vagy csak karaktersorozatok. A "hamburger" szó például a "sonka", a "bur" és a "ger" jogkivonatra oszlik, míg egy rövid és gyakori szó, mint a "körte" egyetlen token. Számos jogkivonat egy szóközzel kezdődik, például " hello" és "bye".
Az adott kérésben feldolgozott tokenek teljes száma a bemeneti, kimeneti és kérési paraméterek hosszától függ. A feldolgozott jogkivonatok mennyisége a modellek válaszkésésén és átviteli sebességén is hatással lesz.
Kép jogkivonatai
Az Azure OpenAI képfeldolgozási képességei a GPT-4o, a GPT-4o mini és a GPT-4 Turbo with Vision modellek használatával kép jogkivonatokkal határozzák meg a képbemenetek által felhasznált tokenek teljes számát. A felhasznált tokenek számát két fő tényező alapján számítjuk ki: a kép részletességi szintje (alacsony vagy magas) és a kép mérete alapján. A jogkivonatok költségeinek kiszámítása a következőképpen történik:
- Kis felbontású mód
- Az alacsony részletesség lehetővé teszi, hogy az API gyorsabban válaszoljon olyan forgatókönyvekre, amelyekhez nincs szükség nagy képfelbontási elemzésre. Az alacsony részletességű képekhez használt jogkivonatok a következők:
- GPT-4o és GPT-4 Turbo a Vision használatával: Képenként 85 token átalánydíja, mérettől függetlenül.
- GPT-4o mini: Képenként 2833 token átalánydíja, mérettől függetlenül.
- Példa: 4096 x 8192 kép (alacsony részletességű): A költség rögzített 85 jogkivonat, mivel alacsony részletességű kép, és a méret nem befolyásolja ebben a módban a költségeket.
- Az alacsony részletesség lehetővé teszi, hogy az API gyorsabban válaszoljon olyan forgatókönyvekre, amelyekhez nincs szükség nagy képfelbontási elemzésre. Az alacsony részletességű képekhez használt jogkivonatok a következők:
- Nagy felbontású mód
- Az alacsony részletesség lehetővé teszi, hogy az API részletesebben elemezze a képeket. A rendszer a kép jogkivonatait a kép méretei alapján számítja ki. A számítás a következő lépéseket foglalja magában:
- Kép átméretezése: A rendszer úgy méretezi át a képet, hogy elférjen egy 2048 x 2048 képpontos négyzeten belül. Ha a legrövidebb oldal nagyobb, mint 768 képpont, a rendszer tovább átméretezi a képet, hogy a legrövidebb oldal 768 képpont hosszú legyen. Az átméretezés során az oldalarány megmarad.
- Csempeszámítás: Az átméretezés után a rendszer a képet 512 x 512 képpontos csempékre osztja. A részleges csempék teljes csempére vannak kerekítve. A csempék száma határozza meg a jogkivonat teljes költségét.
- Jogkivonat számítása:
- GPT-4o és GPT-4 Turbo vision: Minden 512 x 512 képpontos csempe 170 tokenbe kerül. A rendszer további 85 alapjogkivonatot ad hozzá az összeghez.
- GPT-4o mini: Minden 512 x 512 képpontos csempe 5667 tokenbe kerül. A rendszer további 2833 alapjogkivonatot ad hozzá az összeghez.
- Példa: 2048 x 4096 kép (nagy részletességgel):
- A kép eredetileg 1024 x 2048 képpont méretűre van átméretezve, hogy elférjen a 2048 x 2048 képpontos négyzeten belül.
- A kép további átméretezése 768 x 1536 képpontra, hogy a legrövidebb oldal legfeljebb 768 képpont hosszú legyen.
- A kép 2 x 3 csempére van osztva, egyenként 512 x 512 képpontra.
- Végső számítás:
- A GPT-4o és a GPT-4 Turbo with Vision esetében a token teljes költsége csempénként 6 csempe x 170 token + 85 alap jogkivonat = 1105 token.
- A GPT-4o mini esetében a token teljes költsége csempénként 6 csempe x 5667 token + 2833 alap jogkivonat = 36835 token.
- Az alacsony részletesség lehetővé teszi, hogy az API részletesebben elemezze a képeket. A rendszer a kép jogkivonatait a kép méretei alapján számítja ki. A számítás a következő lépéseket foglalja magában:
Források
Az Azure OpenAI egy új termékajánlat az Azure-ban. Az Azure OpenAI használatbavétele ugyanúgy történik, mint bármely más Azure-termék, ahol erőforrást vagy szolgáltatáspéldányt hoz létre az Azure-előfizetésben. További információ az Azure erőforrás-kezelési tervéről.
Központi telepítés
Miután létrehozott egy Azure OpenAI-erőforrást, üzembe kell helyeznie egy modellt, mielőtt elkezdené az API-hívások indítását és a szöveg létrehozását. Ez a művelet az üzembehelyezési API-k használatával végezhető el. Ezek az API-k lehetővé teszik a használni kívánt modell megadását.
Parancssori tervezés
Az OpenAI GPT-3, GPT-3.5 és GPT-4 modelljei parancssori alapúak. A parancssor-alapú modellek esetében a felhasználó szöveges üzenetek beírásával kezeli a modellt, amely a szöveg kiegészítésével válaszol. Ezzel a kiegészítéssel a modell a bevitt szöveget folytatja.
Bár ezek a modellek rendkívül hatékonyak, a viselkedésük nagyon érzékeny a bevitelre. Így a gyors tervezés fontos képesség a fejlesztéshez.
A gyors építés nehéz lehet. A gyakorlatban a kérés úgy működik, hogy a modell súlyait a kívánt feladat elvégzéséhez konfigurálja, de ez inkább művészet, mint tudomány, gyakran tapasztalatot és intuíciót igényel egy sikeres kérés létrehozásához.
Modellek
A szolgáltatás több különböző modellhez biztosít hozzáférést a felhasználóknak. Minden modell más-más képességet és árpontot biztosít.
A DALL-E modellek (néhány előzetes verzióban, lásd a modelleket) képeket hoznak létre a felhasználó által biztosított szöveges kérésekből.
A Whisper-modellek a beszéd szöveggé való átírására és fordítására használhatók.
A jelenleg előzetes verzióban elérhető szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.
További információ az egyes modellekről a modellek koncepcióoldalán.
Következő lépések
További információ az Azure OpenAI-t használó mögöttes modellekről.