Co je služba Azure OpenAI?
Služba Azure OpenAI poskytuje rozhraní REST API přístup k výkonným jazykovým modelům OpenAI, včetně modelů o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo s vision, GPT-4, GPT-3.5-Turbo a vložených modelových řad. Tyto modely je možné snadno přizpůsobit konkrétnímu úkolu, a to včetně generování obsahu, shrnutí, porozumění obrázkům, sémantického vyhledávání a přirozeného jazyka na překlad kódu. Uživatelé mají přístup ke službě prostřednictvím rozhraní REST API, sady Python SDK nebo v Azure AI Studiu.
Přehled funkcí
Funkce | Azure OpenAI |
---|---|
Dostupné modely | o1-preview & o1-mini - (Omezený přístup - Žádost o přístup) GPT-4o & GPT-4o mini Řada GPT-4 (včetně GPT-4 Turbo s obrazem) ŘADA GPT-3.5-Turbo Vložené řady Další informace najdete na stránce Modely . |
Jemné ladění | GPT-4o-mini (Preview) GPT-4 (Preview) GPT-3.5-Turbo (0613) babbage-002 davinci-002 . |
Cena | K dispozici zde Podrobnosti o GPT-4 Turbo s vision najdete v speciálních informacích o cenách. |
Podpora virtuální sítě a podpora privátního propojení | Ano. |
Spravovaná identita | Ano, prostřednictvím Microsoft Entra ID |
Uživatelské rozhraní | Azure Portal pro správu účtů a prostředků, Azure AI Studio pro zkoumání modelů a vyladění |
Regionální dostupnost modelu | Dostupnost modelu |
Filtrování obsahu | Výzvy a dokončení se vyhodnocují proti zásadám obsahu pomocí automatizovaných systémů. Obsah s vysokou závažností bude filtrován. |
Zodpovědná AI
V Microsoftu jsme se zavázali k pokroku umělé inteligence řízeného principy, které lidem dávají přednost. Generování modelů, jako jsou modely dostupné v Azure OpenAI, mají významné potenciální výhody, ale bez pečlivého návrhu a promyšleného zmírnění rizik mají tyto modely potenciál generovat nesprávný nebo dokonce škodlivý obsah. Společnost Microsoft významně investovala do ochrany před zneužitím a nezamýšleným poškozením, včetně zahrnutí principů Microsoftu pro zodpovědné použití umělé inteligence, přijetí pravidla chování pro používání služby, vytváření filtrů obsahu pro podporu zákazníků a poskytování zodpovědných informací a pokynů , které by zákazníci měli zvážit při používání Azure OpenAI.
Návody získat přístup k Azure OpenAI?
Pro přístup k většině modelů Azure OpenAI se nevyžaduje registrační formulář s omezeným přístupem. Další informace najdete na stránce s omezeným přístupem k Azure OpenAI.
Porovnání Azure OpenAI a OpenAI
Služba Azure OpenAI poskytuje zákazníkům pokročilou jazykovou AI s využitím OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper a textových modelů s využitím zabezpečení a podnikového příslibu Azure. Azure OpenAI společně vyvíjí rozhraní API s OpenAI a zajišťuje kompatibilitu a hladký přechod z jednoho na druhý.
Zákazníci s Azure OpenAI získají možnosti zabezpečení Microsoft Azure a zároveň spouštět stejné modely jako OpenAI. Azure OpenAI nabízí privátní sítě, regionální dostupnost a zodpovědné filtrování obsahu AI.
Klíčové koncepty
Výzvy a dokončení
Koncový bod dokončení je základní komponentou služby API. Toto rozhraní API poskytuje přístup k textovému rozhraní modelu. Uživatelé jednoduše potřebují zadat vstupní výzvu obsahující příkaz anglického textu a model vygeneruje dokončování textu.
Tady je příklad jednoduché výzvy a dokončení:
Výzva:
""" count to 5 in a for loop """
Dokončení:
for i in range(1, 6): print(i)
Tokeny
Textové tokeny
Azure OpenAI zpracovává text tím, že ho rozdělí na tokeny. Tokeny mohou být slova nebo jen bloky znaků. Například slovo "hamburger" se rozdělí na tokeny "ham", "bur" a "ger", zatímco krátké a běžné slovo jako "hrušeň" je jediný token. Mnoho tokenů začíná prázdnými znaky, například "hello" a "bye".
Celkový počet tokenů zpracovaných v daném požadavku závisí na délce vstupu, výstupu a parametrů požadavku. Množství zpracovávaných tokenů ovlivní také latenci a propustnost odpovědí pro modely.
Tokeny obrázků
Možnosti zpracování obrázků v Azure OpenAI s modely GPT-4o, GPT-4o mini a GPT-4 Turbo s vision používají tokenizaci obrázků k určení celkového počtu tokenů spotřebovaných vstupy obrázků. Počet spotřebovaných tokenů se vypočítá na základě dvou hlavních faktorů: úrovně podrobností obrázku (nízké nebo vysoké) a rozměrů obrázku. Tady je způsob výpočtu nákladů na tokeny:
- Režim nízkého rozlišení
- Nízké podrobnosti umožňují rozhraní API vracet rychlejší odpovědi pro scénáře, které nevyžadují analýzu vysokého rozlišení obrázků. Tokeny spotřebované pro obrázky s nízkými podrobnostmi jsou:
- GPT-4o a GPT-4 Turbo s obrazem: Plochá rychlost 85 tokenů na obrázek bez ohledu na velikost.
- GPT-4o mini: Plochá rychlost 2833 tokenů na obrázek bez ohledu na velikost.
- Příklad: 4096 x 8192 obrázek (nízký detail):: Náklady jsou pevné 85 tokenů, protože se jedná o obrázek s nízkými podrobnostmi a velikost nemá vliv na náklady v tomto režimu.
- Nízké podrobnosti umožňují rozhraní API vracet rychlejší odpovědi pro scénáře, které nevyžadují analýzu vysokého rozlišení obrázků. Tokeny spotřebované pro obrázky s nízkými podrobnostmi jsou:
- Režim vysokého rozlišení
- Nízké podrobnosti umožňují rozhraní API analyzovat obrázky podrobněji. Tokeny obrázků se počítají na základě rozměrů obrázku. Výpočet zahrnuje následující kroky:
- Změna velikosti obrázku: Velikost obrázku se změní tak, aby se vešla do čtverce 2048 × 2048 pixelů. Pokud je nejkratší strana větší než 768 pixelů, obrázek se dále změní tak, aby nejkratší strana byla dlouhá 768 pixelů. Poměr stran se zachová během změny velikosti.
- Výpočet dlaždice: Po změně velikosti se obrázek rozdělí na dlaždice o velikosti 512 x 512 pixelů. Všechny částečné dlaždice se zaokrouhlují nahoru na celou dlaždici. Počet dlaždic určuje celkové náklady na tokeny.
- Výpočet tokenu:
- GPT-4o a GPT-4 Turbo s obrazem: Každý 512 x 512 pixelů dlaždice stojí 170 tokenů. K celkovému součtu se přidá dalších 85 základních tokenů .
- GPT-4o mini: Každá dlaždice 512 x 512 pixelů stojí 5667 tokenů. K celkovému součtu se přidá dalších 2833 základních tokenů .
- Příklad: 2048 x 4096 obrázek (high detail):
- Obrázek je zpočátku změněn na 1024 x 2048 pixelů tak, aby se vešl do čtverce 2048 x 2048 pixelů.
- Obrázek je dále změněn na 768 × 1536 pixelů, aby se zajistilo, že nejkratší strana je maximálně 768 pixelů dlouhá.
- Obrázek je rozdělený na 2 x 3 dlaždice, každý 512 x 512 pixelů.
- Konečný výpočet:
- U GPT-4o a GPT-4 Turbo s vision jsou celkové náklady na tokeny 6 dlaždic x 170 tokenů na dlaždici + 85 základních tokenů = 1105 tokenů.
- V případě GPT-4o mini jsou celkové náklady na tokeny 6 dlaždic × 5667 tokenů na dlaždici + 2833 základních tokenů = 36835 tokenů.
- Nízké podrobnosti umožňují rozhraní API analyzovat obrázky podrobněji. Tokeny obrázků se počítají na základě rozměrů obrázku. Výpočet zahrnuje následující kroky:
Zdroje informací
Azure OpenAI je nová nabídka produktů v Azure. S Azure OpenAI můžete začít stejným způsobem jako s jakýmkoli jiným produktem Azure, ve kterém ve svém předplatném Azure vytvoříte prostředek nebo instanci služby. O návrhu správy prostředků Azure si můžete přečíst další informace.
Nasazení
Jakmile vytvoříte prostředek Azure OpenAI, musíte model nasadit, abyste mohli začít volat rozhraní API a generovat text. Tuto akci je možné provést pomocí rozhraní API pro nasazení. Tato rozhraní API umožňují určit model, který chcete použít.
Vytváření efektivních dotazů
Modely GPT-3, GPT-3.5 a GPT-4 z OpenAI jsou založené na příkazovém řádku. S modely založenými na dotazech uživatel komunikuje zadáním textového dotazu, na který model reaguje doplněním textu. Toto dokončení je pokračováním modelu vstupního textu.
I když jsou tyto modely mimořádně výkonné, jejich chování je také velmi citlivé na konkrétní dotazy. Díky tomu je příprava výzvy důležitou dovedností k vývoji.
Konstrukce výzvy může být obtížná. V praxi se výzva chová ke konfiguraci hmotností modelu tak, aby dokončila požadovaný úkol, ale je to spíše umění než věda, která často vyžaduje zkušenosti a instinkt k vytvoření úspěšné výzvy.
Modely
Služba poskytuje uživatelům přístup k několika různým modelům. Každý model poskytuje jinou funkci a cenový bod.
Modely DALL-E (některé ve verzi Preview; viz modely) generují obrázky z textových výzev, které uživatel poskytuje.
Modely Šeptání lze použít k přepisu a překladu řeči na text.
Text na řečové modely, které jsou aktuálně ve verzi Preview, lze použít k syntetizaci textu na řeč.
Další informace o jednotlivých modelech najdete na stránce konceptů modelů.
Další kroky
Přečtěte si další informace o základních modelech, které power Azure OpenAI.