Co je služba Azure OpenAI?
Služba Azure OpenAI poskytuje rozhraní REST API přístup k výkonným jazykovým modelům OpenAI, včetně modelů o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo s vision, GPT-4, GPT-3.5-Turbo a vložených modelových řad. Tyto modely je možné snadno přizpůsobit konkrétnímu úkolu, a to včetně generování obsahu, shrnutí, porozumění obrázkům, sémantického vyhledávání a přirozeného jazyka na překlad kódu. Uživatelé mají přístup ke službě prostřednictvím rozhraní REST API, sady Python SDK nebo v Azure AI Studiu.
Přehled funkcí
Funkce | Azure OpenAI |
---|---|
Dostupné modely | o1-preview & o1-mini - (Omezený přístup - Žádost o přístup) GPT-4o & GPT-4o mini Řada GPT-4 (včetně GPT-4 Turbo s obrazem) ŘADA GPT-3.5-Turbo Vložené řady Další informace najdete na stránce Modely . |
Jemné ladění | GPT-4o-mini (Preview) GPT-4 (Preview) GPT-3.5-Turbo (0613) babbage-002 davinci-002 . |
Cena | K dispozici zde Podrobnosti o GPT-4 Turbo s vision najdete v speciálních informacích o cenách. |
Podpora virtuální sítě a podpora privátního propojení | Ano. |
Spravovaná identita | Ano, prostřednictvím Microsoft Entra ID |
Uživatelské rozhraní | Azure Portal pro správu účtů a prostředků, Azure AI Studio pro zkoumání modelů a vyladění |
Regionální dostupnost modelu | Dostupnost modelu |
Filtrování obsahu | Výzvy a dokončení se vyhodnocují proti zásadám obsahu pomocí automatizovaných systémů. Obsah s vysokou závažností se filtruje. |
Zodpovědná AI
V Microsoftu jsme se zavázali k pokroku umělé inteligence řízeného principy, které lidem dávají přednost. Generování modelů, jako jsou modely dostupné v Azure OpenAI, mají významné potenciální výhody, ale bez pečlivého návrhu a promyšleného zmírnění rizik mají tyto modely potenciál generovat nesprávný nebo dokonce škodlivý obsah. Společnost Microsoft významně investovala do ochrany před zneužitím a nezamýšleným poškozením, včetně zahrnutí principů Microsoftu pro zodpovědné použití umělé inteligence, přijetí pravidla chování pro používání služby, vytváření filtrů obsahu pro podporu zákazníků a poskytování zodpovědných informací a pokynů , které by zákazníci měli zvážit při používání Azure OpenAI.
Začínáme se službou Azure OpenAI
Pokud chcete začít se službou Azure OpenAI, musíte ve svém předplatném Azure vytvořit prostředek služby Azure OpenAI.
Začněte vytvořením a nasazením průvodce prostředkem služby Azure OpenAI Service.
Prostředek můžete vytvořit prostřednictvím webu Azure Portal, Azure CLI nebo Azure PowerShellu.
Pokud máte prostředek služby Azure OpenAI, můžete nasadit model, jako je GPT-4o.
Když máte nasazený model, můžete:
- Vyzkoušejte si dětské hřiště Azure AI Studio a prozkoumejte možnosti modelů.
- Můžete také začít volat rozhraní API do služby pomocí rozhraní REST API nebo sad SDK.
Můžete například vyzkoušet zvuk a asistenty v reálném čase na hřišti nebo prostřednictvím kódu.
Poznámka:
Pro přístup k některým modelům nebo funkcím služby Azure OpenAI se vyžaduje registrační formulář s omezeným přístupem. Další informace najdete na stránce s omezeným přístupem k Azure OpenAI.
Porovnání Azure OpenAI a OpenAI
Služba Azure OpenAI poskytuje zákazníkům pokročilou jazykovou AI s využitím OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper a textových modelů s využitím zabezpečení a podnikového příslibu Azure. Azure OpenAI společně vyvíjí rozhraní API s OpenAI a zajišťuje kompatibilitu a hladký přechod z jednoho na druhý.
Zákazníci s Azure OpenAI získají možnosti zabezpečení Microsoft Azure a zároveň spouštět stejné modely jako OpenAI. Azure OpenAI nabízí privátní sítě, regionální dostupnost a zodpovědné filtrování obsahu AI.
Klíčové koncepty
Výzvy a dokončení
Koncový bod dokončení je základní komponentou služby API. Toto rozhraní API poskytuje přístup k textovému rozhraní modelu. Uživatelé jednoduše potřebují zadat vstupní výzvu obsahující příkaz anglického textu a model vygeneruje dokončování textu.
Tady je příklad jednoduché výzvy a dokončení:
Výzva:
""" count to 5 in a for loop """
Dokončení:
for i in range(1, 6): print(i)
Tokeny
Textové tokeny
Azure OpenAI zpracovává text tím, že ho rozdělí na tokeny. Tokeny mohou být slova nebo jen bloky znaků. Například slovo "hamburger" se rozdělí na tokeny "ham", "bur" a "ger", zatímco krátké a běžné slovo jako "hrušeň" je jediný token. Mnoho tokenů začíná prázdnými znaky, například "hello" a "bye".
Celkový počet tokenů zpracovaných v daném požadavku závisí na délce vstupních, výstupních a požadovaných parametrů. Množství zpracovávaných tokenů ovlivní také latenci a propustnost odpovědí pro modely.
Tokeny obrázků
Možnosti zpracování obrázků v Azure OpenAI s modely GPT-4o, GPT-4o mini a GPT-4 Turbo s vision používají tokenizaci obrázků k určení celkového počtu tokenů spotřebovaných vstupy obrázků. Počet spotřebovaných tokenů se vypočítá na základě dvou hlavních faktorů: úrovně podrobností obrázku (nízké nebo vysoké) a rozměrů obrázku. Tady je způsob výpočtu nákladů na tokeny:
- Režim nízkého rozlišení
- Nízké podrobnosti umožňují rozhraní API vracet rychlejší odpovědi pro scénáře, které nevyžadují analýzu vysokého rozlišení obrázků. Tokeny spotřebované pro obrázky s nízkými podrobnostmi jsou:
- GPT-4o a GPT-4 Turbo s obrazem: Plochá rychlost 85 tokenů na obrázek bez ohledu na velikost.
- GPT-4o mini: Plochá rychlost 2833 tokenů na obrázek bez ohledu na velikost.
- Příklad: 4096 x 8192 obrázek (nízký detail):: Náklady jsou pevné 85 tokenů s GPT-4o, protože je to obrázek s nízkými podrobnostmi a velikost nemá vliv na náklady v tomto režimu.
- Nízké podrobnosti umožňují rozhraní API vracet rychlejší odpovědi pro scénáře, které nevyžadují analýzu vysokého rozlišení obrázků. Tokeny spotřebované pro obrázky s nízkými podrobnostmi jsou:
- Režim vysokého rozlišení
- Podrobné informace umožňují rozhraní API analyzovat obrázky podrobněji. Tokeny obrázků se počítají na základě rozměrů obrázku. Výpočet zahrnuje následující kroky:
- Změna velikosti obrázku: Velikost obrázku se změní tak, aby se vešla do čtverce 2048 × 2048 pixelů. Pokud je nejkratší strana větší než 768 pixelů, obrázek se dále změní tak, aby nejkratší strana byla dlouhá 768 pixelů. Poměr stran se zachová během změny velikosti.
- Výpočet dlaždice: Po změně velikosti se obrázek rozdělí na dlaždice o velikosti 512 x 512 pixelů. Všechny částečné dlaždice se zaokrouhlují nahoru na celou dlaždici. Počet dlaždic určuje celkové náklady na tokeny.
- Výpočet tokenu:
- GPT-4o a GPT-4 Turbo s obrazem: Každý 512 x 512 pixelů dlaždice stojí 170 tokenů. K celkovému součtu se přidá dalších 85 základních tokenů .
- GPT-4o mini: Každá dlaždice 512 x 512 pixelů stojí 5667 tokenů. K celkovému součtu se přidá dalších 2833 základních tokenů .
- Příklad: 2048 x 4096 obrázek (high detail):
- Obrázek je zpočátku změněn na 1024 x 2048 pixelů tak, aby se vešl do čtverce 2048 x 2048 pixelů.
- Obrázek je dále změněn na 768 × 1536 pixelů, aby se zajistilo, že nejkratší strana je maximálně 768 pixelů dlouhá.
- Obrázek je rozdělený na 2 x 3 dlaždice, každý 512 x 512 pixelů.
- Konečný výpočet:
- U GPT-4o a GPT-4 Turbo s vision jsou celkové náklady na tokeny 6 dlaždic x 170 tokenů na dlaždici + 85 základních tokenů = 1105 tokenů.
- V případě GPT-4o mini jsou celkové náklady na tokeny 6 dlaždic × 5667 tokenů na dlaždici + 2833 základních tokenů = 36835 tokenů.
- Podrobné informace umožňují rozhraní API analyzovat obrázky podrobněji. Tokeny obrázků se počítají na základě rozměrů obrázku. Výpočet zahrnuje následující kroky:
Zdroje informací
Azure OpenAI je nová nabídka produktů v Azure. S Azure OpenAI můžete začít stejným způsobem jako s jakýmkoli jiným produktem Azure, ve kterém ve svém předplatném Azure vytvoříte prostředek nebo instanci služby. O návrhu správy prostředků Azure si můžete přečíst další informace.
Nasazení
Jakmile vytvoříte prostředek Azure OpenAI, musíte model nasadit, abyste mohli začít volat rozhraní API a generovat text. Tuto akci je možné provést pomocí rozhraní API pro nasazení. Tato rozhraní API umožňují určit model, který chcete použít.
Vytváření efektivních dotazů
Modely GPT-3, GPT-3.5 a GPT-4 z OpenAI jsou založené na příkazovém řádku. S modely založenými na dotazech uživatel komunikuje zadáním textového dotazu, na který model reaguje doplněním textu. Toto dokončení je pokračováním modelu vstupního textu.
I když jsou tyto modely výkonné, jejich chování je také citlivé na výzvu. Díky tomu je příprava výzvy důležitou dovedností k vývoji.
Konstrukce výzvy může být obtížná. V praxi se výzva chová ke konfiguraci hmotností modelu tak, aby dokončila požadovaný úkol, ale je to spíše umění než věda, která často vyžaduje zkušenosti a instinkt k vytvoření úspěšné výzvy.
Modely
Služba poskytuje uživatelům přístup k několika různým modelům. Každý model poskytuje jinou funkci a cenový bod.
Modely DALL-E (některé ve verzi Preview; viz modely) generují obrázky z textových výzev, které uživatel poskytuje.
Modely Šeptání lze použít k přepisu a překladu řeči na text.
Text na řečové modely, které jsou aktuálně ve verzi Preview, lze použít k syntetizaci textu na řeč.
Další informace o jednotlivých modelech najdete na stránce konceptů modelů.
Další kroky
Přečtěte si další informace o základních modelech, které power Azure OpenAI.