Co je služba Azure OpenAI?

Článek
01/30/2025

Služba Azure OpenAI poskytuje rozhraní REST API přístup k výkonným jazykovým modelům OpenAI, včetně o3-mini, o1,o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo s obrazem, GPT-4, GPT-3.5-Turbo a řady modelů vkládání. Tyto modely je možné snadno přizpůsobit konkrétnímu úkolu, a to včetně generování obsahu, shrnutí, porozumění obrázkům, sémantického vyhledávání a přirozeného jazyka na překlad kódu. Uživatelé mají přístup ke službě prostřednictvím rozhraní REST API, sady Python SDK nebo azure AI Foundry.

Přehled funkcí

Funkce	Azure OpenAI
Dostupné modely	o3-mini &o1 - (Omezený přístup - Žádost o přístup) o1-mini GPT-4o & GPT-4o mini Řada GPT-4 (včetně GPT-4 Turbo s obrazem) ŘADA GPT-3.5-Turbo Vložené řady Další informace najdete na stránce Modely .
Jemné ladění	`GPT-4o-mini` (Preview) `GPT-4` (Preview) `GPT-3.5-Turbo` (0613) `babbage-002` `davinci-002`.
Cena	K dispozici zde Podrobnosti o modelech chatu s podporou zpracování obrazu najdete ve speciálních informacích o cenách.
Podpora virtuální sítě a podpora privátního propojení	Ano.
Spravovaná identita	Ano, prostřednictvím Microsoft Entra ID
Uživatelské rozhraní	Azure Portal pro správu účtů a prostředků, Azure AI Foundry pro zkoumání modelů a vyladění
Regionální dostupnost modelu	Dostupnost modelu
Filtrování obsahu	Výzvy a dokončení se vyhodnocují proti zásadám obsahu pomocí automatizovaných systémů. Obsah s vysokou závažností se filtruje.

Zodpovědná AI

V Microsoftu jsme se zavázali k pokroku umělé inteligence řízeného principy, které lidem dávají přednost. Generování modelů, jako jsou modely dostupné v Azure OpenAI, mají významné potenciální výhody, ale bez pečlivého návrhu a promyšleného zmírnění rizik mají tyto modely potenciál generovat nesprávný nebo dokonce škodlivý obsah. Společnost Microsoft významně investovala do ochrany před zneužitím a nezamýšleným poškozením, včetně zahrnutí principů Microsoftu pro zodpovědné použití umělé inteligence, přijetí pravidla chování pro používání služby, vytváření filtrů obsahu pro podporu zákazníků a poskytování zodpovědných informací a pokynů , které by zákazníci měli zvážit při používání Azure OpenAI.

Začínáme se službou Azure OpenAI

Pokud chcete začít se službou Azure OpenAI, musíte ve svém předplatném Azure vytvořit prostředek služby Azure OpenAI.

Začněte vytvořením a nasazením průvodce prostředkem služby Azure OpenAI Service.

Prostředek můžete vytvořit prostřednictvím webu Azure Portal, Azure CLI nebo Azure PowerShellu.
Pokud máte prostředek služby Azure OpenAI, můžete nasadit model, jako je GPT-4o.
Když máte nasazený model, můžete:
- Vyzkoušejte dětské hřiště portálu Azure AI Foundry a prozkoumejte možnosti modelů.
- Můžete také začít volat rozhraní API do služby pomocí rozhraní REST API nebo sad SDK.
Můžete například vyzkoušet zvuk a asistenty v reálném čase na hřišti nebo prostřednictvím kódu.

Poznámka:

Pro přístup k některým modelům nebo funkcím služby Azure OpenAI se vyžaduje registrační formulář s omezeným přístupem. Další informace najdete na stránce s omezeným přístupem k Azure OpenAI.

Porovnání Azure OpenAI a OpenAI

Služba Azure OpenAI poskytuje zákazníkům pokročilou jazykovou AI s využitím OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper a textových modelů s využitím zabezpečení a podnikového příslibu Azure. Azure OpenAI společně vyvíjí rozhraní API s OpenAI a zajišťuje kompatibilitu a hladký přechod z jednoho na druhý.

Zákazníci s Azure OpenAI získají možnosti zabezpečení Microsoft Azure a zároveň spouštět stejné modely jako OpenAI. Azure OpenAI nabízí privátní sítě, regionální dostupnost a zodpovědné filtrování obsahu AI.

Klíčové koncepty

Výzvy a dokončení

Koncový bod dokončení je základní komponentou služby API. Toto rozhraní API poskytuje přístup k textovému rozhraní modelu. Uživatelé jednoduše potřebují zadat vstupní výzvu obsahující příkaz anglického textu a model vygeneruje dokončování textu.

Tady je příklad jednoduché výzvy a dokončení:

Výzva: """ count to 5 in a for loop """

Dokončení: for i in range(1, 6): print(i)

Tokeny

Textové tokeny

Azure OpenAI zpracovává text tím, že ho rozdělí na tokeny. Tokeny mohou být slova nebo jen bloky znaků. Například slovo "hamburger" se rozdělí na tokeny "ham", "bur" a "ger", zatímco krátké a běžné slovo jako "hrušeň" je jediný token. Mnoho tokenů začíná prázdnými znaky, například "hello" a "bye".

Celkový počet tokenů zpracovaných v daném požadavku závisí na délce vstupních, výstupních a požadovaných parametrů. Množství zpracovávaných tokenů ovlivní také latenci a propustnost odpovědí pro modely.

Tokeny obrázků

Možnosti zpracování obrázků v Azure OpenAI s modely GPT-4o, GPT-4o mini a GPT-4 Turbo s vision používají tokenizaci obrázků k určení celkového počtu tokenů spotřebovaných vstupy obrázků. Počet spotřebovaných tokenů se vypočítá na základě dvou hlavních faktorů: úrovně podrobností obrázku (nízké nebo vysoké) a rozměrů obrázku. Tady je způsob výpočtu nákladů na tokeny:

Režim nízkého rozlišení
- Nízké podrobnosti umožňují rozhraní API vracet rychlejší odpovědi pro scénáře, které nevyžadují analýzu vysokého rozlišení obrázků. Tokeny spotřebované pro obrázky s nízkými podrobnostmi jsou:
  - GPT-4o a GPT-4 Turbo s obrazem: Plochá rychlost 85 tokenů na obrázek bez ohledu na velikost.
  - GPT-4o mini: Plochá rychlost 2833 tokenů na obrázek bez ohledu na velikost.
- Příklad: 4096 x 8192 obrázek (nízký detail):: Náklady jsou pevné 85 tokenů s GPT-4o, protože je to obrázek s nízkými podrobnostmi a velikost nemá vliv na náklady v tomto režimu.
Režim vysokého rozlišení
- Podrobné informace umožňují rozhraní API analyzovat obrázky podrobněji. Tokeny obrázků se počítají na základě rozměrů obrázku. Výpočet zahrnuje následující kroky:
  1. Změna velikosti obrázku: Velikost obrázku se změní tak, aby se vešla do čtverce 2048 × 2048 pixelů. Pokud je nejkratší strana větší než 768 pixelů, obrázek se dále změní tak, aby nejkratší strana byla dlouhá 768 pixelů. Poměr stran se zachová během změny velikosti.
  2. Výpočet dlaždice: Po změně velikosti se obrázek rozdělí na dlaždice o velikosti 512 x 512 pixelů. Všechny částečné dlaždice se zaokrouhlují nahoru na celou dlaždici. Počet dlaždic určuje celkové náklady na tokeny.
  3. Výpočet tokenu:
    - GPT-4o a GPT-4 Turbo s obrazem: Každý 512 x 512 pixelů dlaždice stojí 170 tokenů. K celkovému součtu se přidá dalších 85 základních tokenů .
    - GPT-4o mini: Každá dlaždice 512 x 512 pixelů stojí 5667 tokenů. K celkovému součtu se přidá dalších 2833 základních tokenů .
- Příklad: 2048 x 4096 obrázek (high detail):
  1. Obrázek je zpočátku změněn na 1024 x 2048 pixelů tak, aby se vešl do čtverce 2048 x 2048 pixelů.
  2. Obrázek je dále změněn na 768 × 1536 pixelů, aby se zajistilo, že nejkratší strana je maximálně 768 pixelů dlouhá.
  3. Obrázek je rozdělený na 2 x 3 dlaždice, každý 512 x 512 pixelů.
  4. Konečný výpočet:
    - U GPT-4o a GPT-4 Turbo s vision jsou celkové náklady na tokeny 6 dlaždic x 170 tokenů na dlaždici + 85 základních tokenů = 1105 tokenů.
    - V případě GPT-4o mini jsou celkové náklady na tokeny 6 dlaždic × 5667 tokenů na dlaždici + 2833 základních tokenů = 36835 tokenů.

Zdroje informací

Azure OpenAI je nová nabídka produktů v Azure. S Azure OpenAI můžete začít stejným způsobem jako s jakýmkoli jiným produktem Azure, ve kterém ve svém předplatném Azure vytvoříte prostředek nebo instanci služby. O návrhu správy prostředků Azure si můžete přečíst další informace.

Nasazení

Jakmile vytvoříte prostředek Azure OpenAI, musíte model nasadit, abyste mohli začít volat rozhraní API a generovat text. Tuto akci je možné provést pomocí rozhraní API pro nasazení. Tato rozhraní API umožňují určit model, který chcete použít.

Vytváření efektivních dotazů

Modely GPT-3, GPT-3.5 a GPT-4 z OpenAI jsou založené na příkazovém řádku. S modely založenými na dotazech uživatel komunikuje zadáním textového dotazu, na který model reaguje doplněním textu. Toto dokončení je pokračováním modelu vstupního textu.

I když jsou tyto modely výkonné, jejich chování je také citlivé na výzvu. Díky tomu je příprava výzvy důležitou dovedností k vývoji.

Konstrukce výzvy může být obtížná. V praxi se výzva chová ke konfiguraci hmotností modelu tak, aby dokončila požadovaný úkol, ale je to spíše umění než věda, která často vyžaduje zkušenosti a instinkt k vytvoření úspěšné výzvy.

Modely

Služba poskytuje uživatelům přístup k několika různým modelům. Každý model poskytuje jinou funkci a cenový bod.

Modely DALL-E (některé ve verzi Preview; viz modely) generují obrázky z textových výzev, které uživatel poskytuje.

Modely Šeptání lze použít k přepisu a překladu řeči na text.

Text na řečové modely, které jsou aktuálně ve verzi Preview, lze použít k syntetizaci textu na řeč.

Další informace o jednotlivých modelech najdete na stránce konceptů modelů.

Další kroky

Přečtěte si další informace o základních modelech, které power Azure OpenAI.

Sdílet prostřednictvím