Co je Azure OpenAI v modelech Azure AI Foundry?

2025-07-02

Azure OpenAI poskytuje přístup k REST API výrazně výkonným jazykovým modelům OpenAI, včetně o4-mini, o3, gpt-4.1, o3-mini, o1, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo s vizí, GPT-4, GPT-3.5-Turbo a série modelů Embeddings. Tyto modely je možné snadno přizpůsobit konkrétnímu úkolu, a to včetně generování obsahu, shrnutí, porozumění obrázkům, sémantického vyhledávání a přirozeného jazyka na překlad kódu. Uživatelé mají přístup ke službě prostřednictvím rozhraní REST API, Python/C#/JS/Java/Go SDK.

Přehled funkcí

Vlastnost	Azure OpenAI
Dostupné modely	o4-mini & o3 gpt-4.1 náhled používání počítače o3-mini & o1 o1-mini GPT-4o & GPT-4o mini Řada GPT-4 (včetně GPT-4 Turbo s obrazem) ŘADA GPT-3.5-Turbo Vložené řady Další informace najdete na stránce Modely .
Jemné doladění	`GPT-4o-mini` (Preview) `GPT-4` (Preview) `GPT-3.5-Turbo` (0613).
Cena	K dispozici zde Podrobnosti o modelech chatu s podporou zpracování obrazu najdete ve speciálních informacích o cenách.
Podpora virtuální sítě a podpora privátního propojení	Ano.
Spravovaná identita	Ano, prostřednictvím Microsoft Entra ID
Uživatelské rozhraní	Azure Portal pro správu účtů a prostředků, Azure AI Foundry pro zkoumání modelů a vyladění
Regionální dostupnost modelu	Dostupnost modelu
Filtrování obsahu	Výzvy a dokončení se vyhodnocují podle našich zásad obsahu pomocí automatizovaných systémů. Obsah s vysokou závažností se filtruje.

Zodpovědná AI

V Microsoftu jsme se zavázali k pokroku umělé inteligence řízeného principy, které lidem dávají přednost. Generování modelů, jako jsou modely dostupné v Azure OpenAI, mají významné potenciální výhody, ale bez pečlivého návrhu a promyšleného zmírnění rizik mají tyto modely potenciál generovat nesprávný nebo dokonce škodlivý obsah. Společnost Microsoft významně investovala do ochrany před zneužitím a nezamýšleným poškozením, včetně začlenění principů Microsoftu pro zodpovědné použití umělé inteligence a přijetí kodexu chování , které by zákazníci měli zvážit při používání Azure OpenAI.

Začínáme s Azure OpenAI

Pokud chcete začít s Azure OpenAI, musíte ve svém předplatném Azure vytvořit prostředek Azure OpenAI.

Začněte s průvodcem Vytvoření a nasazení prostředku Azure OpenAI.

Prostředek můžete vytvořit prostřednictvím webu Azure Portal, Azure CLI nebo Azure PowerShellu.
Pokud máte prostředek Azure OpenAI, můžete nasadit model, jako je GPT-4o.
Když máte nasazený model, můžete:
- Vyzkoušejte dětské hřiště portálu Azure AI Foundry a prozkoumejte možnosti modelů.
- Můžete také jednoduše začít provádět požadavky na službu pomocí REST API nebo SDK.
Můžete například vyzkoušet zvuk v reálném čase v dětském hřišti nebo prostřednictvím kódu.

Poznámka:

Pro přístup k některým modelům nebo funkcím Azure OpenAI se vyžaduje registrační formulář s omezeným přístupem. Další informace najdete na stránce s omezeným přístupem k Azure OpenAI.

Porovnání Azure OpenAI a OpenAI

Azure OpenAI poskytuje zákazníkům pokročilou jazykovou AI s architekturou OpenAI GPT-4, GPT-3, Codex, GPT-image-1 (Preview), DALL-E, převodem řeči na text a převodem textu na řečové modely s využitím zabezpečení a podnikového příslibu Azure. Azure OpenAI společně vyvíjí rozhraní API s OpenAI a zajišťuje kompatibilitu a hladký přechod z jednoho na druhý.

Zákazníci s Azure OpenAI získají možnosti zabezpečení Microsoft Azure a zároveň spouštět stejné modely jako OpenAI. Azure OpenAI nabízí privátní sítě, regionální dostupnost a zodpovědné filtrování obsahu AI.

Klíčové koncepty

Podněty a dokončení

Koncový bod dokončení je základní komponentou služby API. Toto rozhraní API poskytuje přístup k textovému rozhraní modelu. Uživatelé jednoduše potřebují zadat vstupní výzvu obsahující příkaz anglického textu a model vygeneruje dokončování textu.

Tady je příklad jednoduché výzvy a dokončení:

Výzva: """ count to 5 in a for loop """

Dokončení: for i in range(1, 6): print(i)

Tokény

Textové tokeny

Azure OpenAI zpracovává text tím, že ho rozdělí na tokeny. Tokeny mohou být slova nebo jen bloky znaků. Například slovo "hamburger" se rozdělí na tokeny "ham", "bur" a "ger", zatímco krátké a běžné slovo jako "hrušeň" je jediný token. Mnoho tokenů začíná prázdnými znaky, například "hello" a "bye".

Celkový počet tokenů zpracovaných v daném požadavku závisí na délce vstupních, výstupních a požadovaných parametrů. Množství zpracovávaných tokenů ovlivní také latenci a propustnost odpovědí pro modely.

Vstupní tokeny obrázku

Možnosti zpracování obrázků v Azure OpenAI s modely GPT-4o, GPT-4o-mini a GPT-4 Turbo s vision používají tokenizaci obrázků k určení celkového počtu tokenů spotřebovaných vstupy obrázků. Počet spotřebovaných tokenů se vypočítá na základě dvou hlavních faktorů: úrovně podrobností obrázku (nízké nebo vysoké) a rozměrů obrázku. Tady je způsob výpočtu nákladů na tokeny:

Režim nízkého rozlišení
- Nízké podrobnosti umožňují rozhraní API vracet rychlejší odpovědi pro scénáře, které nevyžadují analýzu vysokého rozlišení obrázků. Tokeny spotřebované pro obrázky s nízkými podrobnostmi jsou:
  - GPT-4o a GPT-4 Turbo s obrazem: Paušální sazba 85 tokenů na obrázek bez ohledu na velikost.
  - GPT-4o mini: Plochá rychlost 2833 tokenů na obrázek bez ohledu na velikost.
- Příklad: 4096 x 8192 obrázek (nízký detail):: Náklady jsou pevné 85 tokenů s GPT-4o, protože je to obrázek s nízkými podrobnostmi a velikost nemá vliv na náklady v tomto režimu.
Režim vysokého rozlišení
- Podrobné informace umožňují rozhraní API analyzovat obrázky podrobněji. Tokeny obrázků se počítají na základě rozměrů obrázku. Výpočet zahrnuje následující kroky:
  1. Změna velikosti obrázku: Velikost obrázku se změní tak, aby se vešla do čtverce 2048 × 2048 pixelů. Pokud je nejkratší strana větší než 768 pixelů, obrázek se dále změní tak, aby nejkratší strana byla dlouhá 768 pixelů. Poměr stran se zachová během změny velikosti.
  2. Výpočet dlaždic: Po změně velikosti se obrázek rozdělí na dlaždice o velikosti 512 x 512 pixelů. Všechny částečné dlaždice se zaokrouhlují nahoru na celou dlaždici. Počet dlaždic určuje celkové náklady na tokeny.
  3. Výpočet tokenu:
    - GPT-4o a GPT-4 Turbo s obrazem: Každý 512 x 512 pixelů dlaždice stojí 170 tokenů. K celkovému součtu se přidá dalších 85 základních tokenů .
    - GPT-4o mini: Každá dlaždice 512 x 512 pixelů stojí 5667 tokenů. K celkovému součtu se přidá dalších 2833 základních tokenů .
- Příklad: 2048 x 4096 obrázek (high detail):
  1. Obrázek je zpočátku změněn na 1024 x 2048 pixelů tak, aby se vešl do čtverce 2048 x 2048 pixelů.
  2. Obrázek je dále změněn na 768 × 1536 pixelů, aby se zajistilo, že nejkratší strana je maximálně 768 pixelů dlouhá.
  3. Obrázek je rozdělený na 2 x 3 dlaždice, každá z dlaždic měří 512 x 512 pixelů.
  4. Konečný výpočet:
    - U GPT-4o a GPT-4 Turbo s vision jsou celkové náklady na tokeny 6 dlaždic x 170 tokenů na dlaždici + 85 základních tokenů = 1105 tokenů.
    - V případě GPT-4o mini jsou celkové náklady na tokeny 6 dlaždic × 5667 tokenů na dlaždici + 2833 základních tokenů = 36835 tokenů.

Tokeny generování obrázků

GPT-image-1 generuje image tím, že nejprve vytvoří specializované tokeny image. Latence i případné náklady jsou úměrné počtu tokenů potřebných k vykreslení obrázku. Počet vygenerovaných tokenů závisí na rozměrech a kvalitě image:

Kvalita	Čtverec (1024×1024)	Portrét (1024×1536)	krajina (1536×1024)
Nízké	272 tokenů	408 tokenů	400 tokenů
Středně	1056 tokenů	1584 tokenů	1568 tokenů
Vysoko	4160 tokenů	6240 tokenů	6208 tokenů

Prostředky

Azure OpenAI je nová nabídka produktů v Azure. S Azure OpenAI můžete začít stejným způsobem jako s jakýmkoli jiným produktem Azure, ve kterém ve svém předplatném Azure vytvoříte prostředek nebo instanci služby. O návrhu správy prostředků Azure si můžete přečíst další informace.

Nasazení

Jakmile vytvoříte prostředek Azure OpenAI, musíte model nasadit, abyste mohli začít volat rozhraní API a generovat text. Tuto akci je možné provést pomocí rozhraní API pro nasazení. Tato rozhraní API umožňují určit model, který chcete použít.

Inženýrství podnětů

Modely GPT-3, GPT-3.5 a GPT-4 z OpenAI jsou založené na příkazovém řádku. S modely založenými na dotazech uživatel komunikuje zadáním textového dotazu, na který model reaguje doplněním textu. Toto doplnění je pokračováním textu zadaného modelem.

I když jsou tyto modely výkonné, jejich chování je také citlivé na výzvu. Díky tomu je příprava výzvy důležitou dovedností k vývoji.

Konstrukce pokynů může být obtížná. V praxi výzva slouží ke konfiguraci vah modelu tak, aby splnila požadovaný úkol, ale je to spíše umění než věda, často vyžaduje zkušenosti a intuici k sestavení úspěšné výzvy.

Modely

Služba poskytuje uživatelům přístup k několika různým modelům. Každý model poskytuje jinou funkci a cenový bod.

Modely generování obrázků (některé ve verzi Preview; viz modely) generují a upravují obrázky z textových výzev, které uživatel poskytuje.

Zvukové modely rozhraní API lze použít k přepisu a překladu řeči na text. Modely převodu textu na řeč, které jsou aktuálně ve verzi náhledu, lze použít k syntetizaci textu na řeč.

Další informace o jednotlivých modelech najdete na stránce konceptů modelů.

Další kroky

Zjistěte více o základních modelech, které pohánějí Azure OpenAI.