Přehled modelů Microsoft Foundry

Microsoft Foundry Models je vaším komplexním cílem pro objevování, vyhodnocování a nasazování výkonných AI modelů—ať už vytváříte vlastní kopilota, agenta, vylepšujete stávající aplikaci nebo prozkoumáváte nové schopnosti AI.

S modelem Foundry můžete:

Prozkoumejte bohatý katalog špičkových modelů od Microsoftu, OpenAI, DeepSeek, Hugging Face, Meta a další.
Porovnejte a vyhodnoťte modely vedle sebe pomocí úloh z reálného světa a vlastních dat.
Nasazení s jistotou díky integrovaným nástrojům pro vyladění, pozorovatelnost a zodpovědnou AI
Zvolte si cestu – přineste si vlastní model, použijte hostovaný model nebo bezproblémovou integraci s Azure službami.

Ať už jste vývojář, data scientist nebo podnikový architekt, nabízí Foundry Models flexibilitu a kontrolu nad vytvářením řešení AI, která se škálují – bezpečně, zodpovědně a rychle.

Foundry nabízí komplexní katalog modelů AI. Existuje více než 1 900 modelů, které se liší od základních modelů, zdůvodnění modelů, malých jazykových modelů, multimodálních modelů, modelů specifických pro doménu a oborových modelů.

Katalog modelů je uspořádaný do dvou hlavních kategorií:

Modely prodané přímo Azure
Modely od partnerů a komunity

Pochopení rozdílu mezi těmito kategoriemi vám pomůže vybrat si správné modely pro vaše konkrétní požadavky a strategické cíle.

Poznámka:

U všech modelů zůstávají zákazníci zodpovědní za:

Dodržování právních předpisů při jejich používání libovolného modelu nebo systému
Kontrola popisů modelů v katalogu modelů, karet modelu zpřístupněných poskytovatelem modelu a další relevantní dokumentace
Výběr vhodného modelu pro případ použití
Implementace vhodných opatření (včetně použití Azure AI Content Safety) k zajištění toho, aby používání nástrojů Foundry pro zákazníky odpovídalo zásadám přijatelného použití v podmínkách produktů společnosti Microsoft a pravidla chování služeb Microsoft Enterprise AI.

Modely prodané přímo Azure

Tyto modely se také označují jako Azure modely Direct nebo Direct z modelů Azure, jsou tyto modely hostované a prodávané společností Microsoft v rámci podmínek produktů společnosti Microsoft. Microsoft tyto modely vyhodnotil a jsou hluboce integrované do ekosystému AI Azure. Modely pocházejí z různých poskytovatelů a nabízejí vylepšenou integraci, optimalizovaný výkon a přímé Microsoft support, včetně smluv o úrovni služeb na podnikové úrovni (SLA).

Charakteristiky modelů prodaných přímo Azure:

Podpora dostupná od Microsoftu.
Vysoká úroveň integrace se službami a infrastrukturou Azure.
Podléhá interní kontrole podle standardů Zodpovědného AI od Microsoftu.
Sestavy dokumentace k modelům a sestavy transparentnosti poskytují zákazníkům viditelnost modelových rizik, jejich zmírnění a omezení.
Škálovatelnost, spolehlivost a zabezpečení na podnikové úrovni

Některé z těchto modelů nabízejí také vyměnitelnou zřízenou propustnost, což znamená, že můžete flexibilně využívat kvótu a rezervace v jakémkoli z těchto modelů. Informace o tom, jak Foundry zpracovává data, která poskytujete modelům Foundry prodaných přímo Azure, najdete v tématu Data, ochrana osobních údajů a zabezpečení pro Azure přímé modely v Microsoft Foundry.

Modely od partnerů a komunity

Tyto modely tvoří velkou většinu modelů Foundry a jsou poskytovány důvěryhodnými organizacemi třetích stran, partnery, výzkumnými laboratořemi a přispěvateli komunity. Tyto modely nabízejí specializované a různorodé funkce umělé inteligence, které pokrývají širokou škálu scénářů, odvětví a inovací. Příklady modelů od partnerů a komunity jsou rodina velkých jazykových modelů vyvinutých anthropicem a otevřenými modely z centra Hugging Face.

Anthropic zahrnuje claudovou rodinu nejmodernějších velkých jazykových modelů, které podporují zadávání textu a obrázků, textový výstup, vícejazyčné funkce a vizi. Pro pomoc s Anthropicovými modely použijte Microsoft Support. Další informace o ochraně osobních údajů najdete v průvodci Daty, ochranou osobních údajů a zabezpečením pro modely Claude v Microsoft Foundry (preview) a v Zásadách ochrany osobních údajů Anthropic. Podmínky služby najdete v tématu Komerční podmínky služby. Informace o tom, jak pracovat s modely Anthropic, najdete v tématu Nasazení a použití modelů Claude v Microsoft Foundry.

Hugging Face Hub zahrnuje stovky modelů pro odvozování ve spravovaném výpočetním prostředí v reálném čase. Hugging Face vytváří a udržuje modely uvedené v této kolekci. Pokud potřebujete pomoc s modely Hugging Face, použijte fórum Hugging Face nebo podporu Hugging Face. Zjistěte, jak nasadit modely Hugging Face v tématu Nasazení a odvození pomocí spravovaného výpočetního nasazení (Classic).

Důležité

Pokud chcete pracovat s modely, které se dají nasadit na spravované výpočetní prostředky, jako jsou modely Hugging Face, použijte v portálu Foundry (Classic) projekt založený na hubu. Další informace o dostupných portálech Foundry najdete v tématu Co je Microsoft Foundry?.

Charakteristiky modelů od partnerů a komunity:

Vyvinutá a podporovaná externími partnery a přispěvateli komunity
Široká škála specializovaných modelů zaměřených na specifické nebo široké případy použití
Obvykle si poskytovatelé sami ověřují platnost, přičemž pokyny pro integraci poskytuje Azure.
Inovace řízené komunitou a rychlá dostupnost špičkových modelů
Standardní integrace Azure AI s podporou a údržbou spravovanou příslušnými poskytovateli

Modely od partnerů a komunity se dají nasadit pomocí spravovaných výpočetních nebo bezserverových možností nasazení . Poskytovatel modelu vybere způsob nasazení modelů. Další informace o typech nasazení dostupných v možnosti bezserverového nasazení najdete v tématu Typy nasazení pro modely Microsoft Foundry.

Žádost o zahrnutí modelu do katalogu modelů

Požádejte o přidání modelu do katalogu modelů přímo ze stránky katalogu modelů na portálu Foundry.

Přejděte na stránku katalogu modelů.
Na panelu hledání vyhledejte model, který v katalogu neexistuje, například mymodel.
Výběrem možnosti Vyžádat si model můžete vyplnit podrobnosti o modelu, který chcete vyžádat.

Volba mezi modely prodanými přímo Azure a modely od partnerů a komunity

Při výběru modelů Foundry, které se mají použít, zvažte následující:

Použití případu a požadavků: Modely prodané přímo Azure jsou ideální pro scénáře vyžadující hlubokou integraci Azure, garantovanou podporu a smlouvy SLA pro podniky. Modely od partnerů a komunity excelují ve specializovaných případech použití a scénářích zaměřených na inovace.
Podporovaná očekávání: Modely prodané přímo Azure mají robustní podporu a údržbu od Microsoftu. Modely partnerů a komunit jsou podporovány jejich poskytovateli s různými úrovněmi smluv SLA a podpůrných struktur.
Innovace a specializace: Modely od partnerů a komunity nabízejí rychlý přístup k specializovaným inovacím a specifickým schopnostem, které často vyvíjejí přední výzkumné laboratoře a nově vznikající poskytovatelé AI.

Přehled možností katalogu modelů

Katalog modelů na portálu Foundry je centrem pro zjišťování a používání široké škály modelů k vytváření generování aplikací AI. Katalog modelů nabízí stovky modelů napříč poskytovateli modelů, jako jsou Azure OpenAI, Mistral, Meta, Cohere, NVIDIA a Hugging Face, včetně modelů, které Microsoft natrénoval. Modely od jiných poskytovatelů než Microsoft jsou produkty jiné společnosti než Microsoft definované v podmínkách produktů společnosti Microsoft a podléhají podmínkám poskytovaným s modely.

Vyhledávání a zjišťování modelů, které vyhovují vašim potřebám, prostřednictvím vyhledávání klíčových slov a filtrů Katalog modelů také nabízí tabulku výsledků výkonu modelu a metriky srovnávacích testů pro vybrané modely. Přistupte k nim výběrem možnosti Zobrazit žebříček a Porovnat modely. Data srovnávacích testů jsou k dispozici také na kartě Srovnávací testy modelové karty.

Mezi filtry dostupné v katalogu modelů patří:

Kolekce: Filtrujte modely založené na kolekci zprostředkovatele modelu.
Odvětví: Filtrujte modely, které jsou natrénované na datové sadě specifické pro konkrétní odvětví.
Možnosti: Filtrování jedinečných funkcí modelu, jako jsou důvodování a volání nástrojů
Úkoly odvozování: Filtrujte modely na základě typu odvozování úkolu.

Mezi podrobnosti, které jsou k dispozici na kartě modelu , patří:

Rychlá fakta: Klíčové informace o modelu v rychlém přehledu
Karta Podrobnosti : Podrobné informace o modelu, například popis, informace o verzi a podporovaný datový typ
Karta Srovnávací testy: Metriky srovnávacích testů výkonu pro vybrané modely
Karta Nasazení : Seznam existujících nasazení pro model
Karta Licence : Právní informace související s licencováním modelu

Možnosti nasazení modelu: spravovaná výpočetní a bezserverová nasazení

Katalog modelů nabízí dvě různé možnosti nasazení modelů pro vaše použití: spravovaná výpočetní a bezserverová nasazení. Další informace o zpracování dat pomocí možností nasazení najdete v tématu Data, ochrana osobních údajů a zabezpečení pro použití modelů prostřednictvím katalogu modelů na portálu Microsoft Foundry (classic). Informace o tom, jak Foundry zpracovává data, která poskytujete modelům Foundry prodaných přímo Azure, najdete v tématu Data, ochrana osobních údajů a zabezpečení pro Azure přímé modely v Microsoft Foundry.

Možnosti nasazení modelu

Možnosti nasazení a funkce dostupné pro jednotlivé modely se liší, jak je popsáno v následující tabulce:

Features	Spravovaný výpočetní výkon	Bezserverové nasazení
Zkušenosti s nasazením a fakturace	Váhy modelu jsou nasazovány na vyhrazené virtuální stroje se spravovanými výpočetními prostředky. Spravovaný výpočetní objekt, který může mít jedno nebo více nasazení, zpřístupňuje rozhraní REST API pro odvozování. Účtují se vám hodiny jádra virtuálního počítače, které používají nasazení.	Přistupujte k modelům prostřednictvím nasazení, které vytvoří rozhraní API. Rozhraní API poskytuje přístup k modelu, který Microsoft hostuje a spravuje pro inferenci. Fakturujete za vstupy a výstupy rozhraní API, obvykle v tokenech. Informace o cenách jsou k dispozici před nasazením.
Ověřování API	Klíče a ověřování Microsoft Entra	Klíče a ověřování Microsoft Entra
Bezpečnost obsahu	Použijte rozhraní API služby Azure AI Content Safety.	Azure AI Content Safety filtry jsou k dispozici integrované s rozhraními API pro odvození. Azure AI Content Safety filtry se účtují samostatně.
Izolace sítě	Nakonfigurujte spravovanou síť pro centra Microsoft Foundry (classic).	Spravované sítě se řídí nastavením příznaku PNA (přístup k veřejné síti) pro váš zdroj Foundry. Další informace najdete v části Izolace sítě pro modely nasazené prostřednictvím bezserverových nasazení dále v tomto článku.

Spravovaný výpočetní výkon

Možnost nasazení modelů jako spravovaných výpočetních prostředků vychází z možností platformy Azure Machine Learning umožňující bezproblémovou integraci široké kolekce modelů v katalogu modelů v celém životním cyklu velkých operací jazykového modelu (LLM).

Důležité

Pokud chcete pracovat s modely, které se dají nasadit na spravované výpočetní prostředky, použijte project založené na centru na portálu Foundry (Classic). Další informace o dostupných portálech Foundry najdete v tématu Co je Microsoft Foundry?.

Dostupnost modelů pro nasazení jako spravované výpočetní prostředky

Modely jsou dostupné prostřednictvím registrů Azure Machine Learning. Tyto registry umožňují přístup založený na strojovém učení na hostování a distribuci prostředků Azure Machine Learning. Mezi tyto prostředky patří váhy modelů, kontejnery runtime pro spouštění modelů, procesy pro hodnocení a optimalizaci modelů a datové sady pro benchmarky a ukázky.

Registry vycházejí z vysoce škálovatelné a podnikové infrastruktury, která:

Poskytuje přístup s nízkou latencí k artefaktům modelů ve všech oblastech Azure s integrovanou geografickou replikací.
Podporuje podnikové požadavky na zabezpečení, jako je omezení access na modely pomocí Azure Policy a zabezpečeného nasazení pomocí spravovaných virtuálních sítí.

Nasazení modelů pro odvozování se spravovanými výpočetními prostředky

Modely dostupné pro nasazení do spravovaného výpočetního prostředí je možné nasadit do Azure Machine Learning spravovaných výpočetních prostředků pro odvozování v reálném čase. Pokud chcete nasadit na spravované výpočetní kapacity, potřebujete kvótu virtuálních počítačů ve svém předplatném Azure pro konkrétní produkty, aby model běžel optimálně. Některé modely vám umožňují nasadit dočasně sdílenou kvótu pro testování modelu.

Další informace o nasazování modelů:

Pokud chcete nasadit otevřené modely do spravovaného výpočetního prostředí, podívejte se, jak nasadit a provádět inferenci pomocí spravovaného nasazení výpočetního prostředí (classic).
Pokud chcete nasadit chráněné modely Foundry do spravovaného výpočetního prostředí s průběžnými platbami, přečtěte si téma Nasazení modelů Microsoft Foundry do spravovaného výpočetního prostředí s průběžnými platbami (classic).

Vytváření aplikací generující AI se spravovanými výpočetními prostředky

Funkce toku prompt v Azure Machine Learning nabízí skvělé prostředí pro vytváření prototypů. Použijte modely nasazené s řízenými výpočetními prostředky v toku výzev pomocí nástroje Open Model LLM. Rozhraní REST API vystavené spravovanými výpočetními prostředky můžete použít také v oblíbených nástrojích LLM, jako je LangChain, s rozšířením Azure Machine Learning.

Zabezpečení obsahu pro modely nasazené jako spravované výpočetní prostředky

Služba Azure AI Content Safety je k dispozici s využitím spravovaných výpočetních prostředků pro monitorování různých kategorií škodlivého obsahu, jako je sexuální obsah, násilí, nenávist a sebepoškozování. Službu můžete použít také k zobrazení pokročilých hrozeb, jako je detekce rizik jailbreaku a detekce chráněného textu materiálu.

Referenční integraci s Azure AI Content Safety pro Llama 2 najdete v poznámkovém bloku. Nebo použijte nástroj Content Safety (Text) v prostředí toku výzvy k předání odpovědí z modelu do Azure AI Content Safety pro screening. Za použití se vám účtuje samostatně, jak je popsáno v cenách Azure AI Content Safety.

Bezserverová nasazení

Bezserverová nasazení poskytují způsob, jak využívat modely Foundry jako rozhraní API bez jejich hostování ve vašem předplatném. Modely jsou hostovány v infrastruktuře spravované Microsoftem, která umožňuje přístup k modelu poskytovatele modelů prostřednictvím rozhraní API. Access založené na rozhraní API může výrazně snížit náklady na přístup k modelu a zjednodušit nastavení.

Modely, které jsou dostupné pro bezserverová nasazení, nabízí poskytovatel modelu, ale jsou hostované v infrastruktuře spravované microsoftem Azure a přístupné přes rozhraní API. Poskytovatelé modelů definují licenční podmínky a nastavují cenu pro použití svých modelů. Služba Azure Machine Learning:

Spravuje infrastrukturu hostování.
Zpřístupní rozhraní API pro odvození.
Funguje jako zpracovatel dat pro zpracování odeslaných výzev a generování obsahu pro nasazení bez serverů.

Typy bezserverového nasazení

Možnost bezserverového nasazení pro Foundry Models nabízí dvě hlavní kategorie nasazení: standard (platba za token) a zřízená (rezervovaná kapacita). V rámci každé kategorie můžete na základě požadavků na dodržování předpisů zvolit globální, datovou zónu nebo regionální zpracování.

Mezi dostupné typy nasazení bez serveru patří: Global Standard, Global Provisioned, Global Batch, Data Zone Standard, Data Zone Provisioned, Data Zone Batch, Standard, Regional Provisioned a Developer. Další informace o těchto typech nasazení a o tom, jak vybrat ten správný pro vaše použití, naleznete v tématu Typy nasazení pro modely Microsoft Foundry.

Fakturace pro bezserverová nasazení

Prostředí pro zjišťování, předplatné a konzumaci modelů nasazených jako bezserverové nasazení najdete na portálu Foundry a ve studiu Azure Machine Learning. Uživatelé přijímají licenční podmínky pro použití modelů. Informace o cenách pro spotřebu jsou během nasazení k dispozici.

Modely Foundry od partnerů a komunity se účtují prostřednictvím Azure Marketplace v souladu s podmínkami použití Microsoft Commercial Marketplace.

Modely Foundry prodané přímo společností Azure jsou účtovány prostřednictvím měřičů Azure jako služby spotřeby první strany. Jak je popsáno v Product Terms, zakoupíte služby spotřeby první strany pomocí Azure měřičů, ale na tyto nákupy se nevztahují podmínky služeb Azure. Použití těchto modelů podléhá zadaným licenčním podmínkám.

Jemné ladění modelů

Některé modely také podporují jemné ladění. U těchto modelů můžete pomocí spravovaných výpočetních nebo bezserverových nasazení jemně doladit modely pomocí dat, která zadáte. Další informace najdete v tématu Doladění modelů pomocí Microsoft Foundry (classic).

RAG s modely nasazenými serverless způsobem

Na portálu Foundry použijte vektorové indexy a generování doplněné načítáním (RAG) s modely nasazenými prostřednictvím bezserverových nasazení k tvorbě vektorových reprezentací a inferenci na základě vlastních dat. Tyto vkládání a odvozování pak můžou generovat odpovědi specifické pro váš případ použití. Další informace najdete v tématu Vytváření a využívání vektorových indexů na portálu Microsoft Foundry (classic).>

Regionální dostupnost nabídek a modelů

Fakturace s platbami za token je dostupná jenom uživatelům, jejichž předplatné Azure patří k fakturačnímu účtu v zemi či oblasti, kde model poskytovatel učinil nabídku dostupnou. Pokud je nabídka dostupná v příslušné oblasti, musí mít uživatel projektový prostředek v oblasti Azure, kde je model k dispozici pro nasazení nebo doladění podle potřeby. Podrobné informace najdete v tématu Dostupnost oblastí pro modely v bezserverových nasazeních (Classic).

Zabezpečení obsahu pro modely nasazené prostřednictvím bezserverové architektury

U jazykových modelů nasazených prostřednictvím bezserverového rozhraní API Azure AI implementuje výchozí konfiguraci Azure AI Content Safety filtry moderování textu, které detekují škodlivý obsah, jako je nenávist, sebepoškozování, sexuální a násilné obsah. Další informace o filtrování obsahu viz Opatření a ovládací prvky pro modely prodávané přímo společností Azure.

Návod

Filtrování obsahu není k dispozici pro určité typy modelů nasazené prostřednictvím bezserverového rozhraní API. Mezi tyto typy modelů patří vkládání modelů a modelů časových řad.

Filtrování obsahu probíhá synchronně, když služba zpracovává zadání k vygenerování obsahu. Může vám být účtováno samostatně podle cen Azure AI Content Safety za takové použití. Filtrování obsahu pro jednotlivé koncové body bez serveru můžete zakázat:

V době, kdy poprvé nasadíte jazykový model
Později výběrem přepínače filtrování obsahu na stránce podrobností nasazení

Předpokládejme, že se rozhodnete použít jiné rozhraní API než Model Inference API pro práci s modelem nasazeným prostřednictvím bezserverového rozhraní API. V takové situaci není filtrování obsahu povolené, pokud ho neimplementujete samostatně pomocí Azure AI Content Safety.

Abyste mohli začít s Azure AI Content Safety, přečtěte si téma Quickstart: Analýza textového obsahu. Pokud při práci s modely nasazenými prostřednictvím bezserverového rozhraní API nepoužíváte filtrování obsahu, můžete uživatelům vystavit škodlivý obsah.

Izolace sítě pro modely nasazené prostřednictvím bezserverových nasazení

Koncové body pro modely nasazené jako serverless deployment se řídí nastavením příznaku přístupu k veřejné síti v centru Foundry, které obsahuje projekt, v němž nasazení existuje. Pokud chcete zajistit bezserverové nasazení, zakažte ve svém centru Foundry příznak veřejné sítě access. Můžete pomoct zabezpečit příchozí komunikaci z klienta do koncového bodu pomocí privátního koncového bodu pro centrum.

Nastavení příznaku přístupu k veřejné síti pro centrum Foundry:

Přejděte na Azure portal.
Vyhledejte skupinu prostředků, do které centrum patří, a vyberte centrum Foundry z prostředků uvedených pro tuto skupinu prostředků.
Na stránce přehledu centra v levém podokně přejděte na Nastavení>sítě.
Na kartě Veřejný přístup nakonfigurujte nastavení příznaku veřejného přístupu.
Uložte provedené změny. Rozšíření změn může trvat až pět minut.

Omezení

Pokud máte centrum Foundry s privátním koncovým bodem vytvořeným před 11. červencem 2024, nasazení bez serveru přidaná do projektů v tomto centru nebudou dodržovat konfiguraci sítě centra. Místo toho vytvořte nový privátní koncový bod pro hub a nové bezserverové nasazení v projektu, aby nová nasazení mohla postupovat podle konfigurace sítě hubu.
Pokud máte centrum Foundry s bezserverovými nasazeními vytvořenými před 11. červencem 2024 a povolíte privátní koncový bod v tomto centru, stávající bezserverová nasazení nebudou dodržovat konfiguraci sítě centra. Aby bezserverová nasazení v centru postupovala podle konfigurace sítě centra, vytvořte nasazení znovu.
V současné době podpora služby Azure OpenAI on Your Data není dostupná pro bezserverová nasazení v privátních centrech, protože privátní centra mají zakázán přístup k veřejné síti.
Propagace jakékoli změny konfigurace sítě (například povolení nebo zakázání příznaku přístupu k veřejné síti) může trvat až pět minut.

Životní cyklus modelu: ukončení podpory a vyřazení

Modely AI se rychle vyvíjejí a jakmile budou k dispozici nové verze nebo nový model s aktualizovanými funkcemi ve stejné rodině modelů, můžou být starší modely vyřazeny z katalogu modelů Foundry. Pokud chcete umožnit hladký přechod na novější verzi modelu, některé modely umožňují uživatelům povolit automatické aktualizace. Další informace o životním cyklu modelů různých modelů, nadcházejících datech vyřazení modelu a navrhovaných náhradních modelech a verzích najdete tady:

Váš názor

Byla tato stránka užitečná?

Last updated on 2026-03-10