Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Microsoft Foundry Models je vaším komplexním cílem pro objevování, vyhodnocování a nasazování výkonných AI modelů—ať už vytváříte vlastní kopilota, agenta, vylepšujete stávající aplikaci nebo prozkoumáváte nové schopnosti AI.
S modelem Foundry můžete:
- Prozkoumejte bohatý katalog špičkových modelů od Microsoftu, OpenAI, DeepSeek, Hugging Face, Meta a další.
- Porovnejte a vyhodnoťte modely vedle sebe pomocí úloh z reálného světa a vlastních dat.
- Nasazení s jistotou díky integrovaným nástrojům pro vyladění, pozorovatelnost a zodpovědnou AI
- Zvolte si cestu – přineste si vlastní model, použijte hostovaný model nebo bezproblémovou integraci s Azure službami.
Ať už jste vývojář, data scientist nebo podnikový architekt, nabízí Foundry Models flexibilitu a kontrolu nad vytvářením řešení AI, která se škálují – bezpečně, zodpovědně a rychle.
Foundry nabízí komplexní katalog modelů AI. Existuje více než 1 900 modelů, které se liší od základních modelů, zdůvodnění modelů, malých jazykových modelů, multimodálních modelů, modelů specifických pro doménu a oborových modelů.
Katalog modelů je uspořádaný do dvou hlavních kategorií:
Pochopení rozdílu mezi těmito kategoriemi vám pomůže vybrat si správné modely pro vaše konkrétní požadavky a strategické cíle.
Poznámka:
U všech modelů zůstávají zákazníci zodpovědní za:
- Dodržování právních předpisů při jejich používání libovolného modelu nebo systému
- Kontrola popisů modelů v katalogu modelů, karet modelu zpřístupněných poskytovatelem modelu a další relevantní dokumentace
- Výběr vhodného modelu pro případ použití
- Implementace vhodných opatření (včetně použití Azure AI Content Safety) k zajištění toho, aby používání nástrojů Foundry pro zákazníky odpovídalo zásadám přijatelného použití v podmínkách produktů společnosti Microsoft a pravidla chování služeb Microsoft Enterprise AI.
Modely prodané přímo Azure
Tyto modely se také označují jako Azure modely Direct nebo Direct z modelů Azure, jsou tyto modely hostované a prodávané společností Microsoft v rámci podmínek produktů společnosti Microsoft. Microsoft tyto modely vyhodnotil a jsou hluboce integrované do ekosystému AI Azure. Modely pocházejí z různých poskytovatelů a nabízejí vylepšenou integraci, optimalizovaný výkon a přímé Microsoft support, včetně smluv o úrovni služeb na podnikové úrovni (SLA).
Charakteristiky modelů prodaných přímo Azure:
- Podpora dostupná od Microsoftu.
- Vysoká úroveň integrace se službami a infrastrukturou Azure.
- Podléhá interní kontrole podle standardů Zodpovědného AI od Microsoftu.
- Sestavy dokumentace k modelům a sestavy transparentnosti poskytují zákazníkům viditelnost modelových rizik, jejich zmírnění a omezení.
- Škálovatelnost, spolehlivost a zabezpečení na podnikové úrovni
Některé z těchto modelů nabízejí také vyměnitelnou zřízenou propustnost, což znamená, že můžete flexibilně využívat kvótu a rezervace v jakémkoli z těchto modelů. Informace o tom, jak Foundry zpracovává data, která poskytujete modelům Foundry prodaných přímo Azure, najdete v tématu Data, ochrana osobních údajů a zabezpečení pro Azure přímé modely v Microsoft Foundry.
Modely od partnerů a komunity
Tyto modely tvoří velkou většinu modelů Foundry a jsou poskytovány důvěryhodnými organizacemi třetích stran, partnery, výzkumnými laboratořemi a přispěvateli komunity. Tyto modely nabízejí specializované a různorodé funkce umělé inteligence, které pokrývají širokou škálu scénářů, odvětví a inovací. Příklady modelů od partnerů a komunity jsou rodina velkých jazykových modelů vyvinutých anthropicem a otevřenými modely z centra Hugging Face.
Anthropic zahrnuje claudovou rodinu nejmodernějších velkých jazykových modelů, které podporují zadávání textu a obrázků, textový výstup, vícejazyčné funkce a vizi. Pro pomoc s Anthropicovými modely použijte Microsoft Support. Další informace o ochraně osobních údajů najdete v průvodci Daty, ochranou osobních údajů a zabezpečením pro modely Claude v Microsoft Foundry (preview) a v Zásadách ochrany osobních údajů Anthropic. Podmínky služby najdete v tématu Komerční podmínky služby. Informace o tom, jak pracovat s modely Anthropic, najdete v tématu Nasazení a použití modelů Claude v Microsoft Foundry.
Hugging Face Hub zahrnuje stovky modelů pro odvozování ve spravovaném výpočetním prostředí v reálném čase. Hugging Face vytváří a udržuje modely uvedené v této kolekci. Pokud potřebujete pomoc s modely Hugging Face, použijte fórum Hugging Face nebo podporu Hugging Face. Zjistěte, jak nasadit modely Hugging Face v tématu Nasazení a odvození pomocí spravovaného výpočetního nasazení (Classic).
Důležité
Pokud chcete pracovat s modely, které se dají nasadit na spravované výpočetní prostředky, jako jsou modely Hugging Face, použijte v portálu Foundry (Classic) projekt založený na hubu. Další informace o dostupných portálech Foundry najdete v tématu Co je Microsoft Foundry?.
Charakteristiky modelů od partnerů a komunity:
- Vyvinutá a podporovaná externími partnery a přispěvateli komunity
- Široká škála specializovaných modelů zaměřených na specifické nebo široké případy použití
- Obvykle si poskytovatelé sami ověřují platnost, přičemž pokyny pro integraci poskytuje Azure.
- Inovace řízené komunitou a rychlá dostupnost špičkových modelů
- Standardní integrace Azure AI s podporou a údržbou spravovanou příslušnými poskytovateli
Modely od partnerů a komunity se dají nasadit pomocí spravovaných výpočetních nebo bezserverových možností nasazení . Poskytovatel modelu vybere způsob nasazení modelů. Další informace o typech nasazení dostupných v možnosti bezserverového nasazení najdete v tématu Typy nasazení pro modely Microsoft Foundry.
Žádost o zahrnutí modelu do katalogu modelů
Požádejte o přidání modelu do katalogu modelů přímo ze stránky katalogu modelů na portálu Foundry.
- Přejděte na stránku katalogu modelů.
- Na panelu hledání vyhledejte model, který v katalogu neexistuje, například mymodel.
- Výběrem možnosti Vyžádat si model můžete vyplnit podrobnosti o modelu, který chcete vyžádat.
Volba mezi modely prodanými přímo Azure a modely od partnerů a komunity
Při výběru modelů Foundry, které se mají použít, zvažte následující:
- Použití případu a požadavků: Modely prodané přímo Azure jsou ideální pro scénáře vyžadující hlubokou integraci Azure, garantovanou podporu a smlouvy SLA pro podniky. Modely od partnerů a komunity excelují ve specializovaných případech použití a scénářích zaměřených na inovace.
- Podporovaná očekávání: Modely prodané přímo Azure mají robustní podporu a údržbu od Microsoftu. Modely partnerů a komunit jsou podporovány jejich poskytovateli s různými úrovněmi smluv SLA a podpůrných struktur.
- Innovace a specializace: Modely od partnerů a komunity nabízejí rychlý přístup k specializovaným inovacím a specifickým schopnostem, které často vyvíjejí přední výzkumné laboratoře a nově vznikající poskytovatelé AI.
Přehled možností katalogu modelů
Katalog modelů na portálu Foundry je centrem pro zjišťování a používání široké škály modelů k vytváření generování aplikací AI. Katalog modelů nabízí stovky modelů napříč poskytovateli modelů, jako jsou Azure OpenAI, Mistral, Meta, Cohere, NVIDIA a Hugging Face, včetně modelů, které Microsoft natrénoval. Modely od jiných poskytovatelů než Microsoft jsou produkty jiné společnosti než Microsoft definované v podmínkách produktů společnosti Microsoft a podléhají podmínkám poskytovaným s modely.
Vyhledávání a zjišťování modelů, které vyhovují vašim potřebám, prostřednictvím vyhledávání klíčových slov a filtrů Katalog modelů také nabízí tabulku výsledků výkonu modelu a metriky srovnávacích testů pro vybrané modely. Přistupte k nim výběrem možnosti Zobrazit žebříček a Porovnat modely. Data srovnávacích testů jsou k dispozici také na kartě Srovnávací testy modelové karty.
Mezi filtry dostupné v katalogu modelů patří:
- Kolekce: Filtrujte modely založené na kolekci zprostředkovatele modelu.
- Odvětví: Filtrujte modely, které jsou natrénované na datové sadě specifické pro konkrétní odvětví.
- Možnosti: Filtrování jedinečných funkcí modelu, jako jsou důvodování a volání nástrojů
- Úkoly odvozování: Filtrujte modely na základě typu odvozování úkolu.
Mezi podrobnosti, které jsou k dispozici na kartě modelu , patří:
- Rychlá fakta: Klíčové informace o modelu v rychlém přehledu
- Karta Podrobnosti : Podrobné informace o modelu, například popis, informace o verzi a podporovaný datový typ
- Karta Srovnávací testy: Metriky srovnávacích testů výkonu pro vybrané modely
- Karta Nasazení : Seznam existujících nasazení pro model
- Karta Licence : Právní informace související s licencováním modelu
Možnosti nasazení modelu: spravovaná výpočetní a bezserverová nasazení
Katalog modelů nabízí dvě různé možnosti nasazení modelů pro vaše použití: spravovaná výpočetní a bezserverová nasazení. Další informace o zpracování dat pomocí možností nasazení najdete v tématu Data, ochrana osobních údajů a zabezpečení pro použití modelů prostřednictvím katalogu modelů na portálu Microsoft Foundry (classic). Informace o tom, jak Foundry zpracovává data, která poskytujete modelům Foundry prodaných přímo Azure, najdete v tématu Data, ochrana osobních údajů a zabezpečení pro Azure přímé modely v Microsoft Foundry.
Možnosti nasazení modelu
Možnosti nasazení a funkce dostupné pro jednotlivé modely se liší, jak je popsáno v následující tabulce:
| Features | Spravovaný výpočetní výkon | Bezserverové nasazení |
|---|---|---|
| Zkušenosti s nasazením a fakturace | Váhy modelu jsou nasazovány na vyhrazené virtuální stroje se spravovanými výpočetními prostředky. Spravovaný výpočetní objekt, který může mít jedno nebo více nasazení, zpřístupňuje rozhraní REST API pro odvozování. Účtují se vám hodiny jádra virtuálního počítače, které používají nasazení. | Přistupujte k modelům prostřednictvím nasazení, které vytvoří rozhraní API. Rozhraní API poskytuje přístup k modelu, který Microsoft hostuje a spravuje pro inferenci. Fakturujete za vstupy a výstupy rozhraní API, obvykle v tokenech. Informace o cenách jsou k dispozici před nasazením. |
| Ověřování API | Klíče a ověřování Microsoft Entra | Klíče a ověřování Microsoft Entra |
| Bezpečnost obsahu | Použijte rozhraní API služby Azure AI Content Safety. | Azure AI Content Safety filtry jsou k dispozici integrované s rozhraními API pro odvození. Azure AI Content Safety filtry se účtují samostatně. |
| Izolace sítě | Nakonfigurujte spravovanou síť pro centra Microsoft Foundry (classic). | Spravované sítě se řídí nastavením příznaku PNA (přístup k veřejné síti) pro váš zdroj Foundry. Další informace najdete v části Izolace sítě pro modely nasazené prostřednictvím bezserverových nasazení dále v tomto článku. |
Spravovaný výpočetní výkon
Možnost nasazení modelů jako spravovaných výpočetních prostředků vychází z možností platformy Azure Machine Learning umožňující bezproblémovou integraci široké kolekce modelů v katalogu modelů v celém životním cyklu velkých operací jazykového modelu (LLM).
Důležité
Pokud chcete pracovat s modely, které se dají nasadit na spravované výpočetní prostředky, použijte project založené na centru na portálu Foundry (Classic). Další informace o dostupných portálech Foundry najdete v tématu Co je Microsoft Foundry?.
Dostupnost modelů pro nasazení jako spravované výpočetní prostředky
Modely jsou dostupné prostřednictvím registrů Azure Machine Learning. Tyto registry umožňují přístup založený na strojovém učení na hostování a distribuci prostředků Azure Machine Learning. Mezi tyto prostředky patří váhy modelů, kontejnery runtime pro spouštění modelů, procesy pro hodnocení a optimalizaci modelů a datové sady pro benchmarky a ukázky.
Registry vycházejí z vysoce škálovatelné a podnikové infrastruktury, která:
Poskytuje přístup s nízkou latencí k artefaktům modelů ve všech oblastech Azure s integrovanou geografickou replikací.
Podporuje podnikové požadavky na zabezpečení, jako je omezení access na modely pomocí Azure Policy a zabezpečeného nasazení pomocí spravovaných virtuálních sítí.
Nasazení modelů pro odvozování se spravovanými výpočetními prostředky
Modely dostupné pro nasazení do spravovaného výpočetního prostředí je možné nasadit do Azure Machine Learning spravovaných výpočetních prostředků pro odvozování v reálném čase. Pokud chcete nasadit na spravované výpočetní kapacity, potřebujete kvótu virtuálních počítačů ve svém předplatném Azure pro konkrétní produkty, aby model běžel optimálně. Některé modely vám umožňují nasadit dočasně sdílenou kvótu pro testování modelu.
Další informace o nasazování modelů:
- Pokud chcete nasadit otevřené modely do spravovaného výpočetního prostředí, podívejte se, jak nasadit a provádět inferenci pomocí spravovaného nasazení výpočetního prostředí (classic).
- Pokud chcete nasadit chráněné modely Foundry do spravovaného výpočetního prostředí s průběžnými platbami, přečtěte si téma Nasazení modelů Microsoft Foundry do spravovaného výpočetního prostředí s průběžnými platbami (classic).
Vytváření aplikací generující AI se spravovanými výpočetními prostředky
Funkce toku prompt v Azure Machine Learning nabízí skvělé prostředí pro vytváření prototypů. Použijte modely nasazené s řízenými výpočetními prostředky v toku výzev pomocí nástroje Open Model LLM. Rozhraní REST API vystavené spravovanými výpočetními prostředky můžete použít také v oblíbených nástrojích LLM, jako je LangChain, s rozšířením Azure Machine Learning.
Zabezpečení obsahu pro modely nasazené jako spravované výpočetní prostředky
Služba Azure AI Content Safety je k dispozici s využitím spravovaných výpočetních prostředků pro monitorování různých kategorií škodlivého obsahu, jako je sexuální obsah, násilí, nenávist a sebepoškozování. Službu můžete použít také k zobrazení pokročilých hrozeb, jako je detekce rizik jailbreaku a detekce chráněného textu materiálu.
Referenční integraci s Azure AI Content Safety pro Llama 2 najdete v poznámkovém bloku. Nebo použijte nástroj Content Safety (Text) v prostředí toku výzvy k předání odpovědí z modelu do Azure AI Content Safety pro screening. Za použití se vám účtuje samostatně, jak je popsáno v cenách Azure AI Content Safety.
Bezserverová nasazení
Bezserverová nasazení poskytují způsob, jak využívat modely Foundry jako rozhraní API bez jejich hostování ve vašem předplatném. Modely jsou hostovány v infrastruktuře spravované Microsoftem, která umožňuje přístup k modelu poskytovatele modelů prostřednictvím rozhraní API. Access založené na rozhraní API může výrazně snížit náklady na přístup k modelu a zjednodušit nastavení.
Modely, které jsou dostupné pro bezserverová nasazení, nabízí poskytovatel modelu, ale jsou hostované v infrastruktuře spravované microsoftem Azure a přístupné přes rozhraní API. Poskytovatelé modelů definují licenční podmínky a nastavují cenu pro použití svých modelů. Služba Azure Machine Learning:
- Spravuje infrastrukturu hostování.
- Zpřístupní rozhraní API pro odvození.
- Funguje jako zpracovatel dat pro zpracování odeslaných výzev a generování obsahu pro nasazení bez serverů.
Typy bezserverového nasazení
Možnost bezserverového nasazení pro Foundry Models nabízí dvě hlavní kategorie nasazení: standard (platba za token) a zřízená (rezervovaná kapacita). V rámci každé kategorie můžete na základě požadavků na dodržování předpisů zvolit globální, datovou zónu nebo regionální zpracování.
Mezi dostupné typy nasazení bez serveru patří: Global Standard, Global Provisioned, Global Batch, Data Zone Standard, Data Zone Provisioned, Data Zone Batch, Standard, Regional Provisioned a Developer. Další informace o těchto typech nasazení a o tom, jak vybrat ten správný pro vaše použití, naleznete v tématu Typy nasazení pro modely Microsoft Foundry.
Fakturace pro bezserverová nasazení
Prostředí pro zjišťování, předplatné a konzumaci modelů nasazených jako bezserverové nasazení najdete na portálu Foundry a ve studiu Azure Machine Learning. Uživatelé přijímají licenční podmínky pro použití modelů. Informace o cenách pro spotřebu jsou během nasazení k dispozici.
Modely Foundry od partnerů a komunity se účtují prostřednictvím Azure Marketplace v souladu s podmínkami použití Microsoft Commercial Marketplace.
Modely Foundry prodané přímo společností Azure jsou účtovány prostřednictvím měřičů Azure jako služby spotřeby první strany. Jak je popsáno v Product Terms, zakoupíte služby spotřeby první strany pomocí Azure měřičů, ale na tyto nákupy se nevztahují podmínky služeb Azure. Použití těchto modelů podléhá zadaným licenčním podmínkám.
Jemné ladění modelů
Některé modely také podporují jemné ladění. U těchto modelů můžete pomocí spravovaných výpočetních nebo bezserverových nasazení jemně doladit modely pomocí dat, která zadáte. Další informace najdete v tématu Doladění modelů pomocí Microsoft Foundry (classic).
RAG s modely nasazenými serverless způsobem
Na portálu Foundry použijte vektorové indexy a generování doplněné načítáním (RAG) s modely nasazenými prostřednictvím bezserverových nasazení k tvorbě vektorových reprezentací a inferenci na základě vlastních dat. Tyto vkládání a odvozování pak můžou generovat odpovědi specifické pro váš případ použití. Další informace najdete v tématu
Regionální dostupnost nabídek a modelů
Fakturace s platbami za token je dostupná jenom uživatelům, jejichž předplatné Azure patří k fakturačnímu účtu v zemi či oblasti, kde model poskytovatel učinil nabídku dostupnou. Pokud je nabídka dostupná v příslušné oblasti, musí mít uživatel projektový prostředek v oblasti Azure, kde je model k dispozici pro nasazení nebo doladění podle potřeby. Podrobné informace najdete v tématu Dostupnost oblastí pro modely v bezserverových nasazeních (Classic).
Zabezpečení obsahu pro modely nasazené prostřednictvím bezserverové architektury
U jazykových modelů nasazených prostřednictvím bezserverového rozhraní API Azure AI implementuje výchozí konfiguraci Azure AI Content Safety filtry moderování textu, které detekují škodlivý obsah, jako je nenávist, sebepoškozování, sexuální a násilné obsah. Další informace o filtrování obsahu viz Opatření a ovládací prvky pro modely prodávané přímo společností Azure.
Návod
Filtrování obsahu není k dispozici pro určité typy modelů nasazené prostřednictvím bezserverového rozhraní API. Mezi tyto typy modelů patří vkládání modelů a modelů časových řad.
Filtrování obsahu probíhá synchronně, když služba zpracovává zadání k vygenerování obsahu. Může vám být účtováno samostatně podle cen Azure AI Content Safety za takové použití. Filtrování obsahu pro jednotlivé koncové body bez serveru můžete zakázat:
- V době, kdy poprvé nasadíte jazykový model
- Později výběrem přepínače filtrování obsahu na stránce podrobností nasazení
Předpokládejme, že se rozhodnete použít jiné rozhraní API než Model Inference API pro práci s modelem nasazeným prostřednictvím bezserverového rozhraní API. V takové situaci není filtrování obsahu povolené, pokud ho neimplementujete samostatně pomocí Azure AI Content Safety.
Abyste mohli začít s Azure AI Content Safety, přečtěte si téma Quickstart: Analýza textového obsahu. Pokud při práci s modely nasazenými prostřednictvím bezserverového rozhraní API nepoužíváte filtrování obsahu, můžete uživatelům vystavit škodlivý obsah.
Izolace sítě pro modely nasazené prostřednictvím bezserverových nasazení
Koncové body pro modely nasazené jako serverless deployment se řídí nastavením příznaku přístupu k veřejné síti v centru Foundry, které obsahuje projekt, v němž nasazení existuje. Pokud chcete zajistit bezserverové nasazení, zakažte ve svém centru Foundry příznak veřejné sítě access. Můžete pomoct zabezpečit příchozí komunikaci z klienta do koncového bodu pomocí privátního koncového bodu pro centrum.
Nastavení příznaku přístupu k veřejné síti pro centrum Foundry:
- Přejděte na Azure portal.
- Vyhledejte skupinu prostředků, do které centrum patří, a vyberte centrum Foundry z prostředků uvedených pro tuto skupinu prostředků.
- Na stránce přehledu centra v levém podokně přejděte na Nastavení>sítě.
- Na kartě Veřejný přístup nakonfigurujte nastavení příznaku veřejného přístupu.
- Uložte provedené změny. Rozšíření změn může trvat až pět minut.
Omezení
Pokud máte centrum Foundry s privátním koncovým bodem vytvořeným před 11. červencem 2024, nasazení bez serveru přidaná do projektů v tomto centru nebudou dodržovat konfiguraci sítě centra. Místo toho vytvořte nový privátní koncový bod pro hub a nové bezserverové nasazení v projektu, aby nová nasazení mohla postupovat podle konfigurace sítě hubu.
Pokud máte centrum Foundry s bezserverovými nasazeními vytvořenými před 11. červencem 2024 a povolíte privátní koncový bod v tomto centru, stávající bezserverová nasazení nebudou dodržovat konfiguraci sítě centra. Aby bezserverová nasazení v centru postupovala podle konfigurace sítě centra, vytvořte nasazení znovu.
V současné době podpora služby Azure OpenAI on Your Data není dostupná pro bezserverová nasazení v privátních centrech, protože privátní centra mají zakázán přístup k veřejné síti.
Propagace jakékoli změny konfigurace sítě (například povolení nebo zakázání příznaku přístupu k veřejné síti) může trvat až pět minut.
Životní cyklus modelu: ukončení podpory a vyřazení
Modely AI se rychle vyvíjejí a jakmile budou k dispozici nové verze nebo nový model s aktualizovanými funkcemi ve stejné rodině modelů, můžou být starší modely vyřazeny z katalogu modelů Foundry. Pokud chcete umožnit hladký přechod na novější verzi modelu, některé modely umožňují uživatelům povolit automatické aktualizace. Další informace o životním cyklu modelů různých modelů, nadcházejících datech vyřazení modelu a navrhovaných náhradních modelech a verzích najdete tady:
- Odstranění a vyřazení modelů Azure OpenAI v rámci Microsoft Foundry
- Ukončení podpory a stažení modelů Microsoft Foundry