Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
AI je technologie, pomocí které počítače napodobují inteligentní lidské chování. Počítače můžou používat AI k provedení následujících úloh:
- Analyzujte data a vytvářejte obrázky a videa.
- Analýza a syntetizace řeči
- Slovně interagujte přirozenými způsoby.
- Vytvořte předpovědi a vygenerujte nová data.
AI můžete začlenit do aplikací, abyste mohli provádět funkce nebo rozhodovat, že tradiční logika nebo zpracování nedokáže efektivně zvládnout. Jako architekt, který navrhuje řešení, potřebujete se seznámit s prostředím umělé inteligence a strojového učení a s tím, jak můžete integrovat řešení Azure do návrhu úloh.
Začínáme
Azure Architecture Center poskytuje ukázkové architektury, příručky k architektuře, směrné plány architektury a nápady, které můžete použít ve vašem scénáři. Úlohy, které používají komponenty AI a strojového učení, by měly postupovat podle pokynů k úlohám Azure Well-Architected Framework AI . Tyto pokyny zahrnují principy a průvodce návrhem, které ovlivňují úlohy umělé inteligence a strojového učení napříč pěti pilíři architektury. Implementujte tato doporučení ve scénářích a obsahu v Centru architektury Azure.
Koncepty umělé inteligence
Koncepty umělé inteligence zahrnují širokou škálu technologií a metodologií, které počítače používají k plnění úkolů, které obvykle vyžadují lidskou inteligenci. Následující části obsahují přehled klíčových konceptů umělé inteligence.
Algoritmy
algoritmy nebo algoritmy strojového učení jsou části kódu, které pomáhají lidem zkoumat, analyzovat a hledat význam v komplexních datových sadách. Každý algoritmus je konečná sada jednoznačných podrobných instrukcí, podle nichž může počítač dosáhnout konkrétního cíle. Cílem modelu strojového učení je vytvořit nebo zjistit vzory, které mohou lidé použít k vytváření předpovědí nebo kategorizaci informací. Algoritmus může popsat, jak zkontrolovat, jestli je zvíře kočkou, psem, rybou, ptákem nebo ještěrkou. Složitější algoritmus může popsat, jak identifikovat napsaný nebo mluvený jazyk, analyzovat jeho slova, přeložit je do jiného jazyka a pak zkontrolovat přesnost překladu.
Vyberte si rodinu algoritmů, která nejlépe vyhovuje vašemu úkolu. Vyhodnoťte různé algoritmy v rámci rodiny, abyste našli vhodné řešení pro vaši úlohu. Další informace najdete v tématu Algoritmy strojového učení.
Strojové učení
Strojové učení je technika umělé inteligence, která používá algoritmy k vytváření prediktivních modelů. Tyto algoritmy analyzují datová pole a učí se ze vzorů v datech za účelem generování modelů. Modely pak můžou provádět informované předpovědi nebo rozhodnutí na základě nových dat.
Prediktivní modely se ověřují proti známým datům, měří se metrikami výkonu pro konkrétní obchodní scénáře a pak se podle potřeby upraví. Tento proces učení a ověřování se nazývá trénování. Díky pravidelnému přetrénování se modely strojového učení v průběhu času vylepšují.
Při návrhu úloh můžete použít strojové učení, pokud váš scénář obsahuje předchozí pozorování, která můžete spolehlivě použít k předpovídání budoucích situací. Tyto pozorování mohou být univerzální pravdy, jako je počítačové zpracování obrazu, které detekuje jednu formu zvířete z jiného. Nebo toto pozorování může být specifické pro vaši situaci, například počítačové vidění, které detekuje potenciální chybu montáže na vašich montážních linkách na základě dat o minulých záručních reklamací.
Další informace najdete v tématu Přehled strojového učení.
Hluboké učení
hluboké učení je typ strojového učení, který se může učit prostřednictvím vlastního zpracování dat. Podobně jako strojové učení používá algoritmy k analýze dat. Analyzuje ale data pomocí umělých neurálních sítí, které mají mnoho vstupů, výstupů a vrstev zpracování. Každá vrstva může zpracovávat data jiným způsobem. Výstupem jedné vrstvy se stane vstup pro další. Hluboké učení tento proces používá k vytváření složitějších modelů než tradiční strojové učení.
Hluboké učení vyžaduje velké investice pro generování vysoce přizpůsobených nebo průzkumných modelů. Než do úlohy přidáte hloubkové učení, můžete zvážit další řešení v tomto článku.
Další informace najdete v tématu Přehled hlubokého učení.
Generativní AI
Generování modelů umělé inteligence trénuje modely pro generování původního obsahu na základě mnoha forem obsahu, včetně přirozeného jazyka, počítačového zpracování obrazu, zvuku nebo vstupu obrázku. Pomocí generující umělé inteligence můžete popsat požadovaný výstup v každodenním jazyce a model může reagovat vytvořením vhodného textu, obrázku a kódu. Mezi příklady generativních aplikací AI patří Microsoft 365 Copilot a Microsoft Foundry.
Copilot je primárně uživatelské rozhraní, které pomáhá psát kód, dokumenty a další textový obsah. Je založená na oblíbených modelech od OpenAI a Anthropic a je integrovaná do široké škály aplikací a uživatelských prostředí Microsoftu.
Foundry je vývojová platforma jako služba (PaaS), která poskytuje přístup k hostování agentů a katalogu jazykových modelů, včetně následujících možností:
- GPT-5.2 (OpenAI)
- Claude (Anthropic)
- Phi (Microsoft)
- Grok (xAI)
Tyto modely můžete přizpůsobit následujícím konkrétním úlohám:
- Generování obsahu
- Shrnutí obsahu
- Porozumění obrazům
- Sémantické vyhledávání
- Překlad z přirozeného jazyka do kódu
- Generování videa
- Převod řeči na řeč
Jazykové modely
Jazykové modely jsou podmnožinou generující umělé inteligence, která se zaměřuje na úlohy zpracování přirozeného jazyka, jako je generování textu a analýza mínění. Tyto modely představují přirozený jazyk na základě pravděpodobnosti slov nebo sekvencí slov, ke kterým dochází v daném kontextu.
Konvenční jazykové modely se používají v nastaveních pod dohledem pro výzkumné účely. Tyto modely se trénují na dobře označených textových datových sadách pro konkrétní úkoly. Předem natrénované jazykové modely poskytují snadný způsob, jak začít používat AI. V posledních letech se častěji používají. Tyto modely se trénují na rozsáhlých kolekcích textu z internetu prostřednictvím neurálních sítí hlubokého učení. Můžete je vyladit u menších datových sad pro konkrétní úkoly.
Počet parametrů nebo váhy určují velikost jazykového modelu. Parametry ovlivňují, jak model zpracovává vstupní data a generuje výstup. Během trénování model upraví váhy, aby minimalizoval rozdíl mezi jeho predikcemi a skutečnými daty. Tímto procesem se model učí parametry. Čím více parametrů model má, tím složitější a výraznější je. Je ale také výpočetně nákladnější pro trénování a používání.
Malé jazykové modely mají obvykle méně než 10 miliard parametrů a velké jazykové modely mají více než 10 miliard parametrů. Řada modelů Microsoft Phi-4 například obsahuje následující verze:
- Phi-4-Mini, který má 3,8 miliardy parametrů
- Phi-4-Multimodal-instruct, který má 5,6 miliardy parametrů
- Phi-4 (základní model), který má 14 miliard parametrů
Další informace najdete v katalogu jazykových modelů.
Kopiloti
Dostupnost jazykových modelů vedla k novým způsobům interakce s aplikacemi a systémy pomocí digitálních copilotů a připojených agentů specifických pro doménu. Copilots jsou generující asistenti umělé inteligence, kteří se integrují do aplikací, často jako chatovací rozhraní. Poskytují kontextovou podporu pro běžné úlohy v těchto aplikacích.
Microsoft 365 Copilot se integruje s širokou škálou aplikací a uživatelských prostředí Microsoftu. Je založená na otevřené architektuře, ve které můžou vývojáři, kteří nejsou microsoftem, vytvářet vlastní moduly plug-in, aby rozšířili nebo přizpůsobili uživatelské prostředí pomocí Copilotu. Vývojáři partneři mohou také vytvářet vlastní kopiloty pomocí stejné otevřené architektury.
Další informace najdete v následujících zdrojích informací:
- Přijetí, rozšíření a vytváření prostředí Copilota v rámci platformy Microsoft Cloud
- Přehled aplikace Microsoft Copilot Studio
- Přehled Foundry
Generování s rozšířením o vyhledávání
Generování s podporou načítání (RAG) je architektonický vzor, který rozšiřuje možnosti jazykového modelu, jako je ChatGPT, který je trénován pouze na veřejných datech. Tento model můžete použít k přidání systému načítání, který poskytuje relevantní podkladová data v kontextu s požadavkem uživatele. Systém načítání informací poskytuje kontrolu nad uzemněním dat, která jazykový model používá při formulaci odpovědi. Architektura RAG pomáhá vymezit obor generující AI na obsah, který pochází z vektorizovaných dokumentů, obrázků a dalších formátů dat. RAG se neomezuje na úložiště vektorových vyhledávání. Můžete použít libovolnou technologii úložiště dat.
Další informace najdete v tématu Návrh a vývoj řešení RAG a Volba služby Azure pro vektorové vyhledávání. Znalostní báze Foundry IQ použijte pro zakotvení dat, která agenti Foundry potřebují jako kompletní řešení pro RAG.
Architektura založená na agentech
Agenti jsou více než jen kód, který volá jazykové modely, aby reagovali na výzvy uživatelů. Můžou samostatně provádět úkoly, rozhodovat se a pracovat s jinými systémy. Agenty můžete navrhnout tak, aby zpracovávali konkrétní úlohy nebo fungovali ve složitých prostředích, což je vhodné pro mnoho aplikací. Architektura s více agenty umožňuje rozdělit složité problémy na specializované agenty, které koordinuje vytvoření řešení.
Nástroje, jako jsou pracovní postupy Microsoft Agent Framework a Foundry , vám můžou pomoct vytvářet architektury založené na agentech.
Informace o tom, jak koordinovat více agentů ve složitých scénářích AI, najdete v tématu Vzory orchestrace agentů AI.
Slévárenské nástroje
Díky nástrojům Foundry mohou vývojáři a organizace používat předem připravená, přizpůsobitelná rozhraní API a modely k vytváření inteligentních, tržně připravených a odpovědných aplikací. Případy použití zahrnují zpracování přirozeného jazyka pro konverzace, vyhledávání, monitorování, překlad, řeč, vizi a rozhodování.
Další informace najdete v následujících zdrojích informací:
- Vyberte technologii Foundry Tools
- Přehled nástrojů Foundry
- Volba technologie zpracování přirozeného jazyka v Azure
Jazykové modely AI
Jazykové modely, jako jsou modely OpenAI GPT, jsou výkonné nástroje, které můžou generovat přirozený jazyk napříč různými doménami a úlohami. Pokud chcete zvolit model, zvažte faktory, jako je ochrana osobních údajů, etické použití, přesnost a předsudky.
Otevřené modely Phi jsou malé, méně náročné na výpočetní výkon pro generování řešení umělé inteligence. Malý jazykový model může být efektivnější, interpretovatelný a vysvětlitelný než velký jazykový model.
Při návrhu úlohy můžete jazykové modely používat jako hostované řešení za měřeným rozhraním API. U mnoha malých jazykových modelů můžete hostovat jazykové modely v procesu nebo alespoň na stejném výpočetním prostředí jako příjemce. Při používání jazykových modelů ve vašem řešení zvažte výběr jazykového modelu a jeho dostupných možností hostování, abyste zajistili optimalizované řešení pro váš případ použití.
Vývojové platformy a nástroje umělé inteligence
Následující vývojové platformy a nástroje umělé inteligence vám můžou pomoct sestavovat, nasazovat a spravovat modely strojového učení a AI.
Azure Machine Learning
Azure Machine Learning je služba strojového učení, kterou můžete použít k vytváření a nasazování modelů. Machine Learning poskytuje webová rozhraní a sady SDK, abyste mohli trénovat a nasazovat modely a kanály strojového učení ve velkém měřítku. Tyto funkce můžete používat s opensourcovými architekturami Pythonu, jako jsou PyTorch, TensorFlow a scikit-learn.
Další informace najdete v následujících zdrojích informací:
- Porovnání produktů a technologií strojového učení Microsoftu
- dokumentace k strojovému učení
- Co je Machine Learning?
Referenční architektury AI a strojového učení pro Azure
Základní referenční architektura chatu Foundry v přistávací zóně Azure
Referenční architektura chatu Baseline Foundry popisuje, jak vytvořit komplexní architekturu chatu pomocí modelů OpenAI GPT v Foundry. Zahrnuje uzemnění prostřednictvím podnikových zdrojů dat za účelem obohacení odpovědí o kontextové informace.
Automatizované strojové učení
Automatizované strojové učení (AutoML) je proces automatizace časově náročných iterativních úloh vývoje modelů strojového učení. Datoví vědci, analytici a vývojáři můžou pomocí AutoML vytvářet modely strojového učení, které mají vysokou škálovatelnost, efektivitu a produktivitu při zachování kvality modelu.
Další informace najdete v následujících zdrojích informací:
- Co je AutoML?
- Trénování klasifikačního modelu pomocí AutoML v nástroji Machine Learning Studio
- Nastavení experimentů AutoML v Pythonu
- Instalace a nastavení rozhraní příkazového řádku
MLflow
Pracovní prostory Machine Learning jsou kompatibilní s MLflow, což znamená, že pracovní prostor Machine Learning můžete použít stejným způsobem jako server MLflow. Tato kompatibilita poskytuje následující výhody:
- Machine Learning nehostuje instance serveru MLflow, ale může přímo používat rozhraní API MLflow.
- Pracovní prostor Machine Learning můžete použít jako sledovací server pro jakýkoli kód MLflow bez ohledu na to, jestli běží ve službě Machine Learning. Musíte nastavit MLflow tak, aby ukazovalo na pracovní prostor, kde má probíhat sledování.
- Můžete spouštět rutiny trénování, které používají MLflow ve službě Machine Learning, aniž byste museli provádět změny.
Další informace naleznete v tématu MLflow a Machine Learning a MLflow.
Nástroje pro generování umělé inteligence
Foundry poskytuje platformu, která vám pomůže s experimentem, vývojem a nasazováním aplikací a rozhraní API pro generování AI zodpovědně. Na portálu Foundry najdete nástroje Foundry , základní modely, dětské hřiště a prostředky, které vám pomůžou vyladit, vyhodnotit a nasadit modely AI a agenty AI.
Foundry Agent Service hostuje agenty, které definujete. Tito agenti se připojují k základnímu modelu v katalogu modelů AI a případně také k vašim vlastním úložištím znalostí nebo rozhraním API. Tyto agenty můžete definovat deklarativním způsobem nebo Foundry mohou kontejnerizovat a hostovat je.
Copilot Studio rozšiřuje Copilot v Microsoftu 365. Pomocí Copilot Studio můžete vytvářet vlastní kopiloty pro interní a externí scénáře. Plátno pro tvorbu použijte k navrhování, testování a publikování copilotů. Můžete snadno vytvářet konverzace s generativní umělou inteligencí, poskytovat větší kontrolu nad odpověďmi pro stávající kopiloty a zvýšit produktivitu pomocí automatizovaných pracovních postupů.
Datové platformy pro AI
Následující platformy poskytují řešení pro přenos, zpracování, ingesci dat, transformaci, analytiku v reálném čase a vytváření sestav.
Microsoft Fabric
Microsoft Fabric je komplexní analytická a datová platforma pro podniky, které vyžadují jednotné řešení. Pracovní týmy mohou používat data v rámci systému Fabric. Platforma se zabývá přesunem, zpracováním, příjmem dat, transformací, směrováním událostí v reálném čase a vytvářením sestav. Poskytuje sadu služeb, včetně Fabric Datoví technici, Fabric Data Factory, Fabric Data Science, Fabric Real-Time Intelligence, Fabric Data Warehouse a Fabric Databases.
Síťová architektura integruje samostatné komponenty do soudržné vrstvy. Místo toho, abyste se spoléhali na různé databáze nebo datové sklady, můžete centralizovat úložiště dat pomocí OneLake. Funkce AI jsou vložené do Fabricu, což eliminuje potřebu ruční integrace.
Další informace najdete v následujících zdrojích informací:
- Co je Fabric?
- Studijní program : Začínáme s Fabric
- Nástroje Foundry v Fabric
- Použijte Azure OpenAI ve Fabric s rozhraním REST API
- Použití technologie Fabric pro generativní AI: Průvodce vytvářením a zlepšováním systémů RAG
- Vytváření vlastních AI aplikací pomocí Fabric: implementace RAG pro vylepšené jazykové modely
Kopiloti v síti Fabric
Pomocí Copilot a dalších funkcí generativní umělé inteligence můžete transformovat a analyzovat data, generovat přehledy a vytvářet vizualizace a sestavy v Fabric a Power BI. Můžete vytvořit vlastního copilot nebo zvolit jeden z následujících již připravených copilotů:
- Copilot ve Fabricu
- Kopilot pro datovou vědu a datové inženýrství
- Copilot pro Data Factory
- Copilot pro datový sklad
- Copilot pro Power BI
- Copilot pro inteligenci v reálném čase
Datový agent ve Fabricu
Datový agent ve Fabric je funkce, kterou můžete použít k vytváření vlastních konverzačních systémů Q&A pomocí generativní umělé inteligence. Datový agent Fabric usnadňuje používání přehledů dat a usnadňuje práci pro všechny uživatele ve vaší organizaci.
Další informace najdete v následujících zdrojích informací:
- Přehled datového agenta Fabric
- Vytvoření datového agenta
- Příklad datového agenta
- Rozdíl mezi datovým agentem Fabric a copilotem
Datové platformy založené na Apache Sparku pro AI
Apache Spark je architektura pro paralelní zpracování, která podporuje zpracování v paměti pro zvýšení výkonu aplikací pro analýzu velkých objemů dat. Spark poskytuje základní stavební bloky pro výpočetní prostředí clusteru v paměti. Úloha Sparku může načítat a ukládat data do paměti a dotazovat se na ni opakovaně, což je rychlejší než aplikace založené na disku, jako je Hadoop.
Spark ve Fabricu
Fabric Runtime je platforma integrovaná v Azure založená na Sparku, kterou můžete použít k implementaci a správě prostředí přípravy dat a datových věd. Modul fabric Runtime kombinuje klíčové komponenty z interních a opensourcových zdrojů, které poskytují komplexní řešení.
Runtime Fabric má následující klíčové komponenty:
Spark je opensourcová distribuovaná výpočetní knihovna, kterou můžete použít pro rozsáhlé úlohy zpracování a analýzy dat. Spark poskytuje univerzální platformu pro přípravu dat a prostředí pro datové vědy.
Delta Lake je opensourcová vrstva úložiště, která integruje transakce atomicity, konzistence, izolace a odolnosti (ACID) a další funkce spolehlivosti dat se Sparkem. Delta Lake je integrovaná v prostředí Fabric Runtime, vylepšuje možnosti zpracování dat a pomáhá zajistit konzistenci dat napříč několika souběžnými úlohami.
balíčky výchozí úrovně pro Javu, Scalu, Python a R jsou balíčky, které podporují různé programovací jazyky a prostředí. Tyto balíčky se instalují a konfigurují automaticky, takže vývojáři můžou pro úlohy zpracování dat použít upřednostňované programovací jazyky.
Runtime Fabric je postaven na open-source operačním systému, který poskytuje kompatibilitu s různými hardwarovými konfiguracemi a systémovými požadavky.
Další informace najdete v tématu Moduly runtime Sparku ve Fabric.
Azure Databricks Runtime pro strojové učení
Azure Databricks je analytická platforma založená na Sparku, která zahrnuje pracovní postupy a interaktivní pracovní prostor pro spolupráci mezi datovými vědci, inženýry a obchodními analytiky.
Databricks Runtime pro Machine Learning můžete použít ke spuštění clusteru Databricks, který má všechny knihovny potřebné pro distribuované trénování. Tato funkce poskytuje prostředí pro strojové učení a datové vědy. Má několik oblíbených knihoven, včetně TensorFlow, PyTorch, Keras a XGBoost. Podporuje také distribuované trénování prostřednictvím Horovodu.
Další informace najdete v následujících zdrojích informací:
- Dokumentace ke službě Azure Databricks
- Možnosti strojového učení v Azure Databricks
- Přehled hlubokého učení pro Azure Databricks
Spark ve službě Azure HDInsight
Spark v Azure HDInsight je implementace Sparku v cloudu od Microsoftu. Clustery Spark v HDInsight jsou kompatibilní se službou Azure Storage a Azure Data Lake Storage, takže ke zpracování dat uložených v Azure můžete použít clustery HDInsight Spark.
SynapseML je knihovna strojového učení Microsoftu pro Spark. Tato opensourcová knihovna přidává do ekosystému Spark mnoho nástrojů hlubokého učení a datových věd, síťových funkcí a výkonu na produkční úrovni.
Další informace najdete v následujících zdrojích informací:
- funkce a možnosti SynapseML
- Přehled HDInsight
- Kurz: Vytvoření aplikace strojového učení Spark ve službě HDInsight
- Osvědčené postupy Sparku ve službě HDInsight
- Nastavení clusteru HDInsight Spark
- Vytvoření kanálu strojového učení Sparku ve službě HDInsight
Úložiště dat pro AI
Následující platformy můžete použít k efektivnímu ukládání, používání a analýze velkých objemů dat.
Fabric OneLake
OneLake in Fabric je jednotné a logické datové jezero, které můžete přizpůsobit celé organizaci. Je to centrální centrum pro všechna analytická data a je součástí každého tenanta Fabric. OneLake in Fabric je postaven na základu služby Data Lake Storage.
OneLake in Fabric nabízí následující výhody:
- Podporuje strukturované a nestrukturované typy souborů.
- Ukládá všechna tabulková data ve formátu Delta-Parquet.
- Poskytuje jedno datové jezero v rámci hranic jednoho tenantu, které je spravováno ve výchozím nastavení.
- Podporuje vytváření pracovních prostorů v rámci tenanta, aby vaše organizace mohly distribuovat vlastnictví a zásady přístupu.
- Podporuje vytváření různých datových položek, jako jsou jezera a sklady, kde můžete data používat.
Další informace najdete v tématu OneLake, OneDrive pro data.
Data Lake Storage
Data Lake Storage je jediné centralizované úložiště, do kterého můžete ukládat strukturovaná a nestrukturovaná data. Data Lake můžete použít k rychlému a snadnému ukládání, používání a analýze široké škály dat na jednom místě. Nemusíte upravovat svá data, aby zapadla do existující struktury. Místo toho můžete data ukládat v nezpracovaných nebo nativních formátech, obvykle jako soubory nebo jako binární velké objekty nebo objekty blob.
Data Lake Storage poskytuje sémantiku systému souborů, zabezpečení na úrovni souborů a škálování. Vzhledem k tomu, že tyto funkce jsou založené na službě Azure Blob Storage, získáte také nízkonákladové vrstvené úložiště s vysokou dostupností a možnostmi zotavení po havárii.
Data Lake Storage využívá infrastrukturu služby Storage k vytvoření základu pro vytváření podnikových datových jezer v Azure. Data Lake Storage může obsluhovat několik petabajtů informací a současně udržovat stovky gigabitů propustnosti, abyste mohli spravovat obrovské objemy dat.
Další informace najdete v následujících zdrojích informací:
Zpracování dat pro AI
Pomocí následujících nástrojů můžete připravit data pro aplikace strojového učení a AI. Ujistěte se, že jsou vaše data čistá a strukturovaná, abyste je mohli použít pro pokročilou analýzu.
Továrna pro zpracování dat Fabric
Pomocí služby Fabric Data Factory můžete ingestovat, připravovat a transformovat data z více zdrojů dat, jako jsou databáze, datové sklady, jezera a datové proudy v reálném čase. Tato funkce vám může pomoct splnit požadavky na operace s daty při návrhu úloh.
Data Factory podporuje řešení kódu a řešení bez kódu nebo řešení s nízkými kódy:
Pomocí datových kanálů můžete vytvářet funkce pracovních postupů v cloudovém měřítku. Pomocí rozhraní pro výběr a přesunutí můžete vytvářet pracovní postupy, které můžou aktualizovat tok dat, přesouvat data velikosti petabajtů a definovat kanály toku řízení.
Používejte toky dat jako nízkokódové rozhraní k ingestování dat ze stovek zdrojů dat a jejich transformaci pomocí více než 300 datových transformací.
Další informace najdete v tématu úplný scénář služby Data Factory: Úvod a architektura.
Azure Databricks
Pomocí platformy Databricks Data Intelligence Platform můžete napsat kód pro vytvoření pracovního postupu strojového učení pomocí přípravy funkcí. inženýring funkcí je proces transformace nezpracovaných dat na funkce, které můžete použít k trénování modelů strojového učení. Platforma Databricks Data Intelligence zahrnuje klíčové funkce, které podporují přípravu funkcí:
Datové kanály zpracovávají nezpracovaná data, vytvářejí tabulky prvků, trénují modely a provádějí dávkové odhady. Pokud používáte inženýrství funkcí v katalogu Unity k trénování a protokolování modelu, je model zabalen s metadaty funkcí. Když použijete model pro dávkové vyhodnocování nebo online odvozování, automaticky načte hodnoty funkcí. Volající nemusí vědět o hodnotách ani implementovat logiku, aby vyhledal nebo připojil vlastnosti pro dosažení skóre nových dat.
Koncové body obsluhy modelů a funkcí jsou okamžitě dostupné a poskytují latenci v milisekundách.
monitorování pomáhá zajistit výkon a přesnost dat a modelů.
K ukládání a načítání vloženin můžete také použít Mosaic AI vyhledávání vektorů. Vkládání je zásadní pro aplikace, které vyžadují vyhledávání podobnosti, jako je RAG, systémy doporučení a rozpoznávání obrázků.
Další informace najdete v tématu Obsluha dat pro strojové učení a AI.
Datové konektory pro AI
Potrubí Azure Data Factory a Azure Synapse Analytics podporují mnoho úložišť a formátů dat prostřednictvím aktivit jako kopírování, tok dat, vyhledávání, získávání metadat a odstranění. Informace o dostupných konektorech úložiště dat, podporovaných funkcích a jejich odpovídajících konfiguracích a obecných možnostech připojení k open database najdete v přehledu konektoru Azure Data Factory a Azure Synapse Analytics.
Vlastní AI
Vlastní řešení umělé inteligence pomáhají řešit konkrétní obchodní potřeby a výzvy. Následující části obsahují přehled různých nástrojů a služeb, které můžete použít k vytváření a správě vlastních modelů AI.
Azure Machine Learning
Azure Machine Learning je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení. Odborníci na strojové učení, datoví vědci a technici můžou tuto službu používat ve svých pracovních postupech k trénování a nasazování modelů a správě úloh strojového učení.
Machine Learning nabízí následující možnosti:
Výběr algoritmu: Některé algoritmy dělají konkrétní předpoklady o datové struktuře nebo požadovaných výsledcích. Zvolte algoritmus, který vyhovuje vašim potřebám, abyste mohli získat užitečnější výsledky, přesnější předpovědi a rychlejší trénování. Další informace naleznete v tématu Jak zvolit algoritmy pro Machine Learning.
ladění nebo optimalizace hyperparametrů: Tento ruční proces můžete použít k vyhledání konfigurací hyperparametrů, které vedou k nejlepšímu výkonu. Tato optimalizace způsobuje značné výpočetní náklady. Hyperparametry jsou určité nastavitelné parametry, které umožňují řízení v procesu učení modelu. Můžete například zvolit počet skrytých vrstev a počet uzlů v každé vrstvě neurálních sítí. Výkon modelu závisí silně na hyperparametrech.
Machine Learning můžete použít k automatizaci ladění hyperparametrů a spouštění experimentů paralelně za účelem efektivní optimalizace hyperparametrů.
Další informace najdete v následujících zdrojích informací:
Trénování modelů: K vytvoření nebo výuce modelů můžete použít algoritmus. Po vytrénování modelů je můžete použít k analýze dat a vytváření předpovědí.
Během trénovací fáze dojde k následujícím krokům:
Sada kvality známých dat je označená tak, aby jednotlivá pole byla identifikovatelná.
Algoritmus, který je nakonfigurovaný tak, aby udělal konkrétní předpověď, přijímá označená data.
Algoritmus vypíše model, který zachycuje vzory, které identifikoval v datech. Model používá sadu parametrů k reprezentaci těchto vzorů.
Během ověřování dochází k následujícím krokům:
Nová data jsou označená a slouží k otestování modelu.
Algoritmus se upraví podle potřeby a pravděpodobně provede další trénování.
Fáze testování používá data z reálného světa bez jakýchkoli značek nebo předem vybraných cílů. Pokud jsou výsledky modelu přesné, je připravené k použití a dá se nasadit.
Další informace najdete v následujících zdrojích informací:
AutoML: Tento proces automatizuje časově náročné iterativní úlohy vývoje modelů strojového učení. Může výrazně zkrátit dobu potřebnou k výrobě modelů strojového učení připravených pro produkční prostředí. AutoML může pomoct s výběrem modelu, laděním hyperparametrů, trénováním modelu a dalšími úlohami bez nutnosti rozsáhlého programování nebo znalosti domény.
AutoML můžete použít, když chcete, aby Machine Learning používala konkrétní cílovou metriku k trénování a ladění modelu. K nalezení problémů v kompletním kanálu strojového učení nepotřebujete odborné znalosti datových věd.
Odborníci na strojové učení a vývojáři v různých odvětvích můžou autoML použít k provedení následujících úloh:
- Implementujte řešení strojového učení bez rozsáhlého programování nebo znalostí strojového učení.
- Ušetřete čas a prostředky.
- Použijte osvědčené postupy pro datové vědy.
- Poskytovat agilní řešení problémů
Další informace najdete v tématu Přehled AutoML.
bodování: Tento proces, označovaný také jako predikce, používá naučený model strojového učení ke generování hodnot na základě nových vstupních dat. Hodnoty nebo skóre mohou představovat předpovědi budoucích hodnot, ale mohou také představovat pravděpodobnou kategorii nebo výsledek.
Další informace najdete v následujících zdrojích informací:
Příprava funkcí a jejich zpracování: Trénovací data se skládají z řádků a sloupců. Každý řádek je pozorování nebo záznam a sloupce každého řádku jsou funkcemi, které popisují jednotlivé záznamy. Obvykle zvolíte funkce, které nejlépe charakterizují vzory v datech a vytvářejí prediktivní modely.
I když k trénování modelu můžete použít mnoho nezpracovaných datových polí, možná budete muset vytvořit další vytvořené funkce, které poskytují informace pro snadnější rozlišení vzorů v datech. Tento proces se nazývá příprava funkcí, kde pomocí znalostí domény dat vytváříte funkce, které pomáhají algoritmům strojového učení se lépe učit.
Ve službě Machine Learning se používají techniky škálování a normalizace dat, které usnadňují přípravu funkcí. Souhrnně se těmto technikám a zpracování vlastností říká featurizace v experimentech AutoML. Další informace naleznete v tématu Featurizace dat v AutoML.
Microsoft Foundry
V Foundry můžete použít proces označovaný jako jemné ladění k přizpůsobení modelů vašim osobním datovým sadám. Tento krok přizpůsobení optimalizuje službu tím, že poskytuje následující výhody:
- Výsledky vyšší kvality ve srovnání s pouze prompt engineering
- Schopnost trénovat na více příkladech, než obvykle dovoluje maximální limit kontextu požadavků modelu
- Úspory tokenů z důvodu kratších výzev
- Požadavky s nižší latencí, zejména pokud používáte menší modely
Další informace najdete v následujících zdrojích informací:
- Přizpůsobení modelu pomocí jemného ladění
- Kurz podrobného ladění Azure OpenAI GPT-4o-mini
- Referenční architektura chatu Baseline Foundry
Nástroje Foundry pro vlastní AI
Foundry Tools poskytuje funkce pro vytváření vlastních modelů a aplikací AI. Následující části obsahují přehled těchto klíčových funkcí.
Vlastní řeč
Vlastní řeč je funkce Služby Azure Speech. Pomocí vlastní řeči můžete vyhodnotit a zlepšit přesnost rozpoznávání řeči pro vaše aplikace a produkty. Pro převod řeči na text v reálném čase, překlad řeči a dávkový přepis můžete použít vlastní model řeči.
Rozpoznávání řeči ve výchozím nastavení používá jako základní model univerzální jazykový model. Tento model se trénuje s daty vlastněnými Microsoftem a odráží běžně používaný mluvený jazyk. Základní model je předem natrénovaný pomocí dialektů a fonetik, které představují běžné domény. Když provedete žádost o rozpoznávání řeči, použije se ve výchozím nastavení nejnovější základní model pro váš podporovaný jazyk. Základní model funguje dobře ve většině scénářů rozpoznávání řeči.
K rozšíření základního modelu můžete použít vlastní model. Můžete například zlepšit rozpoznávání slovníku specifického pro doménu, který je specifický pro aplikaci, poskytnutím textových dat pro trénování modelu. Rozpoznávání konkrétních zvukových podmínek aplikace můžete také vylepšit tím, že poskytnete zvuková data, včetně přepisů odkazů.
Pokud se data řídí vzorem, můžete k trénování modelu použít strukturovaný text. Můžete zadat vlastní výslovnost a přizpůsobit formátování zobrazovaného textu pomocí vlastní inverzní normalizace textu, vlastního přepisu a vlastního filtrování vulgárních výrazů.
Vlastní překladač
Custom Translator je funkce Azure Translatoru. Podniky, vývojáři aplikací a poskytovatelé jazykových služeb můžou pomocí vlastního překladače vytvářet přizpůsobené systémy neurálního strojového překladu (NMT). Přizpůsobené systémy překladu se integrují do stávajících aplikací, pracovních postupů a webů.
Tuto funkci můžete použít k vytváření a publikování vlastních systémů překladu do a z angličtiny. Custom Translator podporuje více než tři desítky jazyků, které se mapují přímo na jazyky pro NMT. Úplný seznam jazyků najdete v tématu Podpora jazyka Translator.
Custom Translator poskytuje následující funkce.
| Funkce | Popis |
|---|---|
| použít technologii NMT | Použijte NMT z vlastního překladatele ke zlepšení vašeho překladu. |
| Sestavte systémy, které využívají vaši obchodní terminologii | Přizpůsobte a sestavte systémy překladu pomocí paralelních dokumentů, které používají terminologii ve vaší firmě a oboru. |
| Vytvoření modelů pomocí slovníku | Pokud nemáte trénovací datovou sadu, natrénujte model pouze pomocí dat slovníku. |
| Spolupráce s ostatními | Spolupracujte s týmem sdílením práce s různými lidmi. |
| Použití vlastního modelu překladu | Vlastní model překladu můžete kdykoli použít pomocí stávajících aplikací nebo programů prostřednictvím rozhraní Microsoft Translator Text API V3. |
Vlastní modely
Azure Document Intelligence používá pokročilou technologii strojového učení k identifikaci dokumentů, detekci a extrahování informací z formulářů a dokumentů a vrácení extrahovaných dat ve strukturovaném výstupu JSON. Využijte funkci Document Intelligence k využití předem připravených nebo předem natrénovaných modelů analýzy dokumentů nebo trénovaných samostatných vlastních modelů.
vlastní modely Document Intelligence zahrnují vlastní klasifikační modely pro scénáře, ve kterých je před vyvoláním modelu extrakce nutná identifikace typu dokumentu. Klasifikační model můžete spárovat s vlastním modelem extrakce a analyzovat a extrahovat pole z formulářů a dokumentů, které jsou specifické pro vaši firmu. Zkombinujte samostatné vlastní modely extrakce a vytvořte složené modely.
Vlastní analyzátor
Azure Content Understanding používá generování umělé inteligence ke zpracování nebo ingestování mnoha typů obsahu, včetně dokumentů, obrázků, videí a zvuku, do uživatelsky definovaného výstupního formátu. Funkce Content Understanding obsahuje předem připravené analyzátory pro běžné typy obsahu a scénáře.
Vlastní analyzátor je funkce Content Understanding, která vytváří vlastní analyzátory přizpůsobené vašim konkrétním potřebám zpracování obsahu. Můžete definovat vlastní pravidla extrakce a vzory rozpoznávání entit tak, aby splňovaly vaše obchodní požadavky.
Vlastní nástroje AI
Předem připravené modely AI jsou užitečné a stále flexibilnější, ale nejlepším způsobem optimalizace AI je přizpůsobit model vašim konkrétním potřebám. Dva primární nástroje pro vytváření vlastních modelů AI jsou generující AI a tradiční strojové učení.
studio Azure Machine Learning
Azure Machine Learning Studio je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení. Odborníci na strojové učení, datoví vědci a technici ho můžou použít ve svých pracovních postupech k trénování a nasazování modelů a správě úloh strojového učení.
Vytvářejte a trénujte modely Machine Learning pomocí libovolného typu výpočetních prostředků, včetně Sparku a GPU pro rozsáhlé úlohy umělé inteligence v cloudovém měřítku.
Spusťte AutoML a použijte uživatelské rozhraní select-and-move pro strojové učení s nízkým kódem.
Implementujte úlohy strojového učení od začátku do konce a opakovatelné datové linky.
Pro detekci předsudků a analýzu chyb použijte příslušný řídicí panel AI.
Orchestrace a správa toků příkazového inženýrství a jazykového modelu
Nasaďte modely prostřednictvím koncových bodů rozhraní REST API, odvozování v reálném čase a dávkového odvozování.
Pomocí pracovních prostorů centra můžete sdílet výpočetní prostředky, kvótu, zabezpečení a připojení k podnikovým prostředkům a současně centralizovat zásady správného řízení pro IT. Nastavte centrum jednou a pak vytvořte zabezpečené pracovní prostory přímo ze studia pro každý projekt. Pomocí center můžete řídit práci vašeho týmu ve Studiu a na portálu Foundry.
Slévárna
Foundry pomáhá efektivně sestavovat a nasazovat vlastní aplikace generující AI pomocí funkcí Azure AI.
Pracujeme společně jako jeden tým. Váš účet Foundry poskytuje zabezpečení na podnikové úrovni a prostředí pro spolupráci, které zahrnuje sdílené prostředky a připojení k předem natrénovaným modelům, datům a výpočetním prostředkům.
Uspořádejte svou práci. Projekt Foundry vám pomůže uložit stav, abyste mohli iterovat od prvního nápadu k prvnímu prototypu a prvnímu produkčnímu nasazení. Snadno pozvěte ostatní, aby s vámi spolupracovali.
Použijte upřednostňovanou vývojovou platformu a architektury, včetně GitHubu, editoru Visual Studio Code, architektury agentů, sémantického jádra a autogenu.
Objevte a provádějte benchmarky modelů z širokého katalogu.
Nastavte modely jako službu (MaaS) prostřednictvím bezserverových rozhraní API a hostovaného jemného ladění.
Začlenit více modelů, datových zdrojů a modalit.
Vytvářejte RAG pomocí chráněných podnikových dat, aniž byste museli jemně doladit.
Orchestrace a správa toků příkazového inženýrství a velkých jazykových modelů
Návrh a ochrana aplikací a rozhraní API prostřednictvím konfigurovatelných filtrů a ovládacích prvků
Vyhodnoťte odpovědi modelu pomocí předdefinovaných a vlastních toků hodnocení.
Nasaďte inovace AI do infrastruktury spravované v Azure, abyste zajistili průběžné monitorování a zásady správného řízení napříč prostředími.
Nepřetržitě monitorujte nasazené aplikace pro zajištění bezpečnosti, kvality a spotřeby tokenů v produkčním prostředí.
Služba agenta Foundry na portálu Foundry
Foundry Agent Service je nástroj, který můžete použít k vytvoření agentů AI pomocí bez kódu a nedeterministického přístupu. Agenti jsou vystaveni jako mikroslužby v účtu Foundry.
Každý agent se připojí k základnímu modelu z katalogu Foundry Models. Agenti se můžou volitelně připojit k vlastním privátním úložištům znalostí nebo veřejným datům. Agenti můžou také vyvolat nástroje pro volání vlastního kódu a provádět úkoly.
Vlastní jazyky kódu AI
Základním konceptem umělé inteligence je využití algoritmů k analýze dat a tvorbě modelů, které data popisují nebo hodnotí užitečnými způsoby. Vývojáři a datoví vědci a někdy i jiné algoritmy používají programovací kód k psaní algoritmů. Mezi nejoblíbenější programovací jazyky pro vývoj umělé inteligence patří Python a R.
Python je univerzální programovací jazyk vysoké úrovně. Má jednoduchou syntaxi, která zvýrazňuje čitelnost. Nemusíte spouštět krok kompilace. Python má velkou standardní knihovnu a podporuje možnost přidávat moduly a balíčky. Tato funkce podporuje modularitu a umožňuje v případě potřeby rozšířit možnosti. Pro Python existuje rozsáhlý a rostoucí ekosystém knihoven AI a strojového učení, včetně mnoha v Azure.
Další informace najdete v následujících zdrojích informací:
- Python v Azure
- Azure pro vývojáře v Pythonu
- Machine Learning SDK pro Python
- Úvod do strojového učení pomocí Pythonu a poznámkových bloků
- Opensourcová knihovna strojového učení Scikit-learn pro Python
- Knihovna open-source Pythonu PyTorch
- Knihovna TensorFlow pro symbolické matematické výpočty s otevřeným zdrojovým kódem
- Kurz: Použití modelů strojového učení ve službě Azure Functions pomocí Pythonu a TensorFlow
R je jazyk a prostředí pro statistické výpočty a grafiku. Můžete ho použít pro všechno, od mapování rozsáhlých sociálních a marketingových trendů online až po vývoj finančních a klimatických modelů.
Microsoft podporuje programovací jazyk R a poskytuje vývojářům jazyka R několik možností spouštění kódu v Azure.
Další informace najdete v tématu Interaktivní použití jazyka R ve službě Machine Learning.
Obecné informace o vlastní umělé inteligenci v Azure najdete v následujících zdrojích informací:
- Microsoft AI na GitHubu: Ukázky, referenční architektury a osvědčené postupy
- Machine Learning SDK pro Python
- úložiště příkladů Machine Learning
- Trénování R modelů pomocí příkazového řádku pro strojové učení v2
Příběhy zákazníků
Mnoho odvětví používá AI inovativními a inspirujícími způsoby. Zvažte následující případové studie zákazníků a scénáře úspěchu:
- NSF umožňuje, aby se život zachraňující léčby dostaly k pacientům rychleji s pomocí Azure AI.
- PIMCO zvyšuje klientskou službu s využitím vyhledávací platformy založené na umělé inteligenci založené na Azure AI.
- Legrand a Azure OpenAI: Poháníme chytřejší řešení s nástroji poháněnými umělou inteligencí
- C.H. Robinson překonává desetileté překážky v automatizaci logistického průmyslu pomocí Azure AI
Procházet další příběhy zákazníků AI
Obecné informace o microsoft AI
Přečtěte si další informace o umělé inteligenci Microsoftu a mějte přehled o souvisejících novinkách:
- Microsoft AI
- AI výukové centrum
- Azure AI
- Novinky o Microsoft AI
- Microsoft AI na GitHubu: Ukázky, referenční architektury a osvědčené postupy