Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek obsahuje pokyny ke správě úloh AI v průběhu jejich životního cyklu. Organizace dosahuje konzistentního výkonu umělé inteligence při vytváření strukturovaných provozních procesů, implementaci správného řízení nasazení a udržování komplexních monitorovacích postupů.
Správa operací AI
Provozní architektury poskytují strukturu pro správu složitých projektů AI. Tyto architektury zajišťují konzistenci napříč vývojovými týmy a snižují chyby, které pomalí cykly doručování. Abyste dosáhli spolehlivé správy úloh AI, musíte stanovit jasné provozní procesy. Postupujte následovně:
Založte centrum efektivity umělé inteligence pro strategické pokyny. AI center of excellence poskytuje strategické dohled a technické pokyny pro nasazení umělé inteligence v celé organizaci. Tato skupina zajišťuje, aby přístupy AI odpovídaly obchodním cílům a technickým požadavkům. Využijte špičkové centrum AI k vyhodnocení toho, který přístup správy vyhovuje potřebám vaší organizace, a vytvořte standardy nasazení, které podporují zásady správného řízení a inovace.
Vyberte správnou provozní architekturu pro váš typ úlohy. Různé úlohy umělé inteligence vyžadují různé provozní přístupy, které ovlivňují týmové procesy a rozhodování o nástrojích. Tato volba určuje metodologii vývoje a integraci technologického zásobníku. Pro tradiční pracovní postupy strojového učení a GenAIOps pro generování úloh umělé inteligence používejte architektury MLOps.
Standardizace vývojových nástrojů napříč všemi týmy. Konzistentní nástroje eliminují problémy s kompatibilitou mezi týmovými prostředími a snižují křivky učení pro vývojáře. Tento přístup brání problémům s integrací a urychluje vývojové cykly. Definujte a standardizujte použití sad SDK a rozhraní API pro konzistenci napříč vývojovými týmy. Další informace najdete v tématu Volba správné sady SDK pro podporu vašeho případu použití.
Vytvořte vyhrazená prostředí sandboxu pro experimentování. Sandboxová prostředí umožňují bezpečné testování bez ovlivnění produkčních systémů a poskytují týmům svobodu testovat nové přístupy. Tato prostředí brání experimentálnímu kódu v ovlivnění stabilních úloh. Použijte sandboxové prostředí, které se v životním cyklu vývoje AI liší od vývojových, testovacích a produkčních prostředí. Udržujte konzistenci napříč vývojovými, testovacími a produkčními prostředími, abyste zabránili zásadním změnám během propagace mezi prostředími.
Pokud je to možné, zjednodušte operace. Nové funkce usnadňují přizpůsobení a nasazení agentů a jemně vyladěných modelů bez specializovaných odborných znalostí. Tradiční vyladění vyžaduje odborníky na data, aby mohli spravovat datové sady a vytvářet kanály specifické pro úlohy, což vytváří provozní složitost. Pomocí Ladění Copilota (Preview) můžete v Microsoft 365 doladit modely pro interní úlohy bez nutnosti specializovaných odborných znalostí.
Správa nasazení AI
Správa nasazení AI definuje, kdo může nasazovat prostředky AI a řídit tyto koncové body. Strukturovaný přístup zajišťuje, aby organizace vyrovnaly rychlost vývoje s požadavky zásad správného řízení. Abyste dosáhli konzistentní správy prostředků AI, musíte vytvořit jasnou autoritu nasazení. Postupujte následovně:
Udělte týmům spravujícím pracovní zátěž právo nasazování v rámci definovaných rámců řízení. Týmy úloh urychlují vývoj, když řídí nasazení prostředků AI, aniž by čekaly na procesy centrálního schvalování. Tato autonomie snižuje kritické body a umožňuje rychlou reakci na obchodní požadavky při zachování organizačních standardů. Pomocí Azure Policy vynucujte zásady správného řízení konzistentně napříč prostředími úloh a vytvořte zásady AI, které řeší mezery v zásadách správného řízení. Pro Microsoft Foundry nasaďte instanci na organizační jednotku a pro každý případ použití použijte projekty Foundry místo vytvoření centralizovaného sdíleného prostředku napříč organizačními jednotkami.
Definujte jasné zásady nasazení AI pro oba přístupy správy. Zásady AI poskytují mantinely, které brání posunu konfigurace a mezerám v zabezpečení a zároveň zajišťují dodržování standardů organizace. Tyto zásady snižují riziko neoprávněného používání prostředků AI. Vytvořte zásady AI pro vynucení nastavení filtru obsahu a zabránění použití nepovolovaných modelů a pak tyto zásady jasně komunikujte se všemi týmy. Proveďte pravidelné audity, abyste zajistili dodržování předpisů.
Vytvořte kanály kontinuální integrace a doručování pro nasazení. Automatizované kanály snižují ruční chyby a zajišťují konzistentní nasazení napříč prostředími a zároveň poskytují opakovatelné procesy, které zachytí problémy včas. Tyto kanály udržují standardy kvality v průběhu vývoje. Vytvořte datové kanály, které pokrývají kontroly kvality kódu, testy jednotek a integrace a toky experimentování. Zahrňte kroky produkčního nasazení s procesy ručního schvalování pro propagaci verzí. Udržujte oddělení mezi modely a klientskými rozhraními, abyste zajistili nezávislé aktualizace komponent.
Správa modelů AI
Správa modelů AI zahrnuje struktury zásad správného řízení, průběžné monitorování a údržbu výkonu v průběhu času. Tento proces pomáhá organizacím sladit modely s etickými standardy, sledovat výkon modelu a zajistit, aby systémy AI zůstaly efektivní a sladěné s obchodními cíli. Abyste dosáhli spolehlivého výkonu AI, musíte vytvořit komplexní procesy správy modelů. Postupujte následovně:
Definujte směrný plán měření AI pro sledování výkonu. Směrné plány měření zajišťují, že modely AI odpovídají obchodním cílům a etickým standardům. Tyto směrné plány poskytují objektivní kritéria pro vyhodnocení výkonu modelu a zodpovědného dodržování předpisů umělé inteligence v celé organizaci. Vytvořte klíčové ukazatele výkonu související s zodpovědnými principy AI, jako jsou nestrannost, transparentnost a přesnost, a pak tyto klíčové ukazatele výkonu namapujte na konkrétní úlohy AI.
Rychle identifikujte původní příčiny problémů s výkonem. Přehled o jednotlivých fázích interakcí umělé inteligence pomáhá izolovat problémy a efektivně implementovat opravné akce, což brání kaskádovým selháním napříč systémy. Určete například, zda chyby chatbota pocházejí z vytváření promptů nebo z porozumění kontextu modelu. Pomocí integrovaných nástrojů, jako jsou Azure Monitor a Application Insights, můžete aktivně identifikovat kritické body výkonu a anomálie.
Přetrénování modelů AI na základě kritérií výkonu Modely se v průběhu času snižují kvůli změnám dat a vyžadují opětovné natrénování, aby zachovaly relevanci. Pravidelné přetrénování zajišťuje, aby systémy AI zůstaly aktuální s obchodními potřebami a vzory dat. Naplánujte přetrénování na základě metrik výkonu modelu nebo obchodních požadavků, aby byly systémy AI relevantní. Vyhodnocením počátečních nákladů na trénování vyhodnoťte optimální frekvenci přetrénování, protože opětovné trénování může být nákladné. Udržujte správu verzí pro modely a zajistěte mechanismy vrácení zpět pro méně výkonné verze.
Vytvořte procesy povýšení modelu s branami kvality. Brány pro zvýšení kvality zajišťují, že k produkčním prostředím přistupují jenom ověřené modely. Tyto procesy zabraňují, aby špatně fungující modely ovlivnily obchodní provoz, a zachovávají konzistentní standardy jakosti. Pomocí kritérií výkonu můžete zvýšit úroveň trénovaných, vyladěných a přetrénovaných modelů do vyšších prostředí. Definujte kritéria výkonu, která jsou pro každou aplikaci jedinečná, a vytvořte jasné pracovní postupy povýšení, které zahrnují testovací a ověřovací kroky.
Sledujte harmonogramy vyřazování modelů, abyste zabránili přerušení provozu. Sledování vyřazení modelu brání problémům s výkonem při ukončení podpory dodavatele. Organizace, které zmeškaly data vyřazení, čelí neočekávaným problémům se snížením služeb nebo kompatibilitou. Monitorujte data vyřazení předem natrénovaných modelů, abyste zachovali funkčnost, když dodavatelé ukončují služby. Před vyřazením například aktualizujte generující modely AI, aby se zachovaly systémové funkce. Pomocí portálu Foundry můžete zobrazit data vyřazení modelu pro všechna nasazení.
Správa nákladů na AI
Správa nákladů na AI zajišťuje organizacím kontrolu nákladů při zachování výkonu napříč výpočetními prostředky, úložištěm a využitím tokenů. Organizace potřebují strukturované strategie dohledu a optimalizace nákladů, aby zabránily překročení rozpočtu a maximalizovaly efektivitu zdrojů. Abyste dosáhli předvídatelných výdajů na AI, musíte vytvořit komplexní procesy správy nákladů. Postupujte následovně:
Implementujte osvědčené postupy správy nákladů pro každý nástroj Foundry. Různé nástroje Foundry mají jedinečné cenové modely a funkce optimalizace, které ovlivňují celkové náklady na vlastnictví. Pochopení nákladových struktur specifických pro služby pomáhá organizacím vybrat cenově nejvýhodnější možnosti pro své úlohy. Pokud chcete například optimalizovat výdaje pro každý typ služby, postupujte podle pokynů pro správu nákladů pro Foundry .
Monitorujte vzory využití, abyste maximalizovali efektivitu fakturace. Pochopení zarážek nákladů zabraňuje zbytečným poplatkům a pomáhá organizacím optimalizovat přidělování prostředků. Sledování vzorců používání odhaluje příležitosti k úpravě modelů a architektury pro lepší výkonnost nákladů. Monitorujte tokeny za minutu (TPM) a požadavky za minutu (RPM), abyste porozuměli vzorům použití, a pak na základě těchto vzorů upravte modely a architekturu. Pro služby, jako je generování obrázků nebo ladění po hodinách, použijte prahové hodnoty s pevnou cenou, abyste se vyhnuli neočekávaným poplatkům. Zvažte modely fakturace založené na závazku pro konzistentní vzory využití, abyste snížili celkové náklady.
Vytvořte automatizované monitorování nákladů a výstrahy. Automatizované výstrahy brání přetečení rozpočtu tím, že před dopadem na rozpočty projektů upozorní týmy na neočekávané poplatky. Tato upozornění umožňují proaktivní správu nákladů a pomáhají organizacím udržovat finanční kontrolu nad iniciativami umělé inteligence. Nastavte upozornění rozpočtu v Správa nákladů v Azure, abyste mohli sledovat útratu proti předdefinovaným prahovým hodnotám a stanovit strategie rozpočtování, které odpovídají obchodním cílům. Vytvořte upozornění s několika prahovými hodnotami, abyste mohli včas upozornit na zvýšení nákladů.
Správa dat AI
Správa dat AI zajišťuje přesnost, integritu a dodržování předpisů v průběhu životního cyklu AI. Organizace potřebují strukturované procesy zásad správného řízení dat a řízení kvality, aby zachovaly spolehlivý výkon umělé inteligence. Abyste dosáhli konzistentních výsledků umělé inteligence, musíte vytvořit komplexní postupy správy dat. Postupujte následovně:
Vytváření a údržba zlatých datových sad pro konzistentní ověřování Zlaté datové sady poskytují standardizované srovnávací testy pro testování modelů AI v různých prostředích a verzích. Tyto autoritativní datové sady zajišťují konzistentní kritéria hodnocení a pomáhají zjišťovat snížení výkonu v průběhu času. Vyvíjejte zlaté datové sady, které představují vzory produkčních dat, a použijte tyto datové sady k pravidelnému testování a ověřování napříč všemi úlohami AI. Pravidelně aktualizujte zlaté datové sady tak, aby odrážely aktuální obchodní požadavky a vzory dat.
Implementujte zabezpečené datové kanály s ovládacími prvky integrity. Integrita datového kanálu zabraňuje poškození a zajišťuje spolehlivý výkon modelu AI. Zabezpečené kanály chrání citlivé informace a udržují kvalitu dat před shromažďováním prostřednictvím předběžného zpracování a úložiště. Sestavte vlastní datové kanály, které zahrnují kontroly ověření v každé fázi, a implementujte bezpečnostní prvky pro ochranu dat v průběhu procesu kanálu. Před odesláním dat do modelů AI můžete ověřit kvalitu a konzistenci dat pomocí automatizovaného testování.
Monitorujte klasifikace citlivosti dat a reagujte na změny. Klasifikace citlivosti dat se mění kvůli obchodním požadavkům a zákonným aktualizacím. Organizace musí tyto změny sledovat a odpovídajícím způsobem aktualizovat systémy AI, aby zachovaly dodržování předpisů a zabezpečení. Vyvíjejte procesy, které identifikují, kdy se změní citlivost dat a implementují postupy pro odebrání nebo nahrazení citlivých dat v podřízených systémech AI. Použijte Microsoft Defender for Cloud a Microsoft Purview k označování a správě citlivých dat v celé organizaci. Když dojde ke změnám citlivosti, identifikujte všechny modely umělé inteligence, které používají ovlivněná data, a přetrénujte modely s datovými sadami, které vylučují přetříděné citlivé informace.
Správa provozní kontinuity AI
Správa kontinuity podnikových procesů chrání systémy AI před přerušením a zajišťuje rychlé obnovení při výskytu incidentů. Organizace potřebují strategie pro více regionů a otestované postupy obnovení, aby zachovaly dostupnost služby AI. Efektivní plánování kontinuity zabraňuje rozšířeným výpadkům, které ovlivňují obchodní provoz. Abyste dosáhli spolehlivé odolnosti systému AI, musíte vytvořit komplexní procesy provozní kontinuity. Postupujte následovně:
Implementujte průběžné monitorování napříč všemi komponentami AI. Úlohy AI se mění v průběhu času kvůli vývoji dat, aktualizacím modelů nebo změnám chování uživatelů. Průběžné monitorování tyto změny detekuje včas a zabraňuje snížení výkonu, které ovlivňuje obchodní výsledky. Monitorujte nasazení AI, modely AI a data AI , abyste zajistili, že úlohy zůstanou v souladu se zavedenými klíčovými ukazateli výkonu. Proveďte pravidelné audity pro posouzení systémů AI proti definovaným principům a metrikám zodpovědné umělé inteligence.
Nasaďte systémy AI napříč několika oblastmi pro zajištění vysoké dostupnosti. Nasazení ve více oblastech brání kritickým bodům selhání a zajišťují, aby služby umělé inteligence zůstaly během oblastních výpadků přístupné. Tento přístup poskytuje geografickou redundanci, která chrání před selháními infrastruktury a přírodními katastrofami. Nasaďte generování i tradiční systémy AI napříč několika Azure oblastmi a implementujte potřebnou redundanci pro natrénované a jemně vyladěné modely, abyste se vyhnuli opětovnému trénování během výpadků. K automatickému směrování provozu mezi oblastmi použijte Azure Front Door nebo Azure Traffic Manager.
Pravidelně testujte plány zotavení po havárii, abyste ověřili efektivitu. Pravidelné testování identifikuje mezery v postupech zotavení a zajišťuje, aby týmy mohly efektivně obnovovat systémy AI během skutečných incidentů. Tyto testy ověřují, že všechny komponenty po obnovení fungují správně a pomáhají organizacím upřesnit své postupy reakce. Proveďte čtvrtletní testy plánů zotavení po havárii, které zahrnují procesy obnovení dat a ověřovací postupy pro všechny komponenty AI. Zdokumentujte výsledky testů a aktualizujte postupy obnovení na základě poznatků získaných z každého testovacího cyklu.
Implementujte správu verzí pro všechny systémové komponenty AI. Systémy správy verzí sledují změny a umožňují rychlé obnovení předchozích konfigurací během scénářů obnovení. Tento přístup poskytuje záznamy auditu pro úpravy a zajišťuje, aby týmy mohly efektivně identifikovat a vracet problematické změny. Pomocí Gitu můžete spravovat změny modelů, datových kanálů a konfigurací systému napříč všemi úlohami AI. Implementujte automatizované auditování, které sleduje změny modelu a systému, aby týmy mohly rychle identifikovat a vrátit neplánované změny, které ovlivňují výkon.
Vytváření automatizovaných strategií zálohování pro prostředky AI Automatizované zálohy zajišťují, aby důležité komponenty umělé inteligence zůstaly chráněné bez ručního zásahu. Tyto strategie brání ztrátě dat a zkracují dobu obnovení, když systémy potřebují obnovení po incidentech. Vytvořte automatizované plány zálohování pro natrénované modely, datové sady a konfigurační soubory pomocí Azure Backup nebo Azure Storage s geograficky redundantními možnostmi. Uložte zálohy v samostatných oblastech od primárních nasazení, abyste zajistili dostupnost během oblastních výpadků.
Postupy obnovení dokumentů s jasnou odpovědností. Jasná dokumentace zajišťuje, že týmy můžou konzistentně spouštět postupy obnovení během vysoce stresových situací. Zdokumentované postupy zkracují dobu obnovení a brání chybám, ke kterým dochází, když týmy pracují bez stanovených pokynů. Vytvořte runbooky, které definují podrobné postupy obnovení pro různé scénáře selhání a přiřazují členům týmu konkrétní role a zodpovědnosti pro jednotlivé úlohy obnovení. Pravidelně aktualizujte dokumentaci tak, aby odrážela změny v architektuře AI a procesech obnovení.