Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Jednotná datová platforma závisí na konzistentním příjmu dat, transformaci a standardech publikování, aby vedoucí pracovníci mohli důvěřovat datům pro analýzu a AI. Doporučení: Vytvořte standardy pro celou organizaci, které řídí, která data zadávají do OneLake, jak týmy tato data upřesní a jak se řídí, jak se datové produkty dostanou ke spotřebitelům (viz obrázek 1). Pokud chcete toto doporučení použít, použijte tento článek jako kontrolní seznam:
Obrázek 1 Tři kroky nastavení provozních standardů pro data
1. Nastavení standardů příjmu dat
OneLake slouží jako centrální datové jezero pro analýzy a AI v Microsoft Fabric, takže vedoucí pracovníci musí řídit, co vstupuje. Doporučení: Nastavte jasné hranice, aby týmy ingestovály pouze data, která podporují definované obchodní výsledky. Pokud chcete toto doporučení použít, použijte následující kontrolní seznam.
Jaká data sjednocujete? Sjednocení dat ve OneLake znamená výběr dat, která podporují datový produkt svázaný s měřitelným obchodním výsledkem. Osvědčené postupy: Přenést data do OneLake pouze v případě, že podporuje datový produkt a přidává obchodní hodnotu. Zacházejte s příjmem dat jako s rozhodnutím o produktu, nikoli jako s technickým výchozím nastavením. Pokyny k rozhodování: Rozhodněte se ingestovat data, když vysvětlují nebo měří obchodní proces nebo výsledek, které vedoucí pracovníci sledují. Pokud neexistuje žádný aktivní případ použití, zvolte možnost ponechat data v operačních systémech nebo v úložišti oddělení. Tato možnost snižuje náklady na úložiště a režijní náklady na řízení.
Udržujte spolupráci a znalostní obsah v Microsoftu 365. Data Microsoftu 365 podporují agenty Microsoftu 365 Copilot. Tito agenti načítají dokumenty, e-maily a artefakty spolupráce při zachování stávajících oprávnění. Podívejte se na architekturu Microsoftu 365 Copilot. Osvědčené postupy: Microsoft 365 použijte jako systém záznamů pro obsah, jehož primárním účelem je spolupráce, reference nebo načítání znalostí. K přípravě těchto dat použijte průvodce přechodem na Microsoft 365 .
Integrace provozních databází prostřednictvím podporovaných vzorů Provozní databáze často poskytují analytické scénáře a scénáře umělé inteligence, ale přímý přístup vytváří riziko a nestabilitu. Osvědčené postupy: Pro replikovaný přístup používejte vzory podporované Microsoft Fabric, jako jsou klávesové zkratky pro virtuální přístup a zrcadlení . Databáze Azure často vyžadují zrcadlení pro spolehlivou integraci. Pokyny k rozhodování: Vyberte zkratky, pokud virtuální přístup splňuje požadavky na výkon. Zvolte zrcadlení, pokud výkon analýz, izolace nebo opětovné využití v dalších procesech vyžaduje fyzickou kopii v OneLake.
Integrujte existující datová jezera. Mnoho organizací již provozuje datová jezera, jako je Azure Data Lake Storage (ADLS), Google Cloud Storage nebo Amazon S3. Osvědčené postupy: Zacházejte s existujícími jezery jako se součástí sjednoceného datového prostředí, spíše než vynucovat okamžitou migraci. Používejte klávesové zkratky nebo zrcadlení. Pokyny k rozhodování: Rozhodněte se na základě připravenosti a rizika. Pokud se chcete vyhnout duplikaci, zvolte klávesové zkratky. Vyberte zrcadlení, když konzistence, výkon nebo soulad s předpisy převáží náklady na duplikaci.
Výstupy ze služby Azure Databricks v OneLake Azure Databricks už často vytváří kurátorovaná analytická data. Osvědčené postupy: Udržujte pipeliny Databricks na místě a představte konečné zlaté výstupy v OneLake. Pokyny k rozhodování: Zvolte klávesové zkratky , které se mají vyhnout replikaci a kdy vzdálený přístup vyhovuje potřebám. Vyberte zrcadlení, když řízení nebo vzorce spotřeby vyžadují místní data.
Oddělení interního a externího příjmu dat Interní analytická data a externí data vyžadují různé ovládací prvky. Osvědčené postupy: Vytvořte samostatné pracovní prostory nebo oblasti jezera pro externí datové produkty. Na těchto místech uložte jenom schválené externí datové sady. Pokyny k rozhodování: Rozhodněte se včas, jestli data podporují interní rozhodnutí nebo externí sdílení. Volba fyzického oddělení pro snížení náhodné expozice a zjednodušení vynucování zásad zabezpečení
2. Nastavení standardů transformace dat
Získání dat do OneLake je jediným prvním krokem. Skutečná hodnota pochází z transformace nezpracovaných dat na vysoce kvalitní datové produkty připravené k použití. Vedoucí pracovníci nenavrhují kanály, ale definují platformy a standardy architektury, které brání fragmentaci. Doporučení: Standardizujte transformační platformy a vynucujte konzistentní architekturu upřesnění. Pokud chcete toto doporučení použít, použijte následující kontrolní seznam:
2.1. Použití správné datové platformy
Volba platformy nastavuje provozní požadavky pro vaše datové produkty v prostředích Microsoftu a Azure. Doporučení: Pro každý datový produkt vyvažte jednoduchost a integraci s potřebou specializovaných technických schopností. Pokud chcete toto doporučení použít, použijte následující kontrolní seznam:
Síťová architektura (výchozí) Fabric poskytuje integrované moduly pro přípravu dat, analýzy a BI, které pracují přímo na OneLake, což funguje jako sjednocená řídicí datová aktiva pro organizaci. Osvědčené postupy: Použijte Fabric pro standardní analýzy, vytváření sestav a přípravu dat. Upřednostňujte nativní moduly Fabric, jako jsou Dataflows Gen2, Spark a SQL, pro zjednodušení řízení přístupu, sledování původu a správy nákladů. Použijte OneLake jako jednu vrstvu úložiště. Pokyny k rozhodování: Vyberte Fabric, když požadavky odpovídají integrovaným schopnostem a když vedení oceňuje sjednocené řízení a fakturaci. Přijměte omezené přizpůsobení výměnou za nižší provozní režii.
Azure Databricks. Mnoho lidí upřednostňuje Azure Databricks. Podporuje rozsáhlé zpracování a pokročilé scénáře strojového učení. Osvědčené postupy: Pokračujte v používání Databricks, kde už existují odborné znalosti nebo škálování. Vyžadovat, aby výstupy přistály ve OneLake nebo se připojily prostřednictvím zkratek OneLake, aby zásady správného řízení, zabezpečení a zjišťování zůstaly centralizované. Pokyny k rozhodování: Zvolte Databricks, pokud Fabric nesplňuje aktuální požadavky. Přijměte vyšší nároky na integraci a dovednosti jako kompromis.
Vynucujte hranice vlastnictví platformy. Jasně stanovené hranice platformy zabraňují duplicitním nákladům a nekonzistentní logice napříč systémy. Osvědčené postupy: Přiřaďte odpovědnost za každou třídu úloh na jednu platformu. Před schválením zpracování napříč platformami je vyžadována kontrola architektury. Pokyny k rozhodování: Rozhodněte se, která platforma vlastní výsledky příjmu, transformace a analýzy. Znemožnit duplicitní transformace a překrývající se kanály, které poskytují stejný obchodní výsledek.
2.2. Použití architektury medailiónu
Architektura medailonu vytváří vztah důvěryhodnosti, konzistence a zásady správného řízení napříč všemi datovými produkty definováním jasného průběhu od nezpracovaných dat až po výstupy připravené pro firmy. Doporučení: Vyžadovat, aby všechny datové produkty ve OneLake sledovaly bronzovou, stříbrnou a zlatou strukturu a zakázaly klávesové zkratky, které tyto vrstvy obcházejí. Pokud chcete toto doporučení použít, použijte následující kontrolní seznam:
Určení bronzové vrstvy jako systému záznamů (příjmu nezpracovaných dat): Bronzová vrstva zachycuje data přesně tak, jak dorazí do OneLake, a zachovává původní věrnost zdroji. Osvědčené postupy: Ukládat data pouze jako doplňovací a neměnná. Zakázat opravy nebo rozšiřování v této fázi. Nejprve vyžadovat, aby každá příchozí datová sada přistála v bronzu. Pokyny k rozhodování: Rozhodněte se, že bronz existuje pouze proto, aby zachoval pravdu ze zdrojových systémů. Přijměte pomalejší použitelnost výměnou za auditovatelnost a dohledatelnost.
Nastavte stříbrnou vrstvu jako důvěryhodné zobrazení. Stříbrná vrstva uchovává ověřená, standardizovaná a vyčištěná data, na která týmy spoléhají při konzistentní analýze. Osvědčené postupy: Použijte pravidla kvality dat, zarovnání formátu a základní obchodní ověření. Dokumentovat stříbrné datové sady jasně a spravovat změny prostřednictvím procesů řízení. Pokyny k rozhodování: Jako autoritativní vyčištěnou vrstvu zvolte stříbro. Zakažte týmům nezávislé znovu čištění nezpracovaných dat, což vytváří konfliktní interpretace.
Gold (obchodní kontext, datové produkty): Certifikujte zlaté datové sady jako obchodní datové produkty. Zlatá vrstva poskytuje řízené datové produkty, které vedoucí pracovníci používají k rozhodování, sledování výkonu a vytváření sestav. Osvědčené postupy: Zarovnejte zlatá data ke schváleným obchodním definicům a metrikám. Optimalizujte struktury pro spotřebu. Zaregistrujte všechny zlaté datasety jako datový produkt v Microsoft Purview s vlastnictvím, účelem a detaily aktualizace. Pokyny k rozhodování: Rozhodněte se, že každá datová sada používaná napříč týmy nebo pro rozhodnutí musí existovat ve zlatě. Zamítnout nespravované nebo necertifikované datové sady, které obcházejí zásady správného řízení.
Vytvořte sanitizované produkty pro externí použití. Externí sdílení vyžaduje záměrné oddělení od interních provozních dat. Osvědčené postupy: Vytváření kurátorovaných datových sad, které odeberou nebo maskují citlivá pole, a v případě potřeby zmenšuje podrobnosti. Přiřaďte vlastnictví a použijte jasné popisky, jako je veřejné nebo externí použití. Uložte tyto datové sady do schválených umístění. Pokyny k rozhodování: Zvolte, jestli chcete s externími datovými sadami zacházet jako s nezávislými produkty. Přijměte přidané kroky zásad správného řízení, abyste snížili právní a bezpečnostní riziko.
Fabric tento model podporuje prostřednictvím materializovaných lake views, která mohou automaticky spravovat transformace. Podívejte se na architekturu Medallion Lakehouse v Fabric. Analytickou architekturu najdete v tématu Komplexní analýza s Microsoft Fabric.
Tabulka. Příklad architektury medailiónu Zlatá vrstva kombinuje data ze dvou datových sad.
| Datová sada | Vrstva | Ukázková data | Co se přihodilo |
|---|---|---|---|
| Prodejní transakce | Bronz | OrderID=984321 · StoreID=17 · Amount="1,200" · TxnDate="2026-01-05T14:32:09Z" | Tento záznam přišel z prodejního systému přesně tak, jak byl odeslán. Částka je text. Časové razítko se řídí systémovým formátem. Není použit žádný význam. |
| Stříbro | OrderID=984321 · StoreID=17 · Amount=1200,00 · TxnDate=2026-01-05 | Transakce je standardizovaná a ověřená. Částka je číselná. Datum se řídí podnikovými pravidly. Data jsou teď důvěryhodná. | |
| Referenční informace k úložišti | Bronz | StoreID="17" · RegionName="EAST " | Tento záznam přišel ze systému lokalizace. Formátování odráží zdroj. |
| Stříbro | StoreID=17 · Region=East | Identifikátory obchodu odpovídají prodejním datům. Hodnoty regionů jsou vyčištěny a konzistentní. | |
| Denní výnosy podle oblasti | Zlato | Region=East · Datum=2026-01-05 · TotalRevenue=425000 | Tato hodnota kombinuje transakce stříbrných prodejů s referenčními daty obchodu Silver. Jednotlivé záznamy jsou shrnuty tak, aby odpovídaly na obchodní otázku. |
2.3. Zvažte adaptivní zlatou vrstvu
Adaptivní zlato je zde zahrnuté jako výhled do budoucna. Myšlenka spočívá v tom, že k vytváření zlatých vrstev používáte agenty AI. Agenti můžou sledovat vzory, které možná nebudete moct. Pokud se uživatelé často ptají na nejčastější problémy zákazníků podle oblastí za měsíc, můžou agenti umělé inteligence tuto datovou sadu materializovat. Tato funkce není k dispozici v Microsoft Fabric ještě dnes. Bylo by třeba vytvořit vlastního agenta AI, který běží na Fabric a telemetrii Power BI.
3. Nastavení standardů publikování datových produktů
Standardy publikování definují, jak vaše organizace zveřejňuje důvěryhodné datové produkty prostřednictvím Microsoft Fabric OneLake a Microsoft Purview. Cílem je škálovat opakované použití, vynucovat zásady správného řízení a snižovat riziko napříč analytickými úlohami a úlohami AI. Doporučení: Vytvořte jeden standard publikování, který před širokým použitím zjišťuje, řídí a jasně určuje, že každý schválený datový produkt bude zjistitelný, řízený a jasně určený pro definovanou cílovou skupinu. Pokud chcete toto doporučení použít, použijte následující kontrolní seznam:
Standardizace publikace prostřednictvím katalogu OneLake. OneLake Catalog poskytuje jednotný přístup k datovým produktům napříč platformami Fabric a externími procesory, jako je Databricks. Osvědčené postupy: OneLake použijte jako výchozí vrstvu spouštění a spotřeby pro všechny schválené datové produkty. Microsoft Purview považujte za referenční systém pro řízení a podnikové definice. Díky tomuto sladění můžou Power BI, datoví agenti Fabric a Azure AI Search konzistentně využívat data a zároveň umožnit centralizovanou viditelnost řízení.
Zajistěte zjistitelnost. Zjistitelnost zajišťuje, že pracovníci s rozhodovací pravomocí a spotřebitelé můžou najít důvěryhodné datové produkty, aniž by se museli spoléhat na neformální znalosti. Osvědčené postupy: Nakonfigurujte viditelnost pracovního prostoru Fabricu tak, aby relevantní cílové skupiny mohly objevovat položky. Nepotřebují přístup, jenom možnost požádat o přístup. Povolte pracovní postupy žádosti o přístup purview , aby uživatelé mohli požádat o oprávnění přímo z katalogu. Pokyny k rozhodování: Zvolte širokou zjistitelnost, když je cílem opětovné používání napříč doménami. Zvolte omezenou zjistitelnost, pokud platí omezení dodržování právních předpisů nebo důvěrnosti. Vyvážení viditelnosti pomocí řízení přístupu místo skrytí prostředků
Při publikování pověřte obohacením metadat. Metadata poskytují kontext, který vedoucím umožňuje vyhodnotit fitness, důvěru a opakované použití datového produktu. Osvědčené postupy: Vyžaduje popisná metadata v publikaci. Pomocí značek ve Fabricu klasifikujte produkty podle obchodní domény nebo iniciativy. Ujistěte se, že popis vysvětluje účel a rozsah dat. Tento postup podporuje vyhledávání v katalogu a zlepšuje spolehlivost opakovaného použití. Pokyny k rozhodování: Rozhodněte se, jestli požadavky na metadata zůstávají minimální, nebo vynucuje standardní schéma. Zvolte standardní schéma, když organizace provozuje více domén a potřebuje konzistenci. Zvolte světlejší přístup pro fáze rané vyspělosti.
Pokud je to vhodné, schvalte a certifikujte. Definujte kritéria doporučení a certifikace. Doporučení signalizuje úroveň důvěryhodnosti a vyspělost zásad správného řízení pro organizaci. Osvědčené postupy: Použijte označení Promoted k označení doporučených produktů v doméně. Certifikace slouží k označení produktů, které prošly formální kontrolou zásad správného řízení. Použijte certifikaci u datových sad Gold, které podporují výkonné generování sestav nebo kritické analýzy. Pokyny týkající se schválení Fabric naleznete v podpis. Pokyny k rozhodování: Rozhodněte se, které produkty vyžadují certifikaci. Zvolte povinnou certifikaci pro výkonné nebo regulační úlohy. Zvolte volitelnou certifikaci, když má přednost rychlost a experimentování. Přijměte pomalejší onboarding jako kompromis pro vyšší důvěru.
Publikujte jako datový produkt v Purview. Datové produkty Purview poskytují zobrazení vyšší úrovně, které seskupuje prostředky do životního cyklu spravovaného produktu. Osvědčené postupy: Vytvořte položku datového produktu Purview pro každý publikovaný datový produkt. Uveďte název produktu, popis, vlastníky, stav kvality a související zdroje, jako jsou tabulky, modely a sestavy. Referenční datové produkty v jednotném katalogu Pokyny k rozhodování: Rozhodněte se, jestli se datové produkty Purview vyžadují pro všechny publikované prostředky nebo pouze pro strategické produkty. Zvolte úplné pokrytí, když záleží na viditelnosti portfolia. Zvolte selektivní pokrytí, pokud je možnost správy omezená.
Deklarujte zamýšlenou cílovou skupinu a využití. Jasný záměr zabraňuje zneužití a podporuje dodržování předpisů napříč analytickými scénáři a scénáři umělé inteligence. Osvědčené postupy: Vyžaduje, aby každý datový produkt uvedl zamýšlenou cílovou skupinu a podporovaný typ úlohy. Zadejte interní, partnerské nebo veřejné použití. Identifikujte scénáře umělé inteligence, analýzy, BI nebo veřejného webu. Pro konzistentní vyjádření tohoto záměru použijte Purview metadata, termíny glosáře a označení citlivosti. Pokyny k rozhodování: Rozhodněte se, jestli použití externího nebo agenta vyžaduje dodatečné schválení. Zvolte přísnější schvalování, když data opustí hranice organizace. Přijměte pomalejší publikaci jako kompromis pro snížené riziko.