Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A Fabricban való tükrözés egy alacsony költségű és alacsony késésű megoldás, amely a különböző rendszerekből származó adatokat egyetlen elemzési platformra egyesíti. Meglévő adattulajdonát folyamatosan replikálhatja közvetlenül a Fabric OneLake-be különböző Azure-adatbázisokból és külső adatforrásokból.
Ha a legtöbb up-to-date adat lekérdezhető formátumban a OneLake-ben, a Fabric összes szolgáltatását használhatja, például elemzéseket futtathat a Sparkkal, jegyzetfüzeteket hajthat végre, adatelemzést végezhet, Power BI-jelentéseken keresztül vizualizálhat stb.
A Tükrözési funkció a Fabricban segítségével egy rendkívül integrált, végponttól végpontig és könnyen használható terméket kap, amely leegyszerűsíti az Ön elemzési igényeit. A tükrözés a Microsoft és a nyílt forráskódú Delta Lake táblaformátum olvasására alkalmas technológiai megoldások közötti nyitottságra és együttműködésre épül. Ez egy alacsony költségű és alacsony késésű kulcsrakész megoldás, amely az adatok replikáját hozza létre a OneLake-ben az összes elemzési igénynek megfelelően.
A Delta-táblákat bárhol használhatja a Fabricben, ami segít felgyorsítani a Fabricbe való utazást.
A tükrözést úgy engedélyezheti, hogy biztonságos kapcsolatot hoz létre az operatív adatforráshoz. Kiválaszthatja, hogy egy teljes adatbázist vagy egyes táblákat replikál-e, és a tükrözés automatikusan szinkronizálja az adatokat. A beállítás után az adatok folyamatosan replikálódnak a OneLake-be elemzési felhasználás céljából.
Miért érdemes tükrözést használni a Szövetben?
Napjainkban számos szervezet rendelkezik üzemeltetési vagy elemzési kritikus fontosságú adatokat, amelyek elkülönítve vannak.
Az adatokhoz való hozzáféréshez és az adatok kezeléséhez összetett ETL-folyamatokra, üzleti folyamatokra és döntési silókra van szükség, amelyek a következőket hozhatják létre:
- Korlátozott és korlátozott hozzáférés a fontos, folyamatosan változó adatokhoz
- Súrlódás az emberek, a folyamat és a technológia között
- Hosszú várakozási idők a kritikus fontosságú adatokhoz szükséges csővezetékek és folyamatok létrehozásakor
- Nincs szabad használni az elemzéshez és a megállapítások kényelmes megosztásához szükséges eszközöket
- Nincs megfelelő alap az adatok megosztásához és együttműködéséhez
- Nem gyakori, nyílt adatformátumok az összes elemzési forgatókönyvhöz – BI, AI, Integráció, Mérnöki és még Alkalmazások
A Fabric platformon való tükrözés egyszerű módot kínál az elemzések és döntések gyorsabb megtérülésére, valamint az adatsilók lebontására a technológiai megoldások között.
- Adatok és metaadatok közel valós idejű replikálása SaaS-adattóba, beépített BI- és AI-elemzéssel
A Microsoft Fabric platform a szolgáltatott szoftver (SaaS) alapjaira épül, amely teljesen új szintre emeli az egyszerűséget és az integrációt. További információkért a Microsoft Fabricról, lásd: Mi a Microsoft Fabric?
A tükrözés alapvető alapelvei a következők:
A tükrözés engedélyezése a Hálóban egyszerű és intuitív, anélkül, hogy összetett ETL-folyamatokat kellene létrehoznia, más számítási erőforrásokat kellene lefoglalnia, vagy kezelnie kellene az adatáthelyezést.
A Tükrözés a Hálóban egy teljes mértékben felügyelt szolgáltatás, így nem kell aggódnia a tükrözött kapcsolat replikációjának üzemeltetése, karbantartása vagy kezelése miatt.
Objektumok tükrözése
A tükrözés az alábbi elemeket hozza létre a Fabric munkaterületen:
- Egy folyamat, amely az adatok és metaadatok OneLake-be történő replikálását és parquetté alakítását kezeli elemzésre kész formátumban. Ez a folyamat olyan további felhasználási lehetőségeket tesz lehetővé, mint az adatmérnöki munka, az adattudomány és mások.
- SQL Analytics-végpont
Az SQL-lekérdezésszerkesztő mellett az eszközök széles körű ökoszisztémája is elérhető, beleértve az SQL Server Management Studio (SSMS) szolgáltatást, a Visual Studio Code MSSQL-bővítményét és a GitHub Copilotot is.
A megosztás megkönnyíti a hozzáférés szabályozását és az engedélyek kezelését, így megvédheti a bizalmas információkat. A megosztás a biztonságos és demokratizált döntéshozatalt is lehetővé teszi a szervezeten belül.
A tükrözés típusai
A Microsoft Fabric három különböző módszert kínál az adatok oneLake-be való tükrözésen keresztüli behozására.
- Adatbázis-tükrözés – Az adatbázis-tükrözés a Fabricben teljes adatbázisokat és táblákat replikál, hogy a különböző rendszerekből származó adatokat egyetlen elemzési platformba hozza össze.
- Metaadat-tükrözés – A Metaadat-tükrözés a Hálóban az adatok fizikai áthelyezése helyett szinkronizálja a metaadatokat (például katalógusneveket, sémákat és táblákat). Ez a megközelítés billentyűparancsokat használ, így biztosítva, hogy az adatok a forrásban maradnak, miközben továbbra is könnyen elérhetők legyenek a Fabricben. Mivel a metaadat-tükrözés a OneLake-parancsikonokra támaszkodik, a bérlők közötti adatmegosztást is támogatja. A szervezetek az adatok másolása vagy ETL-folyamatok létrehozása nélkül használhatnak élő, szabályozott adatokat más bérlőktől.
- Nyitott tükrözés – A nyitott tükrözés a Fabric rendszerben úgy lett kialakítva, hogy a tükrözést a nyílt Delta Lake táblafomátum alapján bővítse. Ez a funkció lehetővé teszi, hogy bármely fejlesztő közvetlenül egy tükrözött adatbáziselembe írja be az alkalmazás változásadatait a Fabricben a nyílt tükrözési megközelítés és a nyilvános API-k alapján.
Jelenleg a következő külső adatbázisok érhetők el:
Közel valós idejű replikáció
Az adatbázis-tükrözés és a nyitott tükrözés esetében a közel valós idejű replikáció különböző tényezőktől függhet, például:
- A forrás helye vagy régiója
- Célhely vagy régió
- A módosítások mennyisége
- A változások gyakorisága
- Hálózati sávszélesség és késés a forrásból
- A helyszíni adatátjáróhoz lefoglalt számítási erőforrások
Megjegyzés:
A metaadatok tükrözése nem replikál adatokat. Ehelyett a OneLake-parancsikonokra támaszkodik a forrásadatok helyben való hivatkozásához. A metaadat-tükrözés késése a forrásrendszer hozzáférési idejét és a parancsikon teljesítményét tükrözi az adatreplikáció sebessége helyett.
Hogyan működik az adatbázis-tükrözés?
A Delta-fájlok növekményesen érkeznek a Fabricbe az adatforrásból. A növekményesen módosított adatok azonosításának módja minden adatforrásban eltérő. 2025 SQL Server például az SQL Database Engine nagy gyakorisággal ellenőrzi a forrásadatbázis tranzakciónaplóját. SQL Server minden tábla módosítását az adatátviteli gyűjtőhelyen belüli megfelelő fájlokban teszi közzé.
Az Inside Fabricben a replikátormotor mindig nagy gyakorisággal futtatja és ellenőrzi az újonnan közzétett fájlokat. A Fabric azonnal egyesíti a bejövő módosításokat a céldeltatáblával. A módosítások akár 15 másodpercenként is közzétehetők.
Az alacsony aktivitást észlelő háttérlogika elkerüli a Fabricen kívüli adatforrásmotorok túlzott terhelését, és csökkenti a késést a bejövő adatváltozások gyakoriságára reagálva.
Hogyan működik a metaadatok tükrözése?
A metaadatok tükrözése a forrásadatokra hivatkozik a OneLake-parancsikonokon keresztül ahelyett, hogy replikálná őket, és egyetlen hiteles adatforrást tart fenn anélkül, hogy duplikációt vagy ETL-t alkalmazna. Ebben a kontextusban a tükrözés csak metaadatokat (katalógusneveket, sémákat és táblákat) szinkronizál a tényleges adatok helyett. Ez a megközelítés lehetővé teszi a Fabric számára, hogy másolás nélkül akadálymentessé tegye a különböző forrásokból származó adatokat, egyszerűsítve az adatkezelést és minimalizálva a tárolási igényeket.
A Unity Catalogban regisztrált adatok elérésekor például a Fabric csak az Azure Databricks katalógus struktúráját tükrözi, így a mögöttes adatok gyorshivatkozásokon keresztül érhetők el. Ez a módszer biztosítja, hogy a forrásadatok változásai azonnal tükröződhessenek a rendszerben anélkül, hogy adatáthelyezésre lenne szükség, fenntartva a valós idejű szinkronizálást, és növelve a hatékonyságot a naprakész adatok elérésében.
Hogyan működik a nyitott tükrözés?
Amellett, hogy biztonságos kapcsolatot hoz létre az adatforrással az adatreplikációban, a tükrözéssel kiválaszthat egy meglévő adatszolgáltatót, vagy saját alkalmazást írhat az adatok tükrözött adatbázisba való elhelyezéséhez. Amikor nyílt tükrözött adatbázist hoz létre a nyilvános API-val vagy a Fabric-portállal, kap egy kezdőzóna URL-címét a OneLake-ben, ahol a nyitott tükrözési specifikációk szerint módosíthatja az adatokat.
Ha az adatok a megfelelő formátumban vannak a kezdőzónában, a replikáció elindul, és kezeli a módosítások frissítésekkel, beszúrással és törléssel való egyesítésének összetettségét, hogy azok tükröződjenek a változástáblákban. Ez a módszer biztosítja, hogy a célzónába írt adatok azonnal megjelenjenek, így az adatok a Fabric rendszerben naprakészek maradnak.
Sharing
A megosztás megkönnyíti a hozzáférés-vezérlést és a felügyeletet. A biztonsági vezérlők, mint például a sorszintű biztonság (RLS), az objektumszintű biztonság (OLS) és sok más, biztosítják, hogy szabályozhassa a bizalmas információkhoz való hozzáférést. A megosztás a biztonságos és demokratizált döntéshozatalt is lehetővé teszi a szervezeten belül.
A megosztással a felhasználók hozzáférést biztosítanak más felhasználóknak vagy felhasználók egy csoportjának a tükrözött adatbázishoz anélkül, hogy hozzáférést adnának a munkaterülethez és annak többi eleméhez. Ha valaki megoszt egy tükrözött adatbázist, hozzáférést is biztosít az SQL Analytics-végponthoz.
A tükrözött adatbázisokat és az adatokat a bérlők közötti határokon átívelően is megoszthatja a OneLake külső adatmegosztás funkció segítségével. Különböző bérlők közötti megosztáskor egy írásvédett hivatkozás jön létre a fogyasztói bérlőben, így mindkét szervezet ugyanazon élő adatokkal dolgozik, duplikáció nélkül.
További információ: A tükrözött adatbázis megosztása és az engedélyek kezelése.
Adatbázisközi lekérdezések
A Tükrözött adatbázis oneLake-ben tárolt adataival adatbázisközi lekérdezéseket írhat, adatokat illeszthet össze tükrözött adatbázisokból, raktárakból és a Lakehouses SQL Analytics-végpontjaiból egyetlen T-SQL-lekérdezésben. További információ: Adatbázisközi lekérdezés írása.
A tükrözött adatbázisokból és raktárakból például háromrészes elnevezéssel hivatkozhat a táblára. Az alábbi példában a háromrészes nevet használja a raktár ContosoSalesTable-ra történő hivatkozáshozContosoWarehouse. Az egyéb adatbázisokból vagy adattárházakból származó szabványos SQL háromrészes elnevezési konvenció első része a tükrözött adatbázis neve.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Tükrözés költsége
Az adatbázis-tükrözéshez és a nyitott tükrözéshez a Fabric compute és a OneLake storage kapacitásalapú korlátig ingyenes.
- A replikák tárhelye a kapacitás méretétől függően legfeljebb korlátig ingyenes. A tükrözés ingyenes terabájtnyi tükrözési tárterületet kínál minden megvásárolt kapacitásegységhez (CU). Ha például F64-kapacitást vásárol, 64 ingyenes terabájtnyi tárterületet kap, amelyet kizárólag tükrözéshez használnak. Ha túllépi az ingyenes tükrözési tárterületkorlátot, vagy ha a kapacitás szüneteltetve van, a OneLake-tárterületért fizetnie kell. További információ: Microsoft Fabric Díjszabás.
- Az adatok Fabric OneLake-be való replikálásához használt Background Fabric-számítás ingyenes, és nem használja fel a kapacitást. A tükrözött adatokra vonatkozó közvetlenül a OneLake-nek küldött kérések a szokásos OneLake számítási felhasználásként fogyasztják a kapacitást. Az SQL, a Power BI vagy a Spark használatával történő adatbekérdezés számítása normál díjszabással történik.
- Működő Fabric kapacitás csak a tükrözés kezdeti beállításához szükséges.
Adatelemzés tükrözött adatbázisadatokkal
Microsoft Fabric különböző adatmérnöki képességeket biztosít, hogy az adatok könnyen hozzáférhetők, rendezettek és kiváló minőségűek legyenek. A Fabric Adatmérnöki területen a következőket teheti:
- Adatok létrehozása és kezelése Spark-ként egy lakehouse használatával
- Folyamatok tervezése az adatok lakehouse-ba másolásához
- Spark-feladatdefiníciókat a köteg- vagy streamelési feladatok Spark-fürtbe történő elküldéséhez használja.
- Kód írása adatbetöltéshez, előkészítéshez és átalakításhoz jegyzetfüzetek használatával
Adatelemzés tükrözött adatbázisadatokkal
Microsoft Fabric a Fabric Data Science segítségével a felhasználók teljes körű adatelemzési munkafolyamatokat végezhetnek adatnövelés és üzleti elemzések céljából. A teljes adatelemzési folyamat során számos tevékenységet végezhet, kezdve az adatfeltárástól az előkészítésen és tisztításon át a kísérletezésig, modellezésig, a modellek értékeléséig és az előrejelző betekintések kiszolgálásáig a BI-jelentésekben.
Microsoft Fabric felhasználók hozzáférhetnek Adatelemzési számítási feladatokhoz. Innen különböző releváns erőforrásokat fedezhetnek fel és érhetnek el. Létrehozhatnak például gépi tanulási kísérleteket, modelleket és jegyzetfüzeteket. A meglévő jegyzetfüzeteket a Adattudomány kezdőlapján is importálhatják.
Direct Lake tükrözött adatbázis-adatokkal
A Direct Lake mód tükrözött adatbázisokkal a Microsoft Fabricben lehetővé teszi a tükrözött adatok nagy teljesítményű lekérdezését anélkül, hogy adatáthelyezésre vagy duplikálásra van szükség. Tükrözött adatbázis létrehozásakor az adatok Delta Lake formátumban lesznek tárolva a OneLake-ben. Ez a natív formátum lehetővé teszi, hogy Power BI és más elemzési eszközök Direct Lake-módban csatlakozzanak, és közel valós idejű elemzéseket kínálnak az alapul szolgáló fájlok közvetlen elérésével. Ez az integráció egyesíti a tükrözés egyszerűségét a Direct Lake sebességével és méretezhetőségével, lehetővé téve a gyors, naprakész jelentéskészítést a működési adatokról.
Tükrözött adatok megőrzése
A Fabric tükrözése folyamatosan replikálja a meglévő adatállományt a OneLake-be, Delta Lake táblázatformátumban. Annak érdekében, hogy a tükrözött adatok hatékonyan tárolhatók és mindig elemzésre készek maradjanak, a tükrözés automatikusan vákuumot futtat, hogy eltávolítsa a deltanapló által már nem hivatkozott régi fájlokat.
A megőrzési beállítást a követelményeknek megfelelően testre szabhatja. Előfordulhat például, hogy rövidebb megőrzési időtartamot választ a tükrözési tárhasználat csökkentéséhez, vagy meghosszabbítja a megőrzési időtartamot a Delta időutazási képességeinek az elemzéshez való használatához.
A Háló portálról 2025. június közepe után létrehozott tükrözött adatbázisok esetében az alapértelmezett megőrzés egy nap. A régi tükrözött adatbázisok esetében az alapértelmezett érték hét nap. A megőrzési beállítás ellenőrzéséhez vagy frissítéséhez a Háló portálon keresse meg a tükrözött adatbázis -> ->Delta táblafelügyelet lapját, és adja meg a megőrzési küszöbértéket. A tulajdonság megadásával retentionInDays is konfigurálhatja.
SQL-adatbázis a Fabricben
Közvetlenül is létrehozhat és kezelhet SQL-adatbázist Microsoft Fabric a Háló portálon. Az Azure SQL Database alapján az SQL Database in Fabric automatikusan tükrözi az adatokat elemzési célokra, és egyszerűen létrehozhatja a működési adatbázist a Fabricben. Az SQL Database az OLTP számítási feladatok otthona a Fabricben, és integrálható a Fabric forrásvezérlési integrációjával.