Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Az adatbázis-tükrözés a Microsoft Fabricben egy nagyvállalati, felhőalapú, nulla ETL- és SaaS-technológia. Ez az útmutató segít létrehozni egy tükrözött adatbázist az Azure Databricksből, amely írásvédett, folyamatosan replikált másolatot készít az Azure Databricks-adatokról a OneLake-ben.
Előfeltételek
- Engedélyeznie kell a külső adathozzáférést a metaadattárban. További információ: Külső adathozzáférés engedélyezése a metaadattárban.
- Hozzon létre vagy használjon egy meglévő Azure Databricks-munkaterületet, amelyen engedélyezve van a Unity Catalog.
- Rendelkeznie kell azzal a
EXTERNAL USE SCHEMAjogosultsággal a Unity Katalógus sémájában, amely tartalmazza a Fabricből elérhető táblákat. - A Fabric engedélymodelljét kell használnia a katalógusok, sémák és táblák hozzáférés-vezérlőinek beállításához a Fabricben.
- Az Azure Databricks-munkaterületek nem lehetnek privát végpontok mögött.
Tükrözött adatbázis létrehozása az Azure Databricksből
Az alábbi lépéseket követve hozzon létre egy új tükrözött adatbázist az Azure Databricks Unity-katalógusból.
Navigáljon ide: https://powerbi.com.
Válassza az + Új , majd tükrözött Azure Databricks katalógust.
Válasszon ki egy meglévő kapcsolatot, ha van konfigurálva.
- Ha nem rendelkezik meglévő kapcsolattal, hozzon létre egy új kapcsolatot, és adja meg az összes adatot. Az Azure Databricks-munkaterületen "Szervezeti fiók" vagy "Szolgáltatásnév" használatával hitelesíthet. Kapcsolat létrehozásához az Azure Databricks-munkaterület felhasználójának vagy rendszergazdájának kell lennie.
- Az Azure Data Lake Storage (ADLS) Gen2-fiókok tűzfal mögötti eléréséhez a jelen cikk későbbi részében be kell tartania az Azure Data Lake Storage Gen2-fiók hálózati biztonsági hozzáférésének engedélyezéséhez szükséges lépéseket.
Miután csatlakozott egy Azure Databricks-munkaterülethez, a Táblák kiválasztása egy Databricks-katalógus oldaláról , kiválaszthatja a katalógust, a sémákat és a táblákat a Microsoft Fabricből hozzáadni és elérni kívánt belefoglalási/kizárási listával. Válassza ki a katalógust és annak kapcsolódó sémáit és táblázatait, amelyeket hozzá szeretne adni a Fabric-munkaterülethez.
- Csak azokat a katalógusokat/sémákat/táblákat láthatja, amelyekhez hozzáféréssel rendelkezik a Unity Catalog-jogosultságok és a biztonságos objektumok által leírt jogosultságmodellnek megfelelően.
- Alapértelmezés szerint a kiválasztott séma későbbi katalógusmódosításainak automatikus szinkronizálása engedélyezve van. További információ: Azure Databricks Unity Catalog tükrözése.
- Amikor kiválasztotta a beállításokat, válassza a Tovább gombot.
Alapértelmezés szerint az elem neve annak a katalógusnak a neve lesz, amelyet fel szeretne venni a Fabricbe. A Véleményezés és létrehozás lapon áttekintheti a részleteket, és tetszés szerint módosíthatja a tükrözött adatbáziselem nevét, amelynek egyedinek kell lennie a munkaterületen. Válassza a Create gombot.
Létrejön egy Databricks-katalóguselem, és minden táblához létrejön egy megfelelő Databricks-típus parancsikonja is.
- A táblákat nem tartalmazó sémák nem jelennek meg.
Az SQL Analytics-végpont kiválasztásával megtekintheti az adatok előnézetét is, amikor egy parancsikonhoz fér hozzá. Nyissa meg az SQL Analytics-végpontelemet az Explorer és a Lekérdezésszerkesztő lap megnyitásához. A tükrözött Azure Databricks-táblákat t-SQL-lel kérdezheti le az SQL-szerkesztőben.
Lakehouse-parancsikonok létrehozása a Databricks-katalóguselemhez
A Lakehouse-ból a Databricks-katalóguselemre mutató parancsikonokat is létrehozhat a Lakehouse-adatok és a Spark-jegyzetfüzetek használatához.
- Először létrehozunk egy tóházat. Ha már van egy tóház ezen a munkaterületen, használhat egy meglévő tóházat.
- Válassza ki a munkaterületet a navigációs menüben.
- Válassza a + New>Lakehouse lehetőséget.
- Adja meg a lakehouse nevét a Név mezőben, és válassza a Létrehozás lehetőséget.
- A tóház Explorer nézetében az Adatok lekérése a tóház menüjében , az Adatok betöltése a tóházban csoportban válassza az Új parancsikon gombot.
- Válassza a Microsoft OneLake lehetőséget. Válasszon ki egy katalógust. Ez az előző lépésekben létrehozott adatelem. Ezután válassza a Tovább lehetőséget.
- Jelölje ki a sémán belüli táblákat, és válassza a Tovább gombot.
- Válassza a Create gombot.
- A Lakehouse-ban mostantól billentyűparancsok érhetők el a többi Lakehouse-adattal való használatra. A Jegyzetfüzetek és a Spark használatával adatfeldolgozást is végezhet az Azure Databricks-munkaterületről hozzáadott katalógustáblák adatain.
Szemantikai modell létrehozása
Létrehozhat egy Power BI szemantikai modellt a tükrözött elem alapján, és manuálisan adhat hozzá/távolíthat el táblákat. A szemantikai modellek létrehozásával és kezelésével kapcsolatos további információkért lásd: Power BI szemantikai modell létrehozása.
A legjobb élmény érdekében ajánlott a Microsoft Edge Browsert használni a szemantikai modellezési feladatokhoz.
Szemantikai modellkapcsolatok kezelése
Miután létrehozott egy új szemantikai modellt a tükrözött adatbázis alapján,
- Válassza ki a modellelrendezéseket a munkaterület Explorerében .
- Miután kiválasztotta a modellelrendezéseket, megjelenik a szemantikai modell részeként belefoglalt táblák ábrája.
- Táblák közötti kapcsolatok létrehozásához húzzon egy oszlopnevet az egyik táblából egy másik tábla másik oszlopnevére. Megjelenik egy előugró ablak, amely azonosítja a táblák kapcsolatát és számosságát.
Hálózati biztonsági hozzáférés engedélyezése az Azure Data Lake Storage Gen2-fiókhoz
Ez a szakasz az Azure Data Lake Storage (ADLS) Gen2-fiók hálózati biztonságának konfigurálását ismerteti az Azure Storage-tűzfal konfigurálásakor.
Előfeltételek
- Hozzon létre vagy használjon egy meglévő Azure Databricks-munkaterületet, amelyen engedélyezve van a Unity Catalog.
- A munkaterület identitáshitelesítési típusának engedélyezéséhez (ajánlott) a Háló munkaterületet minden F-kapacitáshoz hozzá kell társítani. Munkaterületi identitás létrehozásához lásd: Hitelesítés munkaterületi identitással.
- Ez a szakasz egy Azure Storage-tűzfal mögötti Azure Data Lake Storage (ADLS) Gen2-tárfiók elérésére szolgál. Az Azure Storage-tűzfal mögötti Azure Databricks-munkaterületi tárolás nem támogatott.
- A katalógust egyetlen tárfiókhoz kell társítani.
Hálózati biztonsági hozzáférés engedélyezése
Új tükrözött Azure Databricks-katalógus létrehozásakor az Adatok kiválasztása lépésben válassza a Hálózatbiztonság lapot.
Válasszon ki egy meglévő kapcsolatot a tárfiókhoz, ha van konfigurálva.
- Ha nem rendelkezik meglévő ADLS-kapcsolattal, hozzon létre egy új kapcsolatot.
- A tárvégpont URL-címe a kiválasztott katalógus adatainak tárolása. A végpontnak az az adott mappa kell lennie, ahol az adatok tárolódnak, ahelyett, hogy a tárfiók szintjén megadhatja a végpontot. Például adja meg ahelyett
https://<storage account>.dfs.core.windows.net/container1/folder1, hogyhttps://<storage account>.dfs.core.windows.net/. - Adja meg a kapcsolat hitelesítő adatait. A támogatott hitelesítési típusok a szervezeti fiók, a szolgáltatásnév és a munkaterület identitása (ajánlott).
Az Azure Portalon adjon hozzáférési jogosultságokat a tárfiókhoz az előző lépésben kiválasztott hitelesítési típus alapján. Lépjen a tárfiókra az Azure Portalon. Válassza a Hozzáférés-vezérlés (IAM) lehetőséget. Válassza a +Szerepkör-hozzárendelés hozzáadása és hozzáadása lehetőséget. További információ: Azure-szerepkörök hozzárendelése a Azure Portal.
- Ha a kapcsolat részeként adta meg a tárfiókot, a választott hitelesítési objektumnak rendelkeznie kell a tárfiók Storage Blob-adatolvasó szerepkörével.
- Ha a kapcsolat részeként adott meg egy adott tárolót, a kiválasztott hitelesítési objektumnak tárolóblobadat-olvasó szerepkörrel kell rendelkeznie a tárolón.
- Ha adott mappát adott meg egy tárolón belül (ajánlott), a kiválasztott hitelesítési objektumnak az Olvasás (R) és a Végrehajtás (E) mappaszinten kell lennie. Ha szolgáltatásnév vagy munkaterületi identitást használ hitelesítési típusként, a szolgáltatásnévnek vagy munkaterületi identitásnak végrehajtási engedélyeket kell adnia a tároló gyökérmappájára, valamint a megadott mappához vezető mappák hierarchiájának minden mappájára.
Az ADLS-hozzáférés engedélyezésével kapcsolatos további információkért és lépésekért tekintse meg az ADLS-hozzáférés-vezérlést.
Engedélyezze a megbízható munkaterület-hozzáférést a tűzfalbarát Azure Data Lake Storage-fiókok (ADLS) Gen2-fiókok biztonságos eléréséhez. A megbízható munkaterület-hozzáféréshez közvetlenül létre kell hoznia egy kapcsolatot az ADLS-tárfiókkal, amely az Azure Databricks-munkaterület kapcsolatától függetlenül használható. További információ: Secure Fabric tükrözött adatbázisok az Azure Databricksből.
A Unity Catalog-táblákra mutató parancsikon jön létre azokhoz a táblákhoz, amelyek tárfiókjának neve megegyezik az ADLS-kapcsolatban megadott tárfióktal. Azoknál a tábláknál, amelyek tárfiókjának neve nem egyezik az ADLS-kapcsolatban megadott tárfiók nevével, a rendszer nem hoz létre parancsikonokat ezekhez a táblákhoz.
Fontos
Ha az ADLS-kapcsolatot a tükrözött Azure Databricks-katalóguselem-forgatókönyveken kívül szeretné használni, a tárfiókon a Storage Blob Delegator szerepkört is meg kell adnia.
OneLake-biztonság engedélyezése a Tükrözött Databricks-elemen
A Unity Catalog (UC) házirendjeinek leképezése a Microsoft OneLake biztonságára az alábbi lépések végrehajtásával:
- Szinkronizálja az Entra-csoportot, és alkalmazza az engedélyeket a Unity Catalogban. Az Azure Databricksben az Automatikus identitáskezelés használatával szinkronizálhat egy Microsoft Entra-azonosítócsoportot, és megadhatja neki a szükséges Unity Catalog-jogosultságokat, például a HASZNÁLAT, a TALLÓZÁS, a SELECT lehetőséget a megfelelő katalógusban/táblákban.
- OneLake adatelérési szerepkör hozzárendelése. A Háló munkaterületen hozzon létre egy adatelérési szerepkört az újonnan tükrözött adatokhoz. Adja hozzá ugyanazt az Entra-csoportot ehhez a szerepkörhöz, és adjon olvasási hozzáférést az Azure Databricks-tábláknak megfelelő OneLake-parancsikonokhoz. A táblaszintű biztonság első lépéseit a menüszalag OneLake biztonsági kezelése gombján kezdheti el. Győződjön meg arról, hogy a katalógusstruktúrák és -engedélyek fejlődésével szinkronizálva tartja a hozzáférési konfigurációkat. További információ: OneLake adathozzáférés-vezérlési modell (előzetes verzió).
Kapcsolódó tartalom
- Secure Fabric-tükrözött adatbázisok az Azure Databricksből
- Blog: Biztonságos tükrözött Azure Databricks-adatok a Hálóban a OneLake biztonságával
- A Microsoft Fabric tükrözött adatbázisainak korlátozásai az Azure Databricksből
- A Microsoft Fabricben található Azure Databricks tükrözött adatbázisokkal kapcsolatos gyakori kérdések
- Azure Databricks Unity-katalógus tükrözése
- Az adatok külső elérésének szabályozása a Unity Katalógusban