Adatok és AI-eszközök biztonságos megosztása a Delta Sharing használatával
Ez a cikk bemutatja a Delta Sharingt az Azure Databricksben, a biztonságos adatmegosztási platformon, amellyel adatokat és AI-eszközöket oszthat meg az Azure Databricksben a szervezeten kívüli felhasználókkal, függetlenül attól, hogy ezek a felhasználók használják-e a Databrickset.
Fontos
A webhelyen található Delta Sharing-cikkek az Azure Databricks-adatok, jegyzetfüzetek és AI-modellek megosztására összpontosítanak. A Delta-megosztás nyílt forráskódú projektként is elérhető, amellyel más platformokról is megoszthatja a Delta-táblákat. A Delta Sharing a Databricks Marketplace gerincét is biztosítja, amely nyílt fórum az adattermékek cseréjéhez.
Feljegyzés
Ha Ön olyan adat címzettje, aki hozzáférést kapott a megosztott adatokhoz a Delta-megosztáson keresztül, és csak azt szeretné megtudni, hogyan férhet hozzá ezekhez az adatokhoz, tekintse meg az Önnel megosztott adatok hozzáférését a Delta Sharing használatával (a címzettek számára) című témakörben.
Mi az a Delta Sharing?
A Delta Sharing egy nyílt protokoll , amelyet a Databricks fejlesztett ki a más szervezetekkel való biztonságos adatmegosztáshoz, függetlenül attól, hogy milyen számítási platformokat használnak.
Az adatok megosztásának három módja van a Delta Sharing használatával:
A Databricks-to-Databricks megosztóprotokoll, amellyel adatokat és AI-objektumokat oszthat meg a Unity Catalog-kompatibilis munkaterületről olyan felhasználókkal, akik szintén hozzáférnek egy Unity Catalog-kompatibilis Databricks-munkaterülethez.
Ez a megközelítés az Azure Databricksbe beépített Delta Sharing-kiszolgálót használja. Olyan Delta-megosztási funkciókat támogat, amelyek nem szerepelnek a többi protokollban, beleértve a jegyzetfüzet-megosztást, a Unity Catalog mennyiségi megosztását, a Unity Catalog AI-modell megosztását, a Unity Catalog adatszabályozását, a naplózást és a használatkövetést mind a szolgáltatók, mind a címzettek számára. A Unity Catalog integrációja leegyszerűsíti a szolgáltatók és a címzettek beállítását és szabályozását, és javítja a teljesítményt.
A Databricks nyílt megosztási protokollja lehetővé teszi a Unity Catalog-kompatibilis Databricks-munkaterületen kezelt táblázatos adatok megosztását bármely számítási platform felhasználóival.
Ez a megközelítés az Azure Databricksbe beépített Delta Sharing-kiszolgálót használja, amely akkor hasznos, ha a Unity Catalog használatával kezeli az adatokat, és meg szeretné osztani azokat olyan felhasználókkal, akik nem használják a Databricks szolgáltatást, vagy nem rendelkeznek hozzáféréssel a Unity Catalog-kompatibilis Databricks-munkaterületekhez. A Unity Catalog szolgáltatói oldallal való integrációja leegyszerűsíti a szolgáltatók beállítását és szabályozását.
Lásd: Adatok megosztása a Delta Sharing nyílt megosztási protokoll használatával (szolgáltatók számára).
A nyílt forráskódú Delta Sharing-kiszolgáló ügyfél által felügyelt implementációja, amellyel bármilyen platformról megosztható bármilyen platformon, akár a Databricks, akár nem.
Az Azure Databricks dokumentációja nem tartalmazza a saját Delta Sharing-kiszolgáló beállítására vonatkozó utasításokat. Lásd: github.com/delta-io/delta-sharing.
Megosztások, szolgáltatók és címzettek
Az Azure Databricksben a deltamegosztás alapjául szolgáló elsődleges fogalmak a megosztások, a szolgáltatók és a címzettek.
Mi az a megosztás?
A Delta Sharingben a megosztás olyan táblák és táblapartíciók írásvédett gyűjteménye, amelyeket a szolgáltató meg szeretne osztani egy vagy több címzettel. Ha a címzett Unity Catalog-kompatibilis Databricks-munkaterületet használ, jegyzetfüzetfájlokat, nézeteket (beleértve a sor- és oszlopszintű hozzáférést korlátozó dinamikus nézeteket), a Unity Catalog-köteteket és a Unity Catalog-modelleket is belefoglalhatja egy megosztásba.
Táblákat, nézeteket, köteteket, modelleket és jegyzetfüzetfájlokat bármikor hozzáadhat vagy eltávolíthat egy megosztásból, és bármikor hozzárendelheti vagy visszavonhatja az adatátvevők hozzáférését egy megosztáshoz.
Egy Unity Catalog-kompatibilis Azure Databricks-munkaterületen a megosztás egy, a Unity Catalogban regisztrált biztonságos objektum. Ha eltávolít egy megosztást a Unity Catalog-metaadattárból, a megosztás minden címzettje elveszíti a hozzáférés képességét.
Lásd: Megosztások létrehozása és kezelése a Delta-megosztáshoz.
Mi az a szolgáltató?
A szolgáltató olyan entitás, amely adatokat oszt meg egy címzettel. Ha Ön szolgáltató, és ki szeretné használni a beépített Databricks Delta Sharing-kiszolgálót, és a Unity Catalog használatával szeretné kezelni a megosztásokat és a címzetteket, legalább egy Olyan Azure Databricks-munkaterületre van szüksége, amely engedélyezve van a Unity Cataloghoz. Nem kell az összes meglévő munkaterületet a Unity Catalogba migrálnia. Egyszerűen létrehozhat egy új Unity Catalog-kompatibilis munkaterületet a Delta Sharing igényeinek megfelelően.
Ha a címzett egy Unity Catalog-kompatibilis Databricks-munkaterületen található, a szolgáltató egyben egy Unity Catalog biztonságos objektum is, amely a szolgáltató szervezetét képviseli, és a szervezetet egy megosztáskészlettel társítja.
Mi az a címzett?
A címzett egy olyan entitás, amely megosztásokat fogad egy szolgáltatótól. A Unity Catalogban a megosztás egy biztonságos objektum, amely egy szervezetet jelöl, és egy hitelesítő vagy biztonságos megosztási azonosítóval társítja, amely lehetővé teszi a szervezet számára egy vagy több megosztás elérését.
Adatszolgáltatóként (megosztóként) több címzettet is meghatározhat egy adott Unity Catalog-metaadattárhoz, de ha több metaadattárból szeretne adatokat megosztani egy adott felhasználóval vagy felhasználói csoporttal, minden metaadattárhoz külön kell meghatároznia a címzettet. A címzettek több megosztáshoz is hozzáférhetnek.
Ha egy szolgáltató töröl egy címzettet a Unity Catalog metaadattárából, az adott címzett elveszíti a hozzáférést az összes olyan megosztáshoz, amelyhez korábban hozzáférhetett.
Lásd: Adatátvevők létrehozása és kezelése a Delta-megosztáshoz.
Megosztás megnyitása a Databricks-to-Databricks-megosztással szemben
Ez a szakasz a Unity Cataloghoz engedélyezett Databricks-munkaterületről való megosztás két protokollt ismerteti.
Feljegyzés
Ez a szakasz feltételezi, hogy a szolgáltató unitykatalógus-kompatibilis Azure Databricks-munkaterületen található. A nyílt forráskódú Delta Sharing-kiszolgáló nem Databricks-platformról vagy nem Unity Catalog-munkaterületről való megosztásának beállításáról a github.com/delta-io/delta-sharing.
Az, hogy egy szolgáltató hogyan használja a Delta Sharingt az Azure Databricksben, attól függ, hogy kivel oszt meg adatokat:
- A nyílt megosztás lehetővé teszi az adatok megosztását bármely felhasználóval, függetlenül attól, hogy rendelkeznek-e hozzáféréssel az Azure Databrickshez.
- A Databricks–Databricks-megosztás lehetővé teszi az adatok megosztását olyan Azure Databricks-felhasználókkal, akiknek a munkaterülete egy, az Önétől eltérő Unity Catalog-metaadattárhoz van csatolva. A Databricks-to-Databricks támogatja a jegyzetfüzetek, kötetek és modellek megosztását is, amelyek nem érhetők el a nyílt megosztásban.
Mi a nyitott Delta Sharing?
Ha az Azure Databricks-munkaterületen kívüli felhasználókkal szeretne adatokat megosztani, függetlenül attól, hogy a Databricks-et használják-e, az adatok biztonságos megosztásához használhatja a deltamegosztást. Adatszolgáltatóként létrehoz egy jogkivonatot, és biztonságosan megosztja azt a címzettel. A jogkivonatot használják a hitelesítéshez, és olvasási hozzáférést kapnak azokhoz a táblákhoz, amelyhez hozzáférést adott nekik a megosztásokban.
A címzettek számos számítástechnikai eszköz és platform használatával férhetnek hozzá a megosztott adatokhoz, például:
- Azure Databricks
- Apache Spark
- Pandák
- Power BI
A Delta Sharing-összekötők teljes listáját és a használatukkal kapcsolatos információkat a Delta Sharing dokumentációjában találja.
Lásd még: Adatok megosztása a Delta Sharing nyílt megosztási protokoll használatával (szolgáltatók számára).
Mi az a Databricks-to-Databricks deltamegosztás?
Ha olyan felhasználókkal szeretne adatokat megosztani, akik rendelkeznek a Unity Cataloghoz engedélyezett Databricks-munkaterülettel, használhatja a Databricks-to-Databricks deltamegosztást. A Databricks-to-Databricks megosztással adatokat oszthat meg más Databricks-fiókok felhasználóival, függetlenül attól, hogy az AWS-en, az Azure-on vagy a GCP-n vannak-e. Emellett nagyszerű módja az adatok biztonságos megosztásának a saját Databricks-fiókjában található Unity Catalog-metaadattárak között. Vegye figyelembe, hogy nem szükséges a Delta Sharing használatával megosztani az adatokat az ugyanazon Unity Catalog-metaadattárhoz csatolt munkaterületek között, mert ebben a forgatókönyvben a Unity Catalog használatával kezelheti az adatokhoz való hozzáférést a munkaterületeken.
A Databricks–Databricks megosztás egyik előnye, hogy a megosztás címzettjének nincs szüksége jogkivonatra a megosztás eléréséhez, és a szolgáltatónak nem kell kezelnie a címzett jogkivonatait. A megosztási kapcsolat biztonságát – beleértve az összes identitás-ellenőrzést, hitelesítést és naplózást – teljes egészében a Delta Sharing és a Databricks platform kezeli. Egy másik előny a Databricks-jegyzetfüzetfájlok, nézetek, Unity Catalog-kötetek és Unity Catalog-modellek megosztása.
Hogyan állíthatják be a szolgáltatói rendszergazdák a Delta Sharingt?
Ez a szakasz áttekintést nyújt arról, hogy a szolgáltatók hogyan engedélyezhetik a Delta-megosztást, és hogyan kezdeményezhetnek megosztást a Unity Catalog-kompatibilis Azure Databricks-munkaterületről. A nyílt forráskódú deltamegosztásról lásd: github.com/delta-io/delta-sharing.
A Databricks-to-Databricks egyazon fiókban lévő Unity Catalog-metaadattárak közötti megosztás mindig engedélyezve van. Ha Ön olyan szolgáltató, aki engedélyezni szeretné, hogy a Delta Sharing más fiókokban vagy nem Databricks-ügyfeleken lévő Databricks-munkaterületekkel ossza meg az adatokat, az Azure Databricks-fiók rendszergazdája vagy a metaadattár-rendszergazda a következő telepítési lépéseket hajtja végre (magas szinten):
Engedélyezze a Delta-megosztást a megosztani kívánt adatokat kezelő Unity Catalog-metaadattárhoz.
Feljegyzés
Nem kell engedélyeznie a Delta-megosztást a metaadattárban, ha a Delta Sharing használatával csak a fiókjában lévő más Unity Catalog-metaadattárak felhasználóival kíván adatokat megosztani. A metatárolók közötti megosztás egyetlen Azure Databricks-fiókon belül alapértelmezés szerint engedélyezett.
Hozzon létre egy megosztást, amely tartalmazza a Unity Catalog metaadattárában regisztrált adategységeket.
Ha nem Databricks-címzettel (más néven nyílt megosztással) oszt meg, a táblákat Delta vagy Parquet formátumban is felveheti. Ha a Databricks-to-Databricks megosztást tervezi használni, nézeteket, Unity Catalog-köteteket, Unity Catalog-modelleket és jegyzetfüzetfájlokat is hozzáadhat egy megosztáshoz.
Lásd: Megosztások létrehozása és kezelése a Delta-megosztáshoz.
Hozzon létre egy címzettet.
Lásd: Adatátvevők létrehozása és kezelése a Delta-megosztáshoz.
Ha a címzett nem Databricks-felhasználó, vagy nem rendelkezik hozzáféréssel a Unity Cataloghoz engedélyezett Databricks-munkaterülethez, akkor nyílt megosztást kell használnia. A rendszer jogkivonatalapú hitelesítő adatokat hoz létre a címzett számára.
Ha a címzett hozzáféréssel rendelkezik a Unity Cataloghoz engedélyezett Databricks-munkaterülethez, használhatja a Databricks–Databricks megosztást, és nincs szükség jogkivonatalapú hitelesítő adatokra. Egy megosztási azonosítót kér a címzetttől, és használja a biztonságos kapcsolat létrehozásához.
Tipp.
Használja magát teszt címzettként a beállítási folyamat kipróbálásához.
Adjon hozzáférést a címzettnek egy vagy több megosztáshoz.
Lásd: Delta Sharing-adatmegosztásokhoz való hozzáférés kezelése (szolgáltatók számára).<
/a0> Feljegyzés
Ezt a lépést egy nem rendszergazdai felhasználó is végrehajthatja a
USE SHARE
,USE RECIPIENT
ésSET SHARE PERMISSION
jogosultságokkal. Lásd: Unity Catalog-jogosultságok és biztonságos objektumok.Küldje el a címzettnek a megosztáshoz való csatlakozáshoz szükséges információkat (csak a megosztás megnyitása).
Lásd: A címzett kapcsolati adatainak elküldése.
A nyílt megosztáshoz használjon biztonságos csatornát a címzettnek egy aktiválási hivatkozás elküldéséhez, amely lehetővé teszi számukra a jogkivonat-alapú hitelesítő adatok letöltését.
A Databricks–Databricks-megosztás esetében a megosztásban szereplő adatok azonnal elérhetővé válnak a címzett Databricks-munkaterületén, amint hozzáférést ad nekik a megosztáshoz.
A címzett mostantól hozzáférhet a megosztott adatokhoz.
Hogyan férnek hozzá a címzettek a megosztott adatokhoz?
A címzettek írásvédett formátumban férnek hozzá a megosztott adategységekhez. A megosztott jegyzetfüzetfájlok írásvédettek, de klónozásuk, majd módosításuk és futtatásuk a címzett munkaterületen ugyanúgy történik, mint bármely más jegyzetfüzetben.
A biztonságos hozzáférés a megosztási modelltől függ:
- Nyílt megosztás (a címzett nem rendelkezik a Unity Cataloghoz engedélyezett Databricks-munkaterületekkel): A címzett minden alkalommal megadja a hitelesítő adatokat, amikor a választott eszközében fér hozzá az adatokhoz, beleértve az Apache Sparkot, a pandast, a Power BI-t, a Databrickset és még sok mást. Lásd: Megosztott adatok olvasása a Delta Sharing nyílt megosztásával (címzettek számára).
- Databricks-to-Databricks (a címzett munkaterülete engedélyezve van a Unity Catalogban): A címzett a Databricks használatával fér hozzá az adatokhoz. A Unity Catalog használatával hozzáférést biztosíthatnak és megtagadhatnak a Databricks-fiókjuk többi felhasználójához. Lásd: Adatok olvasása a Databricks-to-Databricks deltamegosztással (címzettek számára).
Amikor az adatszolgáltató frissíti az adattáblákat vagy köteteket a saját Databricks-fiókjában, a frissítések közel valós időben jelennek meg a címzett rendszerében.
Hogyan követheti nyomon, hogy ki oszt meg és fér hozzá a megosztott adatokhoz?
A Unity Catalog-kompatibilis Azure Databricks-munkaterületek adatszolgáltatói az Azure Databricks naplózási és rendszertáblái segítségével figyelhetik a megosztások és a címzettek létrehozását és módosítását, valamint figyelhetik a megosztások címzettjeinek tevékenységét. Lásd: Adatmegosztás naplózása és monitorozása.
A Databricks-munkaterületeken megosztott adatokat használó adat címzettjei a Databricks naplózási és rendszertáblái segítségével megismerhetik, hogy ki fér hozzá az adatokhoz. Lásd: Adatmegosztás naplózása és monitorozása.
Kötetek megosztása
Köteteket a Databricks-to-Databricks megosztási folyamattal oszthat meg. Lásd: Kötetek hozzáadása egy megosztáshoz (szolgáltatóknak) és a Databricks-to-Databricks deltamegosztással megosztott adatok olvasása (címzettek számára) (címzettek esetén).
Modellek megosztása
Modelleket a Databricks-to-Databricks megosztási folyamattal oszthat meg. Lásd: Modellek hozzáadása megosztáshoz (szolgáltatók számára) és Adatok olvasása a Databricks-to-Databricks deltamegosztással (címzettek esetén) (címzettek esetén).
Jegyzetfüzetek megosztása
A Delta Sharing használatával jegyzetfüzetfájlokat oszthat meg a Databricks–Databricks megosztási folyamattal. Lásd: Jegyzetfüzetfájlok hozzáadása megosztáshoz (szolgáltatóknak) és megosztott jegyzetfüzetek olvasása (címzettek számára).
A hozzáférés korlátozása a sor- és oszlopszinten
Olyan dinamikus nézeteket oszthat meg, amelyek bizonyos táblaadatokhoz való hozzáférést a címzett tulajdonságai alapján korlátozzák. A dinamikus nézetmegosztáshoz a Databricks–Databricks megosztási folyamat szükséges. Lásd: Dinamikus nézetek hozzáadása megosztáshoz sorok és oszlopok szűréséhez.
Delta-megosztás és streamelés
A Delta Sharing támogatja a Spark strukturált streamelését. A szolgáltató megoszthat egy táblát az előzményekkel, hogy a címzett strukturált streamforrásként használhassa, és a megosztott adatokat növekményesen, alacsony késéssel dolgozza fel. A címzettek Delta Lake időutazási lekérdezéseket is végrehajthatnak az előzményekkel megosztott táblákon.
Ha szeretné megtudni, hogyan oszthat meg táblákat előzményekkel, olvassa el a Táblák hozzáadása megosztáshoz című témakört. Ha meg szeretné tudni, hogyan használhat megosztott táblákat streamforrásként, olvassa el a Táblák lekérdezése apache Spark strukturált streameléssel (a Databricks-to-Databricks-megosztás címzettjei számára) vagy megosztott táblák elérése a Spark Strukturált streamelés használatával (a nyílt megosztási adatok címzettjei számára).
Lásd még : Streamelés az Azure Databricksben.
Delta-megosztás – gyakori kérdések
A Delta-megosztással kapcsolatos gyakori kérdések az alábbiak.
Szükségem van a Unity Katalógusra a Delta Sharing használatához?
Nem, nincs szüksége a Unity Katalógusra a megosztáshoz (szolgáltatóként) vagy a megosztott adatok (címzettként) használatához. A Unity Catalog azonban olyan előnyöket biztosít, mint a nem táblázatos és AI-eszközök megosztásának támogatása, a beépített szabályozás, az egyszerűség és a lekérdezési teljesítmény.
A szolgáltatók kétféleképpen oszthatnak meg adatokat:
Helyezze a megosztani kívánt eszközöket a Unity Catalog felügyelete alá, és ossza meg őket a beépített Azure Databricks Delta Sharing-kiszolgálóval.
Nem kell minden eszközt áttelepítenie a Unity Catalogba. Csak egy Olyan Azure Databricks-munkaterületre van szüksége, amely engedélyezve van a Unity Catalog számára a megosztani kívánt objektumok kezeléséhez. Egyes fiókokban az új munkaterületek automatikusan engedélyezve vannak a Unity Cataloghoz. Lásd: A Unity-katalógus automatikus engedélyezése.
Implementálja a nyitott Delta Sharing-kiszolgálót az adatok megosztásához anélkül, hogy feltétlenül az Azure Databricks-fiókját használaná.
A címzettek kétféleképpen használhatják fel az adatokat:
Databricks-munkaterület nélkül. Használjon nyílt forráskód Delta Sharing-összekötőket, amelyek számos adatplatformhoz érhetők el, beleértve a Power BI-t, a pandast és az Apache Spark nyílt forráskód. Lásd: Megosztott adatok olvasása a Delta Sharing nyílt megosztásával (a címzettek számára) és a Delta Sharing nyílt forráskód projektben.
Databricks-munkaterületen. A címzett munkaterületeket nem kell engedélyezni a Unity Cataloghoz, de az irányításnak, az egyszerűségnek és a teljesítménynek vannak előnyei, ha vannak.
Az ilyen előnyöket igénylő címzett szervezeteknek nem kell minden eszközt áttelepíteniük a Unity Catalogba. Csak egy Azure Databricks-munkaterületre van szüksége, amely engedélyezve van a Unity Catalog számára az Önnel megosztott objektumok kezeléséhez. Egyes fiókokban az új munkaterületek automatikusan engedélyezve vannak a Unity Cataloghoz. Lásd: A Unity-katalógus automatikus engedélyezése.
Lásd: Megosztott adatok olvasása a Delta Sharing nyílt megosztásával (címzettek esetén) és a Databricks-to-Databricks deltamegosztással megosztott adatok olvasása (címzettek számára).
Databricks-ügyfélnek kell lennem a Delta Sharing használatához?
Nem, a Delta Sharing egy nyílt protokoll. A nem Databricks-adatokat bármely adatplatformon megoszthatja a címzettekkel. A szolgáltatók konfigurálhatnak egy nyitott Delta Sharing-kiszolgálót, hogy bármely számítási platformról megosszanak. A címzettek a megosztott adatokat nyílt forráskód Delta Sharing-összekötőkkel használhatják számos adattermékhez, például a Power BI-hoz, a pandashoz és a Spark nyílt forráskód.
A Delta Sharing használata azonban az Azure Databricksen, különösen a Unity katalógusbarát munkaterületről való megosztás számos előnnyel jár.
Részletekért tekintse meg a gyik első kérdését.
A Delta-megosztás kimenő költségekkel jár?
A régión belüli deltamegosztás nem jár kimenő költségekkel. Más adatmegosztási platformoktól eltérően a Delta Sharing nem igényel adatreplikációt. Ez a modell számos előnnyel rendelkezik, de ez azt jelenti, hogy a felhőszolgáltató adatforgalmi díjakat számíthat fel, ha adatokat oszt meg felhőkben vagy régiókban. Az Azure Databricks támogatja a Cloudflare R2 (nyilvános előzetes verzió) megosztását, amely nem jár kimenő díjakkal, és egyéb eszközöket és javaslatokat kínál a kimenő díjak figyelésére és elkerülésére. Lásd a Delta Sharing kimenő költségeinek monitorozását és kezelését (szolgáltatók számára).
Visszavonhatják a szolgáltatók a címzettek hozzáférését?
Igen, a címzett hozzáférése igény szerint és meghatározott részletességi szinten visszavonható. Megtagadhatja a címzettek hozzáférését adott megosztásokhoz és adott IP-címekhez, szűrheti a címzett táblázatos adatait, visszavonhatja a címzett jogkivonatait, és teljes egészében törölheti a címzetteket. Lásd: Egy megosztás címzetthez való hozzáférésének visszavonása, valamint adatátvevők létrehozása és kezelése a Delta-megosztáshoz.
Nem biztonságos előre aláírt URL-címeket használni?
A Delta Sharing előre aláírt URL-címekkel biztosít ideiglenes hozzáférést egy fájlhoz az objektumtárolóban. Ezeket csak azok a címzettek kapják meg, akik már rendelkeznek hozzáféréssel a megosztott adatokhoz. Biztonságosak, mert rövid élettartamúak, és nem bővítik a hozzáférés szintjét a címzettek által már megadott szintnél.
Biztonságosak a Delta Sharing nyílt megosztási protokollban használt jogkivonatok?
Mivel a Delta Sharing lehetővé teszi a platformfüggetlen megosztást – más elérhető adatmegosztási platformokkal ellentétben –, a megosztási protokollhoz nyílt jogkivonatra van szükség. A szolgáltatók a jogkivonat élettartamának konfigurálásával, a hálózati vezérlők beállításával és a hozzáférés igény szerinti visszavonásával biztosíthatják a jogkivonatok biztonságát. Emellett a jogkivonat nem bővíti a hozzáférési szintet a címzettek által már megadott szintnél. A jogkivonatok biztonsági szempontjait lásd.
Ha inkább nem használ jogkivonatokat a címzett megosztásokhoz való hozzáférés kezeléséhez, használja a Databricks-to-Databricks megosztást , vagy forduljon a Databricks-fiók csapatához alternatív megoldásokért.
Támogatja a Delta Sharing a nézetmegosztást?
Igen, a Delta Sharing támogatja a nézetmegosztást. Lásd: Nézetek hozzáadása megosztáshoz.
A megosztás megtekintéséhez tervezett fejlesztésekről a Databricks-fiók csapatához fordulhat.
Korlátozások
- A táblázatos adatoknak Delta táblaformátumban kell lenniük. A Parquet-táblákat egyszerűen átalakíthatja Delta-ra – és újra. Lásd: KONVERTÁLÁS DELTA-RA.
- A nézetmegosztás csak a Databricks-to-Databricks megosztásban támogatott. A megosztható nézeteket Delta-táblákon vagy más megosztható nézeteken kell definiálni. Lásd: Nézetek hozzáadása megosztáshoz (szolgáltatóknak) és megosztott nézetek olvasása (címzettek számára).
- A kötetmegosztás csak a Databricks-to-Databricks megosztásban támogatott. Lásd: Kötetek hozzáadása egy megosztáshoz (szolgáltatók számára) és a Databricks-to-Databricks deltamegosztással megosztott adatok olvasása (címzettek számára).
- A modellmegosztás csak a Databricks-to-Databricks megosztásban támogatott. Lásd: Modellek hozzáadása megosztáshoz (szolgáltatóknak) és Adatok olvasása a Databricks-to-Databricks deltamegosztással (címzettek számára) című témakörben.
- A megosztott táblákhoz engedélyezett metaadatokban lévő fájlok száma korlátozott. További információkért tekintse meg az erőforráskorlát túllépett hibáit.
- Az elnevezett
information_schema
sémák nem importálhatók Unity Catalog-metaadattárba, mert a séma neve a Unity Catalogban van fenntartva. - A táblamegkötések (elsődleges és idegenkulcs-korlátozások) nem érhetők el a megosztott táblákban.
Erőforráskvóták
Az alábbi értékek a Delta Sharing-erőforrások kvótáit jelölik. Az alábbi kvótaértékek a szülő objektumhoz viszonyítva vannak kifejezve a Unity katalógusban.
Objektum | Parent | Érték |
---|---|---|
szolgáltató | metaadattár | 1000 |
címzettek | metaadattár | 5000 |
megosztások | metaadattár | 1000 |
táblákban | megosztás | 1000 |
volumes | megosztás | 1000 |
modellek | megosztás | 1000 |
sémák | megosztás | 500 |
notebookok | megosztás | 100 |
Ha várhatóan túllépi ezeket az erőforráskorlátokat, forduljon az Azure Databricks-fiók csapatához.
Következő lépések
- Databricks-fiók engedélyezése a Delta-megosztáshoz
- Megosztások létrehozása
- Címzettek létrehozása
- További információ a nyílt megosztásról és a Databricks-to-Databricks megosztómodellekről
- Megtudhatja, hogyan férnek hozzá a címzettek a megosztott adatokhoz
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: