Az Önnel megosztott adatok elérése a Delta Sharing használatával (címzettek számára)
Ez a cikk bemutatja, hogyan érheti el az Önnel megosztott adatokat a Delta Sharing használatával.
Változásmegosztás és adatátvevők
A Delta Sharing egy nyílt szabvány a biztonságos adatmegosztáshoz. A Databricks-felhasználók, ebben a kontextusban adatszolgáltatóként is ismertek, a Delta Sharing on Azure Databricks használatával adatokat oszthatnak meg a szervezeten kívüli személyekkel vagy csoportokkal, úgynevezett adatátvevőkkel.
A Databricks-to-Databricks megosztása és megnyitása
Az adatok elérésének módjától függ, hogy Ön maga a Databricks-felhasználó, és hogy az adatszolgáltató konfigurálta-e az Önnel megosztott adatokat a Databricks-to-Databricks megosztásához vagy a megosztás megnyitásához.
A Databricks-to-Databricks modellben felhasználónak kell lennie a Unity Cataloghoz engedélyezett Databricks-munkaterületen. A csapat egy tagja egyedi azonosítót biztosít az adatszolgáltatónak a Unity Catalog-metaadattárhoz, és az adatszolgáltató ezt használja egy biztonságos megosztási kapcsolat létrehozásához. A megosztott adatok elérhetők lesznek a munkaterületen. Ha szükséges, a csapat egy tagja részletes hozzáférés-vezérlést konfigurál az adatokon.
A nyílt megosztási modellben bármilyen eszközt használhat (beleértve a Databrickset is) a megosztott adatok eléréséhez. Az adatszolgáltató egy aktiválási URL-címet küld egy biztonságos csatornán keresztül. Ezt követve letölthet egy hitelesítő fájlt, amely lehetővé teszi az Önnel megosztott adatok elérését.
A megosztott adatokat nem közvetlenül a Databricks, hanem az Azure Databricksen futó adatszolgáltatók biztosítják.
Feljegyzés
A Databricks információkat gyűjthet arról, hogy az adat címzettjei milyen módon használják és férhetnek hozzá a megosztott adatokhoz (ideértve azokat a személyeket vagy vállalatokat, akik az adatokhoz a hitelesítő adatokkal kapcsolatban férnek hozzá), és megoszthatják azokat az érintett adatszolgáltatóval.
Hozzáférés kérése az Önnel megosztott adatokhoz
Az adatok elérésének módjától függ, hogy az adatszolgáltató megosztotta-e Önnel az adatokat a nyílt megosztási protokoll vagy a Databricks-to-Databricks megosztóprotokoll használatával. Lásd: Databricks-to-Databricks megosztás és megosztás megnyitása.
Hozzáférés kérése a Databricks-to-Databricks modellben
A Databricks-to-Databricks modellben:
Az adatszolgáltató útmutatást küld a Databricks-munkaterülethez társított Unity Catalog metaadattár egyedi azonosítójának megkereséséhez, és ön elküldi nekik.
A megosztási azonosító egy sztring, amely a metaadattár felhőjét, régióját és UUID azonosítóját (a metaadattár egyedi azonosítóját) tartalmazza.
<cloud>:<region>:<uuid>
Például:aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
.A megosztási azonosító lekérése a Catalog Explorerrel:
Az Azure Databricks-munkaterületen kattintson a Katalógus elemre .
A Katalógus panel tetején kattintson a fogaskerék ikonra, és válassza a Delta Sharing lehetőséget.
Másik lehetőségként a Gyorselérési lapon kattintson a Delta Megosztás > gombra.
- A Velem megosztva lapon kattintson a Databricks megosztó szervezet nevére a jobb felső sarokban, és válassza a Megosztási azonosító másolása lehetőséget.
Ha a megosztási azonosítót jegyzetfüzet vagy Databricks SQL-lekérdezés használatával szeretné lekérni, használja az alapértelmezett SQL-függvényt
CURRENT_METASTORE
. Ha jegyzetfüzetet használ, annak egy megosztott vagy egyfelhasználós fürtön kell futnia a megosztott adatok eléréséhez használt munkaterületen.SELECT CURRENT_METASTORE();
Az adatszolgáltató a következőket hozza létre:
- A Databricks-fiókjában lévő címzett képviseli Önt és a szervezet azon felhasználóit, akik hozzáférnek az adatokhoz.
- Megosztás, amely az Önnel megosztani kívánt táblák, kötetek és nézetek ábrázolása.
Ön hozzáfér az Önnel megosztott adatokhoz. Ön vagy a csapat egy tagja szükség esetén részletes adathozzáférést konfigurálhat ezen adatokhoz a felhasználók számára. Lásd: Adatok olvasása a Databricks-to-Databricks deltamegosztással (címzettek számára).
Hozzáférés lekérése a nyílt megosztási modellben
A nyílt megosztási modellben:
Az adatszolgáltató a következőket hozza létre:
- A Databricks-fiókjában lévő címzett képviseli Önt és a szervezet azon felhasználóit, akik hozzáférnek az adatokhoz. A konfiguráció részeként jogkivonat és hitelesítőadat-fájl jön létre.
- Megosztás, amely az Önnel megosztani kívánt táblák és partíciók ábrázolása.
Az adatszolgáltató egy aktiválási URL-címet küld egy biztonságos csatornán keresztül. Ezt követve letölthet egy hitelesítő fájlt, amely lehetővé teszi az Önnel megosztott adatok elérését.
Fontos
Ne ossza meg senkivel az aktiválási hivatkozást. A hitelesítő adatokat csak egyszer töltheti le. Ha a hitelesítőadat-fájl letöltése után ismét felkeresi az aktiválási hivatkozást, a Hitelesítőadat-fájl letöltése gomb le van tiltva.
Ha használat előtt elveszíti az aktiválási hivatkozást, forduljon az adatszolgáltatóhoz.
A hitelesítőadat-fájlt biztonságos helyen tárolja.
Ne ossza meg a hitelesítőadat-fájlt a felhasználók csoportján kívüli másokkal, akiknek hozzáféréssel kell rendelkezniük a megosztott adatokhoz. Ha meg kell osztania a szervezet egyik munkatársával, a Databricks egy jelszókezelő használatát javasolja.
A megosztott adatok olvasása
A Delta Sharing használatával biztonságosan megosztott adatok olvasásának módja attól függ, hogy kapott-e hitelesítő fájlt (a nyílt megosztási modellt), vagy Egy Databricks-munkaterületet használ, és megadta az adatszolgáltatónak a megosztási azonosítóját (a Databricks-to-Databricks-modellt).
Megosztott adatok olvasása hitelesítő adatokkal (megosztás megnyitása)
Ha az adatokat megosztotta Önnel a Delta Sharing nyílt megosztási protokollal, a letöltött hitelesítőadat-fájl használatával hitelesítheti magát az adatszolgáltató Databricks-fiókjában, és elolvashatja a megosztott adatokat. Az Access mindaddig megmarad, amíg az alapul szolgáló jogkivonat érvényes, és a szolgáltató továbbra is megosztja az adatokat. A szolgáltatók kezelik a jogkivonatok lejáratát és elforgatását. Az adatok frissítései közel valós időben érhetők el. Elolvashatja és másolatot készíthet a megosztott adatokról, de nem módosíthatja a forrásadatokat.
A megosztott adatok azure Databricksben, Apache Sparkban, pandasban és Power BI-ban tárolt hitelesítő fájllal való eléréséről és olvasásáról a Delta Sharing nyílt megosztással megosztott adatok olvasása (címzettek számára) című témakörben olvashat.
Megosztott adatok olvasása a Databricks-to-Databricks megosztásával
Ha az adatokat a Databricks-to-Databricks modellel osztották meg Önnel, akkor a megosztott adatok eléréséhez nincs szükség hitelesítőadat-fájlra. A Databricks gondoskodik a biztonságos kapcsolatról, és a megosztott adatok automatikusan felderíthetők a Databricks-munkaterületen.
Ha szeretné megtudni, hogyan keresheti meg, olvashatja és kezelheti a megosztott adatokat a Databricks-munkaterületen, olvassa el a Databricks-to-Databricks deltamegosztással megosztott adatok olvasása (címzettek számára) című témakört.
Megosztott adatok használatának naplózása
Ha rendelkezik hozzáféréssel egy Azure Databricks-munkaterülethez, az Azure Databricks naplózási naplói segítségével megtudhatja, hogy a szervezet mely adataihoz fér hozzá a Delta Sharing használatával. Lásd: Adatmegosztás naplózása és monitorozása.
Következő lépések
- További tudnivalók az Azure Databricks szolgáltatásról
- További információ a Delta-megosztásról
- További információ a Unity Katalógusról