Megosztás a következőn keresztül:


Az Önnel megosztott adatok elérése a Delta Sharing használatával (címzettek számára)

Ez a cikk bemutatja, hogyan érheti el az Önnel megosztott adatokat a Delta Sharing használatával.

Változásmegosztás és adatátvevők

A Delta Sharing egy nyílt szabvány a biztonságos adatmegosztáshoz. A Databricks-felhasználók, ebben a kontextusban adatszolgáltatóként is ismertek, a Delta Sharing on Azure Databricks használatával adatokat oszthatnak meg a szervezeten kívüli személyekkel vagy csoportokkal, úgynevezett adatátvevőkkel.

A Databricks-to-Databricks megosztása és megnyitása

Az adatok elérésének módjától függ, hogy Ön maga a Databricks-felhasználó, és hogy az adatszolgáltató konfigurálta-e az Önnel megosztott adatokat a Databricks-to-Databricks megosztásához vagy a megosztás megnyitásához.

A Databricks-to-Databricks modellben felhasználónak kell lennie a Unity Cataloghoz engedélyezett Databricks-munkaterületen. A csapat egy tagja egyedi azonosítót biztosít az adatszolgáltatónak a Unity Catalog-metaadattárhoz, és az adatszolgáltató ezt használja egy biztonságos megosztási kapcsolat létrehozásához. A megosztott adatok elérhetők lesznek a munkaterületen. Ha szükséges, a csapat egy tagja részletes hozzáférés-vezérlést konfigurál az adatokon.

A nyílt megosztási modellben bármilyen eszközt használhat (beleértve a Databrickset is) a megosztott adatok eléréséhez. Az adatszolgáltató egy aktiválási URL-címet küld egy biztonságos csatornán keresztül. Ezt követve letölthet egy hitelesítő fájlt, amely lehetővé teszi az Önnel megosztott adatok elérését.

A megosztott adatokat nem közvetlenül a Databricks, hanem az Azure Databricksen futó adatszolgáltatók biztosítják.

Feljegyzés

A Databricks információkat gyűjthet arról, hogy az adat címzettjei milyen módon használják és férhetnek hozzá a megosztott adatokhoz (ideértve azokat a személyeket vagy vállalatokat, akik az adatokhoz a hitelesítő adatokkal kapcsolatban férnek hozzá), és megoszthatják azokat az érintett adatszolgáltatóval.

Hozzáférés kérése az Önnel megosztott adatokhoz

Az adatok elérésének módjától függ, hogy az adatszolgáltató megosztotta-e Önnel az adatokat a nyílt megosztási protokoll vagy a Databricks-to-Databricks megosztóprotokoll használatával. Lásd: Databricks-to-Databricks megosztás és megosztás megnyitása.

Hozzáférés kérése a Databricks-to-Databricks modellben

A Databricks-to-Databricks modellben:

  1. Az adatszolgáltató útmutatást küld a Databricks-munkaterülethez társított Unity Catalog metaadattár egyedi azonosítójának megkereséséhez, és ön elküldi nekik.

    A megosztási azonosító egy sztring, amely a metaadattár felhőjét, régióját és UUID azonosítóját (a metaadattár egyedi azonosítóját) tartalmazza.<cloud>:<region>:<uuid> Például: aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    A megosztási azonosító lekérése a Catalog Explorerrel:

    1. Az Azure Databricks-munkaterületen kattintson a Katalógus elemre Katalógus ikon .

    2. A Katalógus panel tetején kattintson a fogaskerék ikonra, és válassza a Fogaskerék ikon Delta Sharing lehetőséget.

      Másik lehetőségként a Gyorselérési lapon kattintson a Delta Megosztás > gombra.

      1. A Velem megosztva lapon kattintson a Databricks megosztó szervezet nevére a jobb felső sarokban, és válassza a Megosztási azonosító másolása lehetőséget.

    Ha a megosztási azonosítót jegyzetfüzet vagy Databricks SQL-lekérdezés használatával szeretné lekérni, használja az alapértelmezett SQL-függvényt CURRENT_METASTORE. Ha jegyzetfüzetet használ, annak egy megosztott vagy egyfelhasználós fürtön kell futnia a megosztott adatok eléréséhez használt munkaterületen.

    SELECT CURRENT_METASTORE();
    
  2. Az adatszolgáltató a következőket hozza létre:

    • A Databricks-fiókjában lévő címzett képviseli Önt és a szervezet azon felhasználóit, akik hozzáférnek az adatokhoz.
    • Megosztás, amely az Önnel megosztani kívánt táblák, kötetek és nézetek ábrázolása.
  3. Ön hozzáfér az Önnel megosztott adatokhoz. Ön vagy a csapat egy tagja szükség esetén részletes adathozzáférést konfigurálhat ezen adatokhoz a felhasználók számára. Lásd: Adatok olvasása a Databricks-to-Databricks deltamegosztással (címzettek számára).

Hozzáférés lekérése a nyílt megosztási modellben

A nyílt megosztási modellben:

  1. Az adatszolgáltató a következőket hozza létre:

    • A Databricks-fiókjában lévő címzett képviseli Önt és a szervezet azon felhasználóit, akik hozzáférnek az adatokhoz. A konfiguráció részeként jogkivonat és hitelesítőadat-fájl jön létre.
    • Megosztás, amely az Önnel megosztani kívánt táblák és partíciók ábrázolása.
  2. Az adatszolgáltató egy aktiválási URL-címet küld egy biztonságos csatornán keresztül. Ezt követve letölthet egy hitelesítő fájlt, amely lehetővé teszi az Önnel megosztott adatok elérését.

    Fontos

    Ne ossza meg senkivel az aktiválási hivatkozást. A hitelesítő adatokat csak egyszer töltheti le. Ha a hitelesítőadat-fájl letöltése után ismét felkeresi az aktiválási hivatkozást, a Hitelesítőadat-fájl letöltése gomb le van tiltva.

    Ha használat előtt elveszíti az aktiválási hivatkozást, forduljon az adatszolgáltatóhoz.

  3. A hitelesítőadat-fájlt biztonságos helyen tárolja.

    Ne ossza meg a hitelesítőadat-fájlt a felhasználók csoportján kívüli másokkal, akiknek hozzáféréssel kell rendelkezniük a megosztott adatokhoz. Ha meg kell osztania a szervezet egyik munkatársával, a Databricks egy jelszókezelő használatát javasolja.

A megosztott adatok olvasása

A Delta Sharing használatával biztonságosan megosztott adatok olvasásának módja attól függ, hogy kapott-e hitelesítő fájlt (a nyílt megosztási modellt), vagy Egy Databricks-munkaterületet használ, és megadta az adatszolgáltatónak a megosztási azonosítóját (a Databricks-to-Databricks-modellt).

Megosztott adatok olvasása hitelesítő adatokkal (megosztás megnyitása)

Ha az adatokat megosztotta Önnel a Delta Sharing nyílt megosztási protokollal, a letöltött hitelesítőadat-fájl használatával hitelesítheti magát az adatszolgáltató Databricks-fiókjában, és elolvashatja a megosztott adatokat. Az Access mindaddig megmarad, amíg az alapul szolgáló jogkivonat érvényes, és a szolgáltató továbbra is megosztja az adatokat. A szolgáltatók kezelik a jogkivonatok lejáratát és elforgatását. Az adatok frissítései közel valós időben érhetők el. Elolvashatja és másolatot készíthet a megosztott adatokról, de nem módosíthatja a forrásadatokat.

A megosztott adatok azure Databricksben, Apache Sparkban, pandasban és Power BI-ban tárolt hitelesítő fájllal való eléréséről és olvasásáról a Delta Sharing nyílt megosztással megosztott adatok olvasása (címzettek számára) című témakörben olvashat.

Megosztott adatok olvasása a Databricks-to-Databricks megosztásával

Ha az adatokat a Databricks-to-Databricks modellel osztották meg Önnel, akkor a megosztott adatok eléréséhez nincs szükség hitelesítőadat-fájlra. A Databricks gondoskodik a biztonságos kapcsolatról, és a megosztott adatok automatikusan felderíthetők a Databricks-munkaterületen.

Ha szeretné megtudni, hogyan keresheti meg, olvashatja és kezelheti a megosztott adatokat a Databricks-munkaterületen, olvassa el a Databricks-to-Databricks deltamegosztással megosztott adatok olvasása (címzettek számára) című témakört.

Megosztott adatok használatának naplózása

Ha rendelkezik hozzáféréssel egy Azure Databricks-munkaterülethez, az Azure Databricks naplózási naplói segítségével megtudhatja, hogy a szervezet mely adataihoz fér hozzá a Delta Sharing használatával. Lásd: Adatmegosztás naplózása és monitorozása.

Következő lépések