Uzyskiwanie dostępu do danych udostępnionych Tobie przy użyciu funkcji Udostępniania różnicowego (dla adresatów)

W tym artykule pokazano, jak uzyskać dostęp do danych, które zostały Ci udostępnione przy użyciu funkcji udostępniania różnicowego.

Udostępnianie różnicowe i adresaci danych

Udostępnianie różnicowe to otwarty standard bezpiecznego udostępniania danych. Użytkownik usługi Databricks nazywany dostawcą danych może używać funkcji Delta Sharing do udostępniania danych osobie lub grupie spoza organizacji nazywanej odbiorcą danych.

Udostępnianie i otwieranie udostępniania usługi Databricks w usłudze Databricks

Sposób uzyskiwania dostępu do danych zależy od tego, czy jesteś użytkownikiem usługi Databricks i czy dostawca danych skonfigurował dane udostępniane Tobie w przypadku udostępniania danych w usłudze Databricks-to-Databricks , czy udostępniania otwartego.

W modelu databricks-to-Databricks musisz być użytkownikiem w obszarze roboczym usługi Databricks, który jest włączony dla wykazu aparatu Unity. Członek zespołu udostępnia dostawcy danych unikatowy identyfikator magazynu metadanych wykazu aparatu Unity, a dostawca danych używa go do utworzenia bezpiecznego połączenia udostępniania. Udostępnione dane staną się dostępne do uzyskania dostępu w obszarze roboczym. W razie potrzeby członek zespołu konfiguruje szczegółową kontrolę dostępu do tych danych.

W modelu otwierania udostępniania możesz użyć dowolnego narzędzia, które chcesz (w tym usługi Databricks), aby uzyskać dostęp do udostępnionych danych. Dostawca danych wysyła adres URL aktywacji za pośrednictwem bezpiecznego kanału. Postępuj zgodnie z nim, aby pobrać plik poświadczeń, który umożliwia dostęp do danych udostępnionych Tobie.

Warunki użytkowania

Udostępnione dane nie są udostępniane bezpośrednio przez usługę Databricks, ale przez dostawców danych działających w usłudze Azure Databricks.

Uwaga

Uzyskanie dostępu do udostępnionych danych dostawcy danych jako adresata danych oznacza, że odbiorca danych jest autoryzowany do uzyskiwania dostępu do udziałów danych dostarczonych przez dostawcę danych i potwierdza, że (1) usługa Databricks nie ponosi odpowiedzialności za takie dane lub adresata danych, a (2) usługa Databricks może zbierać informacje o wykorzystaniu danych udostępnionych i dostępie do udostępnionych danych (w tym identyfikacji każdej osoby lub firmy, która uzyskuje dostęp do tych danych dane korzystające z pliku poświadczeń w połączeniu z takimi informacjami) i mogą udostępniać je odpowiedniego dostawcy danych.

Uzyskiwanie dostępu do udostępnionych ci danych

Sposób uzyskiwania dostępu do danych zależy od tego, czy dostawca danych udostępnił Ci dane przy użyciu protokołu open sharing, czy protokołu udostępniania usługi Databricks-to-Databricks. Zobacz Udostępnianie i otwieranie udostępniania usługi Databricks w usłudze Databricks.

Uzyskiwanie dostępu w modelu databricks-to-Databricks

W modelu databricks-to-Databricks:

  1. Dostawca danych wysyła instrukcje dotyczące znajdowania unikatowego identyfikatora magazynu metadanych wykazu aparatu Unity skojarzonego z obszarem roboczym usługi Databricks i wysyła je do nich.

    Identyfikator udostępniania to ciąg składający się z chmury, regionu i identyfikatora UUID magazynu metadanych (unikatowy identyfikator magazynu metadanych) w formacie <cloud>:<region>:<uuid>. Na przykład aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Aby uzyskać identyfikator udostępniania przy użyciu Eksploratora wykazu:

    1. W obszarze roboczym usługi Azure Databricks kliknij pozycję Ikona wykazuWykaz.
    2. W okienku po lewej stronie rozwiń menu Udostępnianie różnicowe i wybierz pozycję Udostępnione mi.
    3. Nad kartą Dostawcy kliknij ikonę kopiowania identyfikatora udostępniania.

    Aby uzyskać identyfikator udostępniania przy użyciu notesu lub zapytania SQL usługi Databricks, użyj domyślnej funkcji CURRENT_METASTORESQL . Jeśli używasz notesu, musi on działać w klastrze udostępnionym lub pojedynczym użytkownikiem w obszarze roboczym, którego będziesz używać do uzyskiwania dostępu do udostępnionych danych.

    SELECT CURRENT_METASTORE();
    
  2. Dostawca danych tworzy:

    • Adresat na swoim koncie usługi Databricks reprezentujący Ciebie i użytkowników w organizacji, którzy będą uzyskiwać dostęp do danych.
    • Udział, który jest reprezentacją tabel, woluminów i widoków, które mają zostać Ci udostępnione.
  3. Uzyskujesz dostęp do danych udostępnionych Tobie. Ty lub ktoś w Twoim zespole może w razie potrzeby skonfigurować szczegółowy dostęp do danych dla użytkowników. Zobacz Odczyt danych udostępnionych przy użyciu funkcji udostępniania różnicowego usługi Databricks do usługi Databricks (dla adresatów).

Uzyskiwanie dostępu w modelu otwierania udostępniania

W modelu otwierania udostępniania:

  1. Dostawca danych tworzy:

    • Adresat na swoim koncie usługi Databricks reprezentujący Ciebie i użytkowników w organizacji, którzy będą uzyskiwać dostęp do danych. Token i plik poświadczeń są generowane w ramach tej konfiguracji.
    • Udział, który jest reprezentacją tabel i partycji, które mają zostać Ci udostępnione.
  2. Dostawca danych wysyła adres URL aktywacji za pośrednictwem bezpiecznego kanału. Postępuj zgodnie z nim, aby pobrać plik poświadczeń, który umożliwia dostęp do danych udostępnionych Tobie.

    Ważne

    Nie udostępniaj nikomu linku aktywacji. Możesz pobrać plik poświadczeń tylko raz. Jeśli ponownie odwiedzisz link aktywacji po pobraniu pliku poświadczeń, przycisk Pobierz plik poświadczeń zostanie wyłączony.

    Jeśli utracisz link aktywacji przed jego użyciem, skontaktuj się z dostawcą danych.

  3. Zapisz plik poświadczeń w bezpiecznej lokalizacji.

    Nie udostępniaj pliku poświadczeń nikomu spoza grupy użytkowników, którzy powinni mieć dostęp do udostępnionych danych. Jeśli musisz udostępnić go komuś w organizacji, usługa Databricks zaleca korzystanie z menedżera haseł.

Odczytywanie udostępnionych danych

Sposób odczytywania danych, które zostały ci bezpiecznie udostępnione przy użyciu funkcji udostępniania różnicowego, zależy od tego, czy otrzymano plik poświadczeń (model otwierania udostępniania), czy używasz obszaru roboczego usługi Databricks i podano dostawcę danych z identyfikatorem udostępniania (model usługi Databricks-to-Databricks).

Odczytywanie udostępnionych danych przy użyciu pliku poświadczeń (otwieranie udostępniania)

Jeśli dane zostały Ci udostępnione przy użyciu protokołu udostępniania otwartego udostępniania różnicowego, użyj pobranego pliku poświadczeń, aby uwierzytelnić się na koncie usługi Databricks dostawcy danych i odczytać udostępnione dane. Dostęp utrzymuje się tak długo, jak token źródłowy jest prawidłowy, a dostawca nadal udostępnia dane. Dostawcy zarządzają wygasaniem i rotacją tokenów. Aktualizacje danych są dostępne niemal w czasie rzeczywistym. Możesz odczytywać i tworzyć kopie udostępnionych danych, ale nie można modyfikować danych źródłowych.

Aby dowiedzieć się, jak uzyskiwać dostęp do udostępnionych danych i odczytywać je przy użyciu pliku poświadczeń w usłudze Azure Databricks, Apache Spark, pandas i Power BI, zobacz Odczyt danych udostępnionych przy użyciu udostępniania funkcji udostępniania różnicowego (dla adresatów).

Odczytywanie udostępnionych danych przy użyciu udostępniania usługi Databricks do usługi Databricks

Jeśli dane zostały Ci udostępnione przy użyciu modelu databricks-to-Databricks, żaden plik poświadczeń nie jest wymagany do uzyskania dostępu do udostępnionych danych. Usługa Databricks dba o bezpieczne połączenie, a udostępnione dane są automatycznie wykrywalne w obszarze roboczym usługi Databricks.

Aby dowiedzieć się, jak wyszukiwać, odczytywać i zarządzać tymi udostępnionymi danymi w obszarze roboczym usługi Databricks, zobacz Odczyt danych udostępnionych przy użyciu funkcji udostępniania różnicowego usługi Databricks do usługi Databricks (dla adresatów).

Inspekcja użycia udostępnionych danych

Jeśli masz dostęp do obszaru roboczego usługi Azure Databricks, możesz użyć dzienników inspekcji usługi Azure Databricks, aby dowiedzieć się, kto w organizacji uzyskuje dostęp do danych przy użyciu funkcji udostępniania różnicowego. Zobacz Inspekcja i monitorowanie udostępniania danych.

Następne kroki