Pozyskiwanie danych do Lakeflow Designer

Ważna

Ta funkcja jest dostępna w publicznej wersji testowej.

Na tej stronie opisano dostępne opcje wprowadzenia danych do narzędzia do wizualnego przygotowywania danych w programie Lakeflow Designer. Projektant może pracować z dowolnymi danymi dostępnymi za pośrednictwem Azure Databricks.

Wszystkie pozyskiwanie danych w Projektancie rozpoczyna się od operatora Source . Po otwarciu okienka konfiguracji operatora źródłowego dostępne są następujące opcje.

Przeglądaj istniejące tabele

Kliknij Przeglądaj istniejące , aby otworzyć selektor zasobów, gdzie możesz:

  • Przeglądaj tabele i wolumeny w Unity Catalog.
  • Przeglądaj pliki w systemie plików obszaru roboczego.

Użyj tej opcji, gdy dane są już w Azure Databricks.

Przeciąganie i upuszczanie pliku lokalnego

Przeciągnij plik CSV lub Excel z komputera lokalnego bezpośrednio na kanwę. Projektant przekazuje plik do systemu plików obszaru roboczego i automatycznie tworzy operator źródła.

Uwaga / Notatka

Przeciąganie i upuszczanie plików Excel wymaga włączenia obsługi formatu plików Excel. Zobacz Odczytywanie plików programu Excel.

Tworzenie tabeli na podstawie pliku

Wybierz pozycję Utwórz tabelę z pliku w okienku Konfiguracja źródła, aby przekazać lokalny plik CSV lub plik Excel i utworzyć z niego tabelę Unity Catalog. Użyj tej opcji, jeśli chcesz, aby dane zostały utrwalone jako zarządzana tabela, a nie przechowywane jako plik obszaru roboczego. Ponadto w przypadku dużych ilości danych zapewnia to najlepszą wydajność.

Importowanie z dysku Google

Aby zaimportować plik z dysku Google:

  1. W okienku Konfiguracja źródła wybierz pozycję Importuj z dysku Google.
  2. Wybierz połączenie Unity Catalog, które ma dostęp do Google Drive.
  3. Podaj adres URL pliku.

Wymaga to połączenia z Unity Catalog skonfigurowanego do uzyskania dostępu do Dysku Google. Zobacz Pozyskiwanie plików z dysku Google , aby dowiedzieć się, jak skonfigurować połączenia.

Importuj z SharePoint

Aby zaimportować plik z SharePoint:

  1. W okienku Konfiguracja źródła wybierz pozycję Importuj z SharePoint.
  2. Wybierz połączenie Unity Catalog, które ma dostęp do Twojej witryny SharePoint.
  3. Podaj bezpośredni link do pliku.

Warning

Aby uzyskać prawidłowy adres URL, kliknij prawym przyciskiem myszy plik w SharePoint, wybierz pozycję Preview i skopiuj adres URL z paska adresu przeglądarki. Nie używaj linku udostępniania.

Wymaga to skonfigurowania połączenia do Unity Catalog w celu uzyskania dostępu do SharePoint. Zobacz Pobieranie plików z SharePoint, aby dowiedzieć się, jak skonfigurować połączenia.

Używanie programu Lakeflow Connect dla dodatkowych źródeł

Jeśli źródło danych nie jest dostępne bezpośrednio w Projektancie, sprawdź Lakeflow Connect aby znaleźć łącznik zarządzany. Program Lakeflow Connect obsługuje pozyskiwanie danych z aplikacji SaaS (Salesforce, Workday, HubSpot i nie tylko), baz danych, magazynu w chmurze i źródeł przesyłania strumieniowego. Po pozyskiwaniu danych za pomocą Lakeflow Connect w tabeli katalogu Unity, można je użyć jako źródła w Designer.

Następne kroki