Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Z tego artykułu dowiesz się, jak pobierać dane z usługi Azure Storage (kontener usługi ADLS Gen2, kontener obiektów blob lub pojedyncze obiekty blob). Dane można wprowadzać do swojej tabeli w sposób ciągły lub jako jednorazowe pozyskiwanie. Po pozyskaniu dane staną się dostępne dla zapytań.
Ciągłe pozyskiwanie (wersja zapoznawcza): ciągłe pozyskiwanie obejmuje skonfigurowanie potoku pozyskiwania, który umożliwia usłudze Eventhouse nasłuchiwanie zdarzeń usługi Azure Storage. Kanał przetwarzania powiadamia magazyn zdarzeń o ściągnięciu informacji podczas wystąpienia subskrybowanych zdarzeń. Zdarzenia to BlobCreated i BlobRenamed.
Ważne
Ta funkcja jest dostępna w wersji zapoznawczej.
Uwaga
Strumień ciągłego pozyskiwania może mieć wpływ na rozliczenia. Aby uzyskać więcej informacji, zobacz Eventhouse i użycie bazy danych KQL.
Jednorazowe pozyskiwanie: użyj tej metody, aby pobrać dane z usługi Azure Storage jako jednorazową operację.
Warunki wstępne
- Obszar roboczy z pojemnością obsługiwaną przez Microsoft Fabric.
- Baza danych KQL z uprawnieniami do edycji.
- Konto magazynu.
W przypadku ciągłego pozyskiwania wymagane jest również:
Tożsamość obszaru roboczego. Mój obszar roboczy nie jest obsługiwany. W razie potrzeby utwórz nowy obszar roboczy.
Włącz hierarchiczną przestrzeń nazw na koncie przechowywania.
Uprawnienia roli Czytelnik danych obiektu blob usługi Storage przypisane do tożsamości obszaru roboczego.
Kontener do przechowywania plików danych.
Plik danych przekazany do kontenera. Struktura pliku danych służy do definiowania schematu tabeli. Aby uzyskać więcej informacji, zobacz Formaty danych obsługiwane przez Real-Time Intelligence.
Uwaga
Musisz przekazać plik danych:
- Przed konfiguracją w celu zdefiniowania schematu tabeli podczas konfigurowania.
- Po zakończeniu konfiguracji w celu rozpoczęcia ciągłego pozyskiwania danych można przejrzeć dane oraz zweryfikować połączenie.
Dodawanie przypisania roli tożsamości obszaru roboczego do konta magazynu
W ustawieniach obszaru roboczego w Fabric, skopiuj identyfikator tożsamości obszaru roboczego.
W witrynie Azure Portal przejdź do konta usługi Azure Storage i wybierz pozycję Kontrola dostępu (IAM)>Dodaj>przypisanie roli.
Wybierz Czytelnik danych Storage Blob.
W oknie dialogowym Dodawanie przypisania roli wybierz pozycję + Wybierz członków.
Wklej identyfikator tożsamości obszaru roboczego, wybierz aplikację, a następnie Wybierz>Przejrzyj i przypisz.
Tworzenie kontenera z plikiem danych
Na koncie magazynu wybierz pozycję Kontenery.
Wybierz pozycję + Kontener, wprowadź nazwę kontenera i wybierz pozycję Zapisz.
Wprowadź kontener, wybierz pozycję Przekaż i przekaż przygotowany wcześniej plik danych.
Aby uzyskać więcej informacji, zobacz obsługiwane formaty i obsługiwane kompresje.
Z menu kontekstowego [...] wybierz pozycję Właściwości kontenera i skopiuj adres URL do danych wejściowych podczas konfiguracji.
Źródło
Ustaw źródło, aby pobrać dane.
W obszarze roboczym otwórz usługę EventHouse i wybierz bazę danych.
Na wstążce bazy danych KQL wybierz pozycję Pobierz dane.
Wybierz źródło danych z listy dostępnych. W tym przykładzie pobierane są dane z usługi Azure storage.
Konfiguruj
Wybierz tabelę docelową. Jeśli chcesz pozyskać dane do nowej tabeli, wybierz pozycję + Nowa tabela i wprowadź nazwę tabeli.
Uwaga
Nazwy tabel mogą zawierać maksymalnie 1024 znaki, w tym spacje, alfanumeryczne, łączniki i podkreślenia. Znaki specjalne nie są obsługiwane.
W obszarze Konfigurowanie połączenia usługi Azure Blob Storage upewnij się, że opcja Ciągłe pozyskiwanie jest włączona. Jest ona domyślnie włączona.
Skonfiguruj połączenie, tworząc nowe połączenie lub używając istniejącego połączenia.
Aby utworzyć nowe połączenie:
Wybierz Połącz z kontem magazynowym.
Poniższe opisy ułatwiają wypełnianie pól.
ustawienie Opis pola Subskrypcja Subskrypcja konta magazynowego. Konto przechowywania Blob Nazwa konta magazynu. Pojemnik Pojemnik do przechowywania zawierający plik, który chcesz załadować. W polu Połączenie otwórz listę rozwijaną i wybierz pozycję + Nowe połączenie, a następnie pozycję Zapisz>zamknij. Ustawienia połączenia są już wypełnione.
Uwaga
Utworzenie nowego połączenia powoduje wyświetlenie nowego strumienia zdarzeń. Nazwa jest zdefiniowana jako <storate_account_name>_eventstream. Upewnij się, że nie usuwasz ciągłego strumienia pozyskiwania zdarzeń z arey roboczej.
Aby użyć istniejącego połączenia:
Wybierz istniejące konto magazynu.
Poniższe opisy ułatwiają wypełnianie pól.
ustawienie Opis pola RTAStorageAccount Strumień zdarzeń połączony z kontem magazynowym z Fabric. Pojemnik Pojemnik do przechowywania zawierający plik, który chcesz załadować. Połączenie Jest to wstępnie wypełnione parametrami połączenia W polu Połączenie otwórz listę rozwijaną i wybierz z listy istniejące parametry połączenia. Następnie wybierz pozycję Zapisz>zamknij.
Opcjonalnie rozwiń Filtry plików i określ następujące filtry:
ustawienie Opis pola Ścieżka folderu Filtruje dane w celu pobierania plików z określoną ścieżką folderu. Rozszerzenie pliku Filtruje dane, aby wczytywać pliki tylko o określonym rozszerzeniu. W sekcji Ustawienia Eventstearm można wybrać zdarzenia do monitorowania w zaawansowanych ustawieniach>Typ(y) zdarzeń. Domyślnie wybrana jest opcja Blob created. Możesz również wybrać zmieniona nazwa Blob.
Wybierz przycisk Dalej , aby wyświetlić podgląd danych.
Inspekcjonować
Karta „Inspekcja” zostanie otwarta z podglądem danych.
Aby ukończyć proces pobierania danych, wybierz Zakończ.
Uwaga
Aby wywołać ciągłe pozyskiwanie i wyświetlanie podglądu danych, upewnij się, że po konfiguracji przekazano nowy obiekt blob magazynu.
Opcjonalnie:
Użyj listy rozwijanej pliku definicji schematu, aby zmienić plik, z którego jest wywnioskowany schemat.
Użyj listy rozwijanej Typ pliku, aby zapoznać się z opcjami zaawansowanymi na podstawie typu danych.
Użyj listy rozwijanej Table_mapping , aby zdefiniować nowe mapowanie.
Wybierz </> , aby otworzyć przeglądarkę poleceń, aby wyświetlić i skopiować automatyczne polecenia wygenerowane na podstawie danych wejściowych. Możesz również otworzyć polecenia w zestawie zapytań
Wybierz ikonę ołówka, aby edytować kolumny.
Edytowanie kolumn
Uwaga
- W przypadku formatów tabelarycznych (CSV, TSV, PSV) nie można dwukrotnie mapować kolumny. Aby zamapować na istniejącą kolumnę, najpierw usuń nową kolumnę.
- Nie można zmienić istniejącego typu kolumny. Jeśli spróbujesz mapować kolumnę na inny format, może się okazać, że kolumny będą puste.
Zmiany, które można wprowadzić w tabeli, zależą od następujących parametrów:
- typ tabeli jest nowy lub istniejący
- typ mapowania jest nowy lub istniejący
Typ tabeli | Typ mapowania | Dostępne korekty |
---|---|---|
Nowa tabela | Nowe mapowanie | Zmień nazwę kolumny, zmień typ danych, zmień źródło danych, transformacja mapowania, dodaj kolumnę, usuń kolumnę |
Istniejąca tabela | Nowe mapowanie | Dodaj kolumnę (na której można następnie zmienić typ danych, zmienić nazwę i zaktualizować) |
Istniejąca tabela | Istniejące mapowanie | żadne |
Transformacje mapowania
Niektóre mapowania formatów danych (Parquet, JSON i Avro) obsługują proste przekształcenia czasu wprowadzania. Aby zastosować przekształcenia mapowania, utwórz lub zaktualizuj kolumnę w oknie Edytuj kolumny.
Przekształcenia mapowania można przeprowadzać na kolumnach typu string lub datetime, gdzie źródło ma typ danych int lub long. Aby uzyskać więcej informacji, zobacz pełną listę obsługiwanych transformacji mapowania.
Opcje zaawansowane oparte na typie danych
formaty tabelaryczne (CSV, TSV, PSV):
Jeśli importujesz formaty tabelaryczne do istniejącej tabeli, możesz wybrać Zaawansowane>Zachowaj schemat tabeli. Dane tabelaryczne nie muszą zawierać nazw kolumn używanych do mapowania danych źródłowych na istniejące kolumny. Po zaznaczeniu tej opcji mapowanie odbywa się według kolejności, a schemat tabeli pozostaje taki sam. Jeśli ta opcja nie jest zaznaczona, nowe kolumny są tworzone dla danych przychodzących, niezależnie od struktury danych.
Dane tabelaryczne nie muszą zawierać nazw kolumn używanych do mapowania danych źródłowych na istniejące kolumny. Aby użyć pierwszego wiersza jako nazw kolumn, wybierz Pierwszy wiersz to nagłówek kolumny.
Zrzut ekranu przedstawiający przełącznik nagłówka kolumn znajdujący się w pierwszym wierszu.
formaty tabelaryczne (CSV, TSV, PSV):
Jeśli importujesz formaty tabelaryczne w istniejącej tabeli, możesz wybrać Table_mapping>Użyj istniejącego schematu. Dane tabelaryczne nie muszą zawierać nazw kolumn używanych do mapowania danych źródłowych na istniejące kolumny. Po zaznaczeniu tej opcji mapowanie odbywa się według kolejności, a schemat tabeli pozostaje taki sam. Jeśli ta opcja nie jest zaznaczona, nowe kolumny są tworzone dla danych przychodzących, niezależnie od struktury danych.
Aby użyć pierwszego wiersza jako nazw kolumn, wybierz pozycję Nagłówek pierwszego wiersza.
JSON:
Aby określić podział kolumn danych JSON, wybierz Poziomy zagnieżdżenia, które mogą być w zakresie od 1 do 100.
Streszczenie
W oknie Podsumowanie wszystkie kroki są oznaczone zielonymi znacznikami wyboru po pomyślnym zakończeniu pozyskiwania danych. Możesz wybrać kartę, aby eksplorować dane, usunąć pozyskane dane lub utworzyć pulpit nawigacyjny z kluczowymi metrykami.
Po zamknięciu okna możesz zobaczyć połączenie na karcie Eksplorator w obszarze Strumienie danych. W tym miejscu można filtrować strumienie danych i usuwać strumień danych.
Powiązana zawartość
- Aby zarządzać bazą danych, zobacz Zarządzanie danymi
- Aby tworzyć, przechowywać i eksportować zapytania, zobacz Dane zapytań w zestawie zapytań KQL