Pobieranie danych z pliku

Artykuł
01/16/2024

Pozyskiwanie danych to proces służący do ładowania danych z co najmniej jednego źródła do tabeli w usłudze Azure Data Explorer. Po pozyskiwaniu dane staną się dostępne dla zapytań. W tym artykule dowiesz się, jak pobrać dane z pliku lokalnego do nowej lub istniejącej tabeli.

Aby uzyskać ogólne informacje na temat pozyskiwania danych, zobacz Omówienie pozyskiwania danych w usłudze Azure Data Explorer.

Wymagania wstępne

Konto Microsoft lub tożsamość użytkownika Microsoft Entra. Subskrypcja platformy Azure nie jest wymagana.
Zaloguj się do internetowego interfejsu użytkownika usługi Azure Data Explorer.
Baza danych i klaster usługi Azure Data Explorer. Utwórz klaster i bazę danych.

Pobieranie danych

W menu po lewej stronie wybierz pozycję Zapytanie.
Kliknij prawym przyciskiem myszy bazę danych, w której chcesz pozyskać dane. Wybierz pozycję Pobierz dane.

Source

W oknie Pobieranie danych zostanie wybrana karta Źródło .

Wybierz źródło danych z listy dostępnej. W tym przykładzie pozyskiwane są dane z pliku lokalnego.

Uwaga

Maksymalny rozmiar pliku obsługiwany w pozyskiwaniu wynosi 6 GB. Zaleceniem jest pozyskiwanie plików z zakresu od 100 MB do 1 GB.

Konfigurowanie

Wybierz docelową bazę danych i tabelę. Jeśli chcesz pozyskać dane do nowej tabeli, wybierz pozycję + Nowa tabela i wprowadź nazwę tabeli.

Uwaga

Nazwy tabel mogą zawierać maksymalnie 1024 znaki, w tym spacje, alfanumeryczne, łączniki i podkreślenia. Znaki specjalne nie są obsługiwane.
Przeciągnij pliki do okna lub wybierz pozycję Przeglądaj dla plików.

Uwaga

Możesz dodać maksymalnie 1000 plików. Każdy plik może być maksymalnie 1 GB nieskompresowany.
Wybierz pozycję Dalej

Kontrola

Karta Inspekcja zostanie otwarta z podglądem danych.

Aby ukończyć proces pozyskiwania, wybierz pozycję Zakończ.

Opcjonalnie:

Wybierz pozycję Przeglądarka poleceń , aby wyświetlić i skopiować automatyczne polecenia wygenerowane na podstawie danych wejściowych.
Użyj listy rozwijanej Plik definicji schematu , aby zmienić plik, z którego został wywnioskowany schemat.
Zmień automatycznie wnioskowany format danych, wybierając żądany format z listy rozwijanej. Aby uzyskać informacje na temat pozyskiwania, zobacz Formaty danych obsługiwane przez usługę Azure Data Explorer.
Edytuj kolumny.
Zapoznaj się z opcjami zaawansowanymi na podstawie typu danych.

Edytuj kolumny

Uwaga

W przypadku formatów tabelarycznych (CSV, TSV, PSV) nie można mapować kolumny dwa razy. Aby zamapować na istniejącą kolumnę, najpierw usuń nową kolumnę.
Nie można zmienić istniejącego typu kolumny. Jeśli spróbujesz zamapować na kolumnę o innym formacie, możesz utworzyć puste kolumny.

Zmiany, które można wprowadzić w tabeli, zależą od następujących parametrów:

Typ tabeli jest nowy lub istniejący
Typ mapowania jest nowy lub istniejący

Typ tabeli	Typ mapowania	Dostępne korekty
Nowa tabela	Nowe mapowanie	Zmienianie nazwy kolumny, zmienianie typu danych, zmienianie źródła danych, przekształcanie mapowania, dodawanie kolumny, usuwanie kolumny
Istniejąca tabela	Nowe mapowanie	Dodaj kolumnę (na której można zmienić typ danych, zmienić nazwę i zaktualizować)
Istniejąca tabela	Istniejące mapowanie	brak

Przekształcenia mapowania

Niektóre mapowania formatów danych (Parquet, JSON i Avro) obsługują proste przekształcenia czasu pozyskiwania. Aby zastosować przekształcenia mapowania, utwórz lub zaktualizuj kolumnę w oknie Edytowanie kolumn .

Przekształcenia mapowania można wykonać na kolumnie typu ciąg lub data/godzina, przy użyciu źródła o typie danych int lub długim. Obsługiwane przekształcenia mapowania to:

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

Opcje zaawansowane oparte na typie danych

Tabelaryczny (CSV, TSV, PSV):

Jeśli pozyskujesz formaty tabelaryczne w istniejącej tabeli, możesz wybrać pozycję Zaawansowane>Zachowaj bieżący schemat tabeli. Dane tabelaryczne nie muszą zawierać nazw kolumn używanych do mapowania danych źródłowych na istniejące kolumny. Po zaznaczeniu tej opcji mapowanie jest wykonywane według kolejności, a schemat tabeli pozostaje taki sam. Jeśli ta opcja nie jest zaznaczona, nowe kolumny są tworzone dla danych przychodzących, niezależnie od struktury danych.
Aby użyć pierwszego wiersza jako nazw kolumn, wybierz pozycję Zaawansowane>pierwszy wiersz to nagłówek kolumny.

JSON:

Aby określić podział kolumn danych JSON, wybierz pozycję Zaawansowane>poziomy zagnieżdżone z zakresu od 1 do 100.
W przypadku wybrania opcji Zaawansowane>ignoruj błędy formatu danych dane są pozyskiwane w formacie JSON. Jeśli to pole wyboru zostanie niezaznaczone, dane są pozyskiwane w formacie wielossonowym.

Podsumowanie

W oknie Przygotowywanie danych wszystkie trzy kroki są oznaczone zielonymi znacznikami wyboru po pomyślnym zakończeniu pozyskiwania danych. Możesz wyświetlić polecenia, które były używane dla każdego kroku, lub wybrać kartę do wykonywania zapytań, wizualizacji lub upuszczania pozyskanych danych.

Udostępnij za pośrednictwem

Pobieranie danych z pliku

Wymagania wstępne

Pobieranie danych

Source

Konfigurowanie

Kontrola

Edytuj kolumny

Przekształcenia mapowania

Opcje zaawansowane oparte na typie danych

Podsumowanie

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Pobieranie danych z pliku

Wymagania wstępne

Pobieranie danych

Source

Konfigurowanie

Kontrola

Edytuj kolumny

Przekształcenia mapowania

Opcje zaawansowane oparte na typie danych

Podsumowanie

Zawartość pokrewna

Opinia

Dodatkowe zasoby