Udostępnij za pośrednictwem


Łączenie plików CSV

W dodatku Power Query można połączyć wiele plików z danego źródła danych. W tym artykule opisano sposób działania środowiska, gdy pliki, które chcesz połączyć, to pliki CSV. Więcej informacji: Łączenie plików — omówienie

Napiwek

Możesz skorzystać z tego przykładu, pobierając przykładowe pliki używane w tym artykule z tego linku pobierania. Możesz umieścić te pliki w wybranym źródle danych, takim jak folder lokalny, folder programu SharePoint, usługa Azure Blob Storage, usługa Azure Data Lake Storage lub inne źródło danych, które udostępnia widok systemu plików.

Dla uproszczenia w tym artykule użyto łącznika Folder. Więcej informacji: Folder

Informacje o używanych przykładowych plikach

Aby połączyć pliki, konieczne jest, aby wszystkie miały tę samą strukturę i to samo rozszerzenie. Wszystkie pliki używane w tym przykładzie mają taką samą strukturę i rozszerzenie (.csv).

Istnieje 12 plików CSV, po jednym dla każdego miesiąca roku kalendarzowego 2019. Na poniższej ilustracji przedstawiono pierwsze 15 wierszy pliku w styczniu.

Przykładowy plik CSV ze stycznia 2019 r. przedstawiający sekcję nagłówka i resztę danych rozdzielonych przecinkami.

Liczba wierszy różni się od pliku do pliku, ale wszystkie pliki mają sekcję nagłówka w pierwszych czterech wierszach. Mają nagłówki kolumn w piątym wierszu, a dane dla tabeli zaczynają się w szóstym wierszu i są kontynuowane przez wszystkie kolejne wiersze.

Celem jest połączenie wszystkich 12 plików w jedną tabelę. Ta połączona tabela zawiera wiersz nagłówka w górnej części tabeli i zawiera nazwę źródłową, datę, kraj, jednostki i dane przychodu dla całego roku w osobnych kolumnach po wierszu nagłówka.

Przykładowa końcowa połączona tabela.

Podgląd tabeli

Podczas nawiązywania połączenia z folderem, który hostuje pliki, które chcesz połączyć — w tym przykładzie nazwa tego folderu to Pliki CSV — jest wyświetlane okno dialogowe podglądu tabeli, które wyświetla ścieżkę folderu w lewym górnym rogu. Podgląd danych przedstawia widok systemu plików.

Podgląd tabeli dla widoku systemu plików.

W tym przykładzie wybierz pozycję Połącz.

Uwaga

W innej sytuacji możesz wybrać pozycję Przekształć dane , aby dodatkowo filtrować i przekształcać dane przed połączeniem plików. Wybranie opcji Połącz jest zalecane tylko wtedy, gdy masz pewność, że folder zawiera tylko pliki, które chcesz połączyć.

Okno dialogowe Łączenie plików

Po wybraniu pozycji Połącz w podglądzie tabeli zostanie wyświetlone okno dialogowe Łączenie plików .

Okno dialogowe Łączenie plików.

Uwaga

Dodatek Power Query automatycznie wykrywa łącznik, który ma być używany na podstawie pierwszego pliku znalezionego na liście. Aby dowiedzieć się więcej na temat łącznika CSV, przejdź do pozycji Tekst/CSV.

W tym przykładzie pozostaw wszystkie ustawienia domyślne (przykładowy plik ma wartość Pierwszy plik i wartości domyślne wykrywania źródła pliku, ogranicznika i typu danych).

Teraz wybierz pozycję Przekształć dane w prawym dolnym rogu, aby przejść do zapytania wyjściowego.

Zapytanie wyjściowe

Po wybraniu pozycji Przekształć dane w oknie dialogowym Łączenie plików nastąpi powrót do Edytor Power Query w zapytaniu, które zostało początkowo utworzone z połączenia z folderem lokalnym. Zapytanie wyjściowe zawiera teraz nazwę pliku źródłowego w lewej kolumnie wraz z danymi z każdego z plików źródłowych w pozostałych kolumnach.

Zapytanie wyjściowe dla połączonych plików bez dodatkowych przekształceń.

Jednak dane nie mają poprawnego kształtu. Przed połączeniem należy usunąć cztery pierwsze wiersze z każdego pliku. Aby wprowadzić tę zmianę w każdym pliku przed ich połączeniem, wybierz zapytanie Przekształć przykładowy plik w okienku Zapytania po lewej stronie ekranu.

Modyfikowanie zapytania przekształcania przykładowego pliku

W tym zapytaniu przekształć przykładowy plik wartości w kolumnie Date (Data ) wskazują, że dane dotyczą miesiąca kwietnia, który ma format RRRR-MM-DD w ciągu roku(RRRR-MM-DD). Kwiecień 2019.csv jest pierwszym plikiem wyświetlanym w podglądzie tabeli.

Tabela przedstawiająca kolumny danych z kwietnia 2019 r., w tym sekcję nagłówka w pierwszych czterech wierszach i nagłówki w piątym wierszu.

Teraz należy zastosować nowy zestaw przekształceń, aby wyczyścić dane. Każde przekształcenie zostanie automatycznie przekonwertowane na funkcję wewnątrz grupy zapytań pomocnika, która zostanie zastosowana do każdego pliku w folderze przed połączeniem danych z każdego pliku.

Przekształcenia, które należy dodać do zapytania Przekształć przykładowy plik , to:

  1. Usuń pierwsze wiersze: Aby wykonać tę operację, wybierz menu ikony tabeli w lewym górnym rogu tabeli, a następnie wybierz pozycję Usuń górne wiersze.

    Usuń pierwsze wiersze w menu tabeli.

    W oknie dialogowym Usuwanie pierwszych wierszy wprowadź wartość 4, a następnie wybierz przycisk OK.

    Okno dialogowe Usuwanie pierwszych wierszy.

    Po wybraniu przycisku OK tabela nie będzie już zawierać czterech pierwszych wierszy.

    Przykładowe zapytanie z usuniętymi wierszami.

  2. Użyj pierwszego wiersza jako nagłówków: ponownie wybierz ikonę tabeli, a następnie wybierz pozycję Użyj pierwszego wiersza jako nagłówków.

    Użyj pierwszego wiersza jako ikony nagłówków.

    Wynik tej operacji spowoduje podwyższenie poziomu pierwszego wiersza tabeli do nowych nagłówków kolumn.

    Przykładowa tabela promowała nagłówki.

Po zakończeniu tej operacji dodatek Power Query domyślnie spróbuje automatycznie wykryć typy danych kolumn i dodać nowy krok Zmieniono typ kolumny.

Zmiana zapytania wyjściowego

Po powrocie do zapytania Pliki CSV zauważysz, że ostatni krok daje błąd z informacją o błędzie "Nie znaleziono kolumny "Kolumna "Kolumna1" tabeli. Przyczyną tego błędu jest to, że poprzedni stan zapytania wykonywał operację względem kolumny o nazwie Column1. Jednak ze względu na zmiany wprowadzone w zapytaniu przekształć przykładowy plik nie istnieje już w tej kolumnie. Więcej informacji: Obsługa błędów w dodatku Power Query

Zapytanie wyjściowe z błędem na poziomie kroku.

Ten ostatni krok zapytania można usunąć z okienka Zastosowane kroki , wybierając ikonę usuwania X po lewej stronie nazwy kroku. Po usunięciu tego kroku zapytanie wyświetli poprawne wyniki.

Łączenie plików bez kroku błędu.

Należy jednak zauważyć, że żadna z kolumn pochodzących z plików (Data, Kraj, Jednostki, Przychód) mają przypisany określony typ danych. Przypisz prawidłowy typ danych do każdej kolumny przy użyciu poniższej tabeli.

Nazwa kolumny Typ danych
Data Data
Kraj Text
Lekcji Liczba całkowita
Przychód Waluta

Po zdefiniowaniu typów danych dla każdej kolumny będzie można załadować tabelę.

Przykładowa końcowa połączona tabela.

Uwaga

Aby dowiedzieć się, jak definiować lub zmieniać typy danych kolumn, przejdź do pozycji Typy danych.

Weryfikacja

Aby sprawdzić, czy wszystkie pliki zostały połączone, możesz wybrać ikonę filtru w nagłówku kolumny Source.Name , w którym będą wyświetlane wszystkie nazwy połączonych plików. Jeśli zostanie wyświetlone ostrzeżenie "Lista może być niekompletna", wybierz pozycję Załaduj więcej w dolnej części menu, aby wyświetlić więcej dostępnych wartości w kolumnie.

Niekompletna lista połączonych plików.

Po wybraniu pozycji Załaduj więcej będą wyświetlane wszystkie dostępne nazwy plików.

Pełna lista połączonych plików.