Udostępnij za pośrednictwem


Najlepsze rozwiązania dotyczące ponownego korzystania z przepływów danych w środowiskach i obszarach roboczych

W tym artykule omówiono kolekcję najlepszych rozwiązań dotyczących efektywnego i wydajnego ponownego korzystania z przepływów danych. Przeczytaj ten artykuł, aby uniknąć błędów projektowych i potencjalnych problemów z wydajnością podczas opracowywania przepływów danych do ponownego użycia.

Oddzielanie przepływów danych przekształcania danych od przepływów danych przemieszczania/wyodrębniania

Jeśli przepływ danych wykonuje wszystkie akcje, trudno jest ponownie użyć swoich tabel w innych przepływach danych lub w innych celach. Najlepsze przepływy danych do ponownego użycia to te przepływy danych, które wykonują tylko kilka akcji. Tworzenie przepływów danych, które specjalizują się w jednym konkretnym zadaniu, jest jednym z najlepszych sposobów ich ponownego użycia. Jeśli masz zestaw przepływów danych, których używasz jako przejściowych przepływów danych, ich jedyną akcją jest wyodrębnienie danych zgodnie z rzeczywistym użyciem z systemu źródłowego. Te przepływy danych można używać ponownie w wielu innych przepływach danych.

Jeśli masz przepływy danych przekształcania danych, możesz podzielić je na przepływy danych, które wykonują typowe przekształcenia. Każdy przepływ danych może wykonać tylko kilka akcji. Te kilka akcji na przepływ danych zapewnia, że dane wyjściowe tego przepływu danych będą wielokrotnego użytku przez inne przepływy danych.

Dataflow doing only a few actions.

Obraz z danymi wyodrębnianymi ze źródła danych do przejściowych przepływów danych, w których tabele są przechowywane w usłudze Dataverse lub Azure Data Lake Storage. Następnie dane są przenoszone do przepływów danych przekształcania, w których dane są przekształcane i konwertowane na strukturę magazynu danych. Na koniec dane są ładowane do modelu semantycznego usługi Power BI.

Korzystanie z wielu obszarów roboczych

Każdy obszar roboczy (lub środowisko) jest dostępny tylko dla członków tego obszaru roboczego. Jeśli tworzysz wszystkie przepływy danych w jednym obszarze roboczym, minimalizujesz ponowne użycie przepływów danych. Możesz mieć pewne ogólne obszary robocze dla przepływów danych, które przetwarzają tabele dla całej firmy. Możesz również mieć obszar roboczy przepływów danych do przetwarzania tabel w wielu działach. Ponadto możesz mieć niektóre obszary robocze dla przepływów danych, które mają być używane tylko w określonych działach.

Image showing the separate workspaces.

Ustawianie prawidłowych poziomów dostępu w obszarach roboczych

Aby udzielić dostępu do przepływów danych w innych obszarach roboczych w celu korzystania z danych wyjściowych przepływu danych w obszarze roboczym, wystarczy przyznać im dostęp Wyświetl w obszarze roboczym. Aby dowiedzieć się więcej o innych rolach w obszarze roboczym usługi Power BI, przejdź do pozycji Role w nowych obszarach roboczych.

Screenshot showing how to access to the Power BI workspace.

Poręczenie przepływu danych w usłudze Power BI

Istnieje wiele przepływów danych utworzonych w organizacji dzierżawy i trudno jest użytkownikom wiedzieć, który przepływ danych jest najbardziej niezawodny. Autorzy przepływu danych lub ci użytkownicy, którzy mają do niego dostęp do edycji, mogą wspierać przepływ danych na trzech poziomach: bez poparcia, podwyższenia poziomu lub certyfikatu.

Te poziomy poręczenia pomagają użytkownikom łatwiej i szybciej znaleźć niezawodne przepływy danych. Przepływ danych z wyższym poziomem poręczenia jest wyświetlany jako pierwszy. Administrator usługi Power BI może delegować możliwość zatwierdzania przepływów danych na poziomie certyfikowanym dla innych osób. Więcej informacji: Popularyzacja — promowanie i certyfikowanie zawartości usługi Power BI

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Oddzielne tabele w wielu przepływach danych

W jednym przepływie danych można mieć wiele tabel. Jedną z przyczyn dzielenia tabel w wielu przepływach danych jest to, co przedstawiono wcześniej w tym artykule na temat oddzielania przepływów danych pozyskiwania danych i przekształcania danych. Innym dobrym powodem, dla którego tabele mają być w wielu przepływach danych, jest to, że chcesz użyć innego harmonogramu odświeżania niż inne tabele.

W przykładzie pokazanym na poniższej ilustracji tabela sprzedaży musi być odświeżona co cztery godziny. Tabela dat musi być odświeżona tylko raz dziennie, aby aktualizować bieżący rekord daty. Tabela mapowania produktów musi być odświeżona raz w tygodniu. Jeśli masz wszystkie te tabele w jednym przepływie danych, masz tylko jedną opcję odświeżania dla nich wszystkich. Jeśli jednak podzielisz te tabele na wiele przepływów danych, możesz zaplanować odświeżanie każdego przepływu danych oddzielnie.

Image showing dataflows with different schedules for the refresh.

Dobrzy kandydaci do tabel przepływu danych

Podczas opracowywania rozwiązań przy użyciu dodatku Power Query w narzędziach klasycznych możesz zadać sobie pytanie; które z tych tabel są dobrymi kandydatami do przeniesienia do przepływu danych? Najlepsze tabele, które mają zostać przeniesione do przepływu danych, to tabele, które muszą być używane w więcej niż jednym rozwiązaniu lub więcej niż jednym środowisku lub usłudze. Na przykład tabela Date (Data) pokazana na poniższej ilustracji musi być używana w dwóch oddzielnych plikach usługi Power BI. Zamiast duplikować tę tabelę w każdym pliku, możesz skompilować tabelę w przepływie danych jako tabelę i użyć jej ponownie w tych plikach usługi Power BI.

Image showing a shared table used in a dataflow.