Używanie rozwiązania Copilot z przepływem danych usługi Microsoft Fabric Gen2

Ukończone

Integracja danych ma kluczowe znaczenie dla usługi Contoso Health w celu skonsolidowania informacji z różnych źródeł. Usługa Dataflow Gen2 w usłudze Microsoft Fabric Data Factory oferuje wizualny interfejs do tworzenia przepływów danych, umożliwiając użytkownikom bezproblemowe pozyskiwanie i przekształcanie danych. Dzięki integracji copilot użytkownicy mogą używać języka naturalnego do definiowania kroków przekształcania danych, dzięki czemu proces ETL jest bardziej intuicyjny.

Wyobraźmy sobie, jak firma Contoso Health łączy dane ustrukturyzowane, takie jak badania zadowolenia pacjentów, w ujednolicony przepływ pracy, umożliwia bogatszą analizę i szczegółowe informacje. Przepływ danych usługi Microsoft Fabric Gen2, ulepszony przez Copilot, usprawnia ten proces, umożliwiając użytkownikom opisywanie przekształceń w języku naturalnym.

Zamiast skupiać się na każdym kliknięciu przycisku, w tej lekcji dowiesz się, jak proces rozwija się koncepcyjnie i dlaczego każdy krok jest ważny w tworzeniu umiejętności w transformacji danych.

Jak to działa

Proces należy traktować jako cykl monitu → danych wyjściowych → weryfikacji → uściślenia. Każdy etap opiera się na ostatnim, a różne typy przekształceń ilustrują ten cykl:

Pozyskiwanie danych jest punktem wyjścia. Bez danych nie ma nic do przekształcenia. Możesz zacząć od wygenerowania przykładowych rekordów w celu eksperymentowania z przekształceniami. Copilot może generować przykładowe tabele bezpośrednio, a jako funkcjonalność wersji Preview, Copilot w kreatorze pobierania danych teraz również obsługuje wczytywanie ostatnio używanych tabel przy użyciu języka naturalnego — można określić filtry i przekształcenia przed załadowaniem danych. Oto przykładowy monit o wygenerowanie przykładowych danych:

Create a new query with 50 patient records including patient-id, age, gender, and satisfaction-score.

Oto przykład tego, co może wygenerować copilot:

Następnie upewnij się, że dane są przechowywane w odpowiednich formatach. Poprawne typy danych uniemożliwiają błędy w obliczeniach i sprawiają, że późniejsze kroki są bardziej niezawodne. Jeśli chcesz, możesz połączyć wiele przekształceń typów danych jednocześnie, tak jak w poniższym przykładzie monitu.

Change Age and SatisfactionScore to numbers; set Department as text.

Kształtowanie danych często oznacza dodanie nowych pól , które ułatwiają interpretowanie zestawu danych. Pochodne wartości, takie jak grupy wiekowe lub kategorie, mogą obsługiwać analizę ukierunkowaną na działalność biznesową. Oto dwa przykładowe polecenia, które dodają nową kolumnę na podstawie reguły klasyfikacji zdefiniowanej w języku naturalnym:

Add a new column AgeRange that groups patients into categories: 18–24 as Young Adults, 25–34 as Early Career, etc.
Create a flag column that marks patients with SatisfactionScore below 4 as AtRisk.

Filtrowanie zawęża zestaw danych do najważniejszych elementów. Usuwanie hałaśliwych lub nieistotnych rekordów poprawia jakość danych. Poniżej przedstawiono dwa przykładowe polecenia, które filtrują dane według reguły określonej w języku naturalnym.

Remove rows where SatisfactionScore is less than 3.
Exclude records where Department is ENT.

Czasami należy połączyć pola, aby usprawnić analizę. Na przykład scalanie pola daty z polem godziny pozwala uniknąć konieczności dodatkowych łączeń lub odnośników.

Merge DateOfVisit and HourOfVisit into a new column called VisitDateTime of type DateTime.

Na koniec iteracja jest kluczem. Po każdej transformacji przejrzyj wyniki i uściślij swoje wywołania, jeśli coś wygląda niepoprawnie. Ta pętla pomaga w rozwijaniu umiejętności formułowania dokładnych instrukcji i zrozumieniu, jak Copilot je interpretuje. Czasami może to być tak proste, jak powiedzenie Copilotowi, co ma zrobić, jak w poniższym przykładzie polecenia. Można również usunąć krok przekształcenia utworzony przez Copilot i ponownie przesłać uściślone polecenie.

The VisitDateTime field didn’t parse correctly—recreate it using the format yyyy-MM-dd HH:mm.

Wyjaśnienie kodu języka M

Copilot nie tylko wykonuje przekształcenia; wyjaśnia również podstawowy kod Mashup (M). Ta przejrzystość buduje zaufanie, pokazując, co dzieje się pod maską, oferuje stopniowy sposób nauki składni zapytań podczas pracy z językiem naturalnym i promuje refleksję poprzez porównanie intencji z generowaną logiką.

Dostępne są dwa poziomy wyjaśnienia:

  • Wyjaśnij to zapytanie: Uzyskaj zwykły opis pełnego zapytania, w tym wszystkie zastosowane kroki. Uruchom to z okienka Copilot lub klikając prawym przyciskiem myszy na zapytanie w okienku Zapytania i wybierając pozycję Opisz.

    Describe this query
    
  • Wyjaśnij ten krok: Uzyskaj wyjaśnienie pojedynczego kroku transformacji. Kliknij prawym przyciskiem myszy dowolny krok na liście Zastosowane kroki i wybierz pozycję Wyjaśnij. Jest to szczególnie przydatne, gdy chcesz zrozumieć jedną transformację w izolacji, a nie analizowanie całego wyrażenia języka M jednocześnie.

Najlepsze rozwiązania dotyczące pracy z rozwiązaniem Copilot dla usługi Dataflow Gen2

  • Copilot jest najlepiej przygotowany do obsługi tematów integracji danych, więc najlepiej ograniczyć pytania do tego obszaru.
  • Rozpocznij od prostego. Przetestuj jedną transformację naraz przed utworzeniem łańcucha wielu kroków.
  • W przypadku uwzględnienia opisów, takich jak nazwy zapytań, nazwy kolumn i wartości w danych wejściowych, copilot jest bardziej skłonny do generowania przydatnych danych wyjściowych.
  • Spróbuj podzielić złożone dane wejściowe na bardziej szczegółowe zadania. Pomaga to Copilotowi lepiej zrozumieć wymagania i wygenerować dokładniejszy wynik.
  • Sprawdź poprawność po każdym kroku, przeglądając tabelę danych wyjściowych.
  • Iteruj stopniowo — traktuj Copilot jako partnera, z którym doskonalisz, a nie jako jednorazowe narzędzie.
  • Formułuj ramki wokół jasnych wyników (np. "dodaj kolumnę, która grupuje wieki" zamiast niejasnych poleceń.
  • Skorzystaj z wyjaśnień kodu, aby wzmocnić uczenie się i pogłębić umiejętności techniczne.
  • Regularnie sprawdzaj, jak Copilot interpretuje polecenia, w celu ulepszania sformułowań i przejrzystości w miarę upływu czasu.