Udostępnij za pośrednictwem


Pojęcia dotyczące agenta danych Fabric (wersja zapoznawcza)

Agent danych w usłudze Microsoft Fabric to nowa funkcja usługi Microsoft Fabric, która umożliwia tworzenie własnych konwersacyjnych systemów Q&A przy użyciu generowania sztucznej inteligencji. Agent danych sieci szkieletowej sprawia, że szczegółowe informacje o danych są bardziej dostępne i możliwe do działania dla wszystkich użytkowników w organizacji. Za pomocą agenta danych usługi Fabric twój zespół może prowadzić rozmowy z prostymi pytaniami w języku angielskim dotyczącymi danych przechowywanych w usłudze Fabric OneLake, a następnie otrzymywać odpowiednie odpowiedzi. Dzięki temu nawet osoby bez wiedzy technicznej w zakresie sztucznej inteligencji lub głębokie zrozumienie struktury danych mogą otrzymywać dokładne i kontekstowe odpowiedzi.

Możesz również dodać instrukcje specyficzne dla organizacji, przykłady i wskazówki, aby precyzyjnie dostosować agenta danych Fabric. Zapewnia to, że odpowiedzi są zgodne z potrzebami i celami organizacji, co pozwala wszystkim efektywniej korzystać z danych. Agent danych Fabric wspiera kulturę podejmowania decyzji opartych na danych, ponieważ obniża bariery dostępu do analiz, ułatwia współpracę i pomaga organizacji wyciągać większą wartość z danych.

Ważne

Ta funkcja jest dostępna w wersji zapoznawczej.

Wymagania wstępne

Jak działa agent danych Fabric

Agent danych fabric używa dużych modeli językowych (LLMs), aby umożliwić użytkownikom naturalną interakcję z danymi. Agent fabryki danych wykorzystuje interfejsy API asystenta Azure OpenAI i działa jak agent. Przetwarza pytania użytkowników, określa najbardziej odpowiednie źródło danych (Lakehouse, Warehouse, Zestaw danych usługi Power BI, bazy danych KQL) i wywołuje odpowiednie narzędzie do generowania, weryfikowania i wykonywania zapytań. Użytkownicy mogą następnie zadawać pytania w języku prostym i otrzymywać ustrukturyzowane, czytelne dla człowieka odpowiedzi — eliminując konieczność pisania złożonych zapytań i zapewnienia dokładnego i bezpiecznego dostępu do danych.

Oto jak to działa szczegółowo:

Analizowanie pytań & Weryfikacja: agent danych Fabric stosuje Azure OpenAI Assistant API jako podstawowego agenta do przetwarzania pytań użytkownika. Takie podejście zapewnia, że pytanie jest zgodne z protokołami zabezpieczeń, zasadami odpowiedzialnego używania sztucznej inteligencji (RAI) i uprawnieniami użytkowników. Agent danych Fabric ściśle wymusza dostęp wyłącznie do odczytu, utrzymując połączenia danych wyłącznie do odczytu ze wszystkimi źródłami danych.

Identyfikacja źródła danych: Agent danych Fabric używa poświadczeń użytkownika, aby uzyskać dostęp do schematu źródła danych. Dzięki temu system pobiera informacje o strukturze danych, do których użytkownik ma uprawnienia do wyświetlania. Następnie ocenia pytanie użytkownika dotyczące wszystkich dostępnych źródeł danych, w tym relacyjnych baz danych (Lakehouse and Warehouse), zestawów danych usługi Power BI (Semantic Models) i baz danych KQL. Może również odwoływać się do instrukcji agenta danych dostarczonych przez użytkownika w celu określenia najbardziej odpowiedniego źródła danych.

Wywołanie narzędzia & Generowanie zapytań: Po zidentyfikowaniu właściwego źródła danych lub źródeł, agent danych Fabric przekształca pytanie w celu zwiększenia jego przejrzystości i struktury, a następnie wywołuje odpowiednie narzędzie w celu wygenerowania strukturalnego zapytania.

  • Przetwarzanie języka naturalnego do SQL (NL2SQL) dla relacyjnych baz danych (Lakehouse/Warehouse).
  • Tłumaczenie języka naturalnego na DAX (NL2DAX) dla zestawów danych Power BI (modele semantyczne).
  • Przekształcanie języka naturalnego na KQL (NL2KQL) dla baz danych KQL.

Wybrane narzędzie generuje zapytanie na podstawie podanego schematu, metadanych i kontekstu, które następnie przekazuje agent danych Fabric.

sprawdzanie poprawności zapytań: narzędzie przeprowadza walidację, aby upewnić się, że zapytanie jest poprawnie sformułowane i jest zgodne z własnymi protokołami zabezpieczeń i zasadAMI RAI.

Query Execution & Response: Po zweryfikowaniu, agent danych Fabric wykonuje zapytanie przeciwko wybranemu źródłu danych. Wyniki są sformatowane w odpowiedzi czytelnej dla człowieka, która może zawierać dane ustrukturyzowane, takie jak tabele, podsumowania lub kluczowe szczegółowe informacje.

Takie podejście gwarantuje, że użytkownicy mogą wchodzić w interakcje z danymi przy użyciu języka naturalnego, podczas gdy agent danych sieci szkieletowej obsługuje złożoność generowania zapytań, walidacji i wykonywania — wszystko to bez konieczności pisania przez użytkowników samych języków SQL, DAX lub KQL.

Konfiguracja agenta danych w sieci typu fabric

Konfigurowanie agenta danych Fabric jest podobne do tworzenia raportu usługi Power BI — zaczynasz od projektowania i udoskonalania go, aby spełniał Twoje potrzeby, a następnie publikujesz i udostępniasz go współpracownikom, aby mogli pracować z danymi. Konfigurowanie agenta danych Fabric obejmuje:

Wybieranie źródeł danych: Agent danych Fabric obsługuje maksymalnie pięć źródeł danych w dowolnej kombinacji, w tym lakehousy, magazyny, bazy danych KQL i semantyczne modele Power BI. Na przykład skonfigurowany agent danych sieci szkieletowej może zawierać pięć modeli semantycznych usługi Power BI. Może to obejmować kombinację dwóch semantycznych modeli usługi Power BI, jednej bazy danych typu lakehouse i jednej bazy danych KQL. Masz wiele dostępnych opcji.

Wybieranie odpowiednich tabel: Po wybraniu źródeł danych należy dodawać je pojedynczo i zdefiniować określone tabele z każdego źródła, z którego będzie korzystał agent danych Fabric. Ten krok gwarantuje, że agent danych sieci szkieletowej pobiera dokładne wyniki, koncentrując się tylko na odpowiednich danych.

Dodawanie kontekstu: aby zwiększyć dokładność agenta danych sieci szkieletowej, możesz podać więcej kontekstu za pomocą instrukcji agenta danych sieci szkieletowej i przykładowych zapytań. W kontekście działania jako agent danych usługi Fabric, pomaga to asystentowi API Azure OpenAI podejmować bardziej świadome decyzje dotyczące przetwarzania pytań użytkowników oraz określać, które źródło danych jest najlepiej dopasowane do udzielenia odpowiedzi na nie.

  • pl-PL: Instrukcje agenta danych: Możesz dodać instrukcje, aby kierować agentem, który jest podstawą dla agenta danych Fabric, pomagając określić najlepsze źródło danych do odpowiedzi na określone typy pytań. Możesz również podać niestandardowe reguły lub definicje, które wyjaśniają terminologię organizacyjną lub określone wymagania. Te instrukcje mogą zawierać więcej kontekstów lub preferencji mających wpływ na sposób wybierania i wykonywania zapytań dotyczących źródeł danych przez agenta.

    • Skieruj pytania dotyczące metryk finansowych do modelu semantycznego Power BI.
    • Przypisz zapytania obejmujące eksplorację danych pierwotnych do lakehouse.
    • Kieruj pytania wymagające analizy dzienników do bazy danych KQL.
  • Przykładowe zapytania: Możesz dodać przykładowe pary pytanie-zapytanie, aby zilustrować sposób, w jaki agent danych Fabric powinien odpowiadać na typowe zapytania. Te przykłady służą jako przewodnik dla agenta, który pomaga zrozumieć, jak interpretować podobne pytania i generować dokładne odpowiedzi.

Uwaga

Dodawanie przykładowych par zapytań/pytań nie jest obecnie obsługiwane w przypadku semantycznych źródeł danych modelu usługi Power BI.

Łącząc jasne instrukcje dotyczące sztucznej inteligencji i odpowiednie przykładowe zapytania, można lepiej dopasować agenta danych sieci szkieletowej do potrzeb organizacji w zakresie danych, zapewniając dokładniejsze i kontekstowe odpowiedzi.

Różnica między agentem danych Fabric a copilotem

Chociaż zarówno agenci danych Fabric, jak i copiloci Fabric używają sztucznej inteligencji generatywnej do przetwarzania i wnioskowania na temat danych, istnieją kluczowe różnice w ich funkcjach i przypadkach użycia:

Elastyczność konfiguracji: Agenci danych struktury są wysoce konfigurowalni. Możesz podać niestandardowe instrukcje i przykłady, aby dostosować ich zachowanie do określonych scenariuszy. Z drugiej strony, fabrykowe copiloty są wstępnie skonfigurowane i nie oferują tego poziomu dostosowania.

Zakres i Przypadek Użycia: Kopiloci w usłudze Microsoft Fabric są przeznaczeni do wspomagania zadań, takich jak generowanie kodu notesu lub zapytań hurtowni danych. Agenci danych fabric są natomiast autonomicznymi artefaktami. Aby zwiększyć wszechstronność agentów danych sieci Szkieletowej dla szerszych przypadków użycia, mogą one integrować się z systemami zewnętrznymi, takimi jak Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams lub inne narzędzia poza siecią szkieletową.

Ocena agenta danych Fabric

Jakość i bezpieczeństwo odpowiedzi agenta danych Fabric przeszły rygorystyczną ocenę.

Test porównawczy: zespół produktu przetestował agentów danych Fabric w wielu zestawach danych publicznych i prywatnych w celu zapewnienia wysokiej jakości i dokładnych odpowiedzi.

Ulepszone środki łagodzenia szkód: Dodatkowe zabezpieczenia zapewniają, że wyniki agenta danych Fabric pozostają skoncentrowane wyłącznie na kontekście wybranych źródeł danych, aby zmniejszyć ryzyko nieistotnych lub wprowadzających w błąd odpowiedzi.

Ograniczenia

Agent danych Fabric jest obecnie w publicznej wersji zapoznawczej i ma ograniczenia. Aktualizacje z czasem poprawią agenta danych Fabric.

  • Agent danych sieci szkieletowej może pobierać dane, generując zapytania ustrukturyzowane (SQL, DAX lub KQL) w przypadku pytań obejmujących fakty, sumy, rankingi lub filtry. Nie może jednak interpretować trendów, dostarczać wyjaśnień ani analizować podstawowych przyczyn.
  • Agent danych Fabric generuje tylko zapytania SQL/DAX/KQL dotyczące odczytu. Nie generuje zapytań SQL/DAX/KQL, które tworzą, aktualizują lub usuwają dane.
  • Agent danych sieci szkieletowej może uzyskiwać dostęp tylko do danych, które podajesz. Używa tylko konfiguracji zasobów danych, które podajesz.
  • Agent danych sieci szkieletowej ma uprawnienia dostępu do danych, które są zgodne z uprawnieniami przyznanymi użytkownikowi wchodzącym w interakcję z agentem danych sieci szkieletowej. Dzieje się tak, gdy agent danych usługi Fabric jest publikowany w innych lokalizacjach, na przykład Microsoft Copilot Studio, Azure AI Foundry i Microsoft Teams.
  • Do agenta danych Fabric nie można dodać więcej niż pięć źródeł danych.
  • Nie można użyć agenta danych Fabric, aby uzyskać dostęp do zasobów danych niestrukturalnych. Te zasoby obejmują na przykład pliki .pdf, .docx lub .txt.
  • Agent danych sieci szkieletowej blokuje pytania lub instrukcje w języku innym niż angielski.
  • Nie można zmienić modułu LLM używanego przez agenta danych Fabric.
  • Nie można dodać bazy danych KQL jako źródła danych, jeśli ma więcej niż 1000 tabel ani tabel z ponad 100 kolumnami.
  • Nie można dodać modelu semantycznego usługi Power BI jako źródła danych, jeśli zawiera więcej niż 100 kolumn i miar.
  • Agent danych Fabric działa najlepiej z 25 tabelami lub mniej wybranych we wszystkich źródłach danych.
  • Nieskrypcyjne nazwy zasobów danych i tabel mają znaczący, negatywny wpływ na wygenerowaną jakość zapytań SQL/DAX/KQL. Zalecamy używanie nazw opisowych.
  • Użycie zbyt wielu kolumn i tabel może obniżyć wydajność agenta danych Fabric.
  • Agent danych Fabric jest obecnie przeznaczony do obsługi prostych zapytań. Złożone zapytania, które wymagają wielu sprzężeń lub zaawansowanej logiki, zwykle mają niższą niezawodność.
  • Jeśli dodasz semantyczny model usługi Power BI jako źródło danych, agent danych sieci szkieletowej nie używa żadnych ukrytych tabel, kolumn ani miar.
  • Jeśli wcześniej utworzono agenta danych Fabric, który używał magazynu jako źródła danych, a magazyn znajdował się w obszarze roboczym, który nie hostuje tego agenta danych Fabric, może zostać wyświetlony komunikat o błędzie. Aby rozwiązać ten problem, usuń istniejące źródło danych i dodaj je ponownie.
  • Aby dodać semantyczny model usługi Power BI jako źródło danych dla agenta danych Fabric, musisz mieć uprawnienia do odczytu/zapisu dla tego modelu semantycznego usługi Power BI. Wykonywanie zapytań względem agenta danych sieci szkieletowej korzystającego z modelu semantycznego usługi Power BI wymaga również uprawnień do odczytu/zapisu dla bazowego modelu semantycznego usługi Power BI.
  • Agent danych Fabric może zwrócić nieprawidłowe odpowiedzi. Należy przetestować agenta danych Fabric ze współpracownikami, aby sprawdzić, czy odpowiada na pytania zgodnie z oczekiwaniami. Jeśli popełnia błędy, podaj więcej przykładów i instrukcji.
  • Jeśli wcześniej utworzono i opublikowano agenta danych sieci szkieletowej i programowo użyto jego adresu URL, adres URL nie będzie już działać, jeśli otworzysz agenta danych sieci szkieletowej na stronie nowego interfejsu użytkownika agenta danych sieci szkieletowej. Aby rozwiązać ten problem, należy ponownie opublikować agenta danych Fabric i użyć nowego adresu URL na podstawie interfejsu API Asystentów.