Udostępnij za pośrednictwem


Stwórz skuteczną przestrzeń Genie

Celem zarządzania przestrzenią Genie jest utworzenie środowiska, w którym użytkownicy biznesowi mogą zadawać pytania w języku naturalnym i otrzymywać dokładne, spójne odpowiedzi na podstawie danych. Przestrzenie Genie używają zaawansowanych modeli, które generują skomplikowane zapytania i rozumieją ogólną wiedzę na temat świata.

Większość pytań biznesowych jest specyficznych dla domeny, więc rolą kuratora przestrzeni jest wypełnienie luki między ogólną wiedzą na świecie a wyspecjalizowanym językiem używanym w określonej domenie lub przez określoną firmę. Kuratorzy używają metadanych i instrukcji, aby pomóc Genie dokładnie interpretować pytania użytkowników biznesowych i odpowiadać na nie. W tym artykule opisano najlepsze rozwiązania i zasady, które ułatwiają opracowywanie udanej przestrzeni.

Najlepsze rozwiązania dotyczące definiowania nowego miejsca

W poniższych sekcjach przedstawiono zalecenia dotyczące tworzenia efektywnej przestrzeni.

Rozpocznij od małej

Kreowanie przestrzeni Genie to proces iteracyjny. Podczas tworzenia nowego miejsca zacznij od jak najmniejszego, z minimalnymi instrukcjami i ograniczonym zestawem pytań, na które można odpowiedzieć. Następnie, podczas iteracji, możesz wprowadzać zmiany na podstawie opinii i monitorowania. Takie podejście pomaga usprawnić tworzenie i utrzymywanie przestrzeni oraz umożliwia efektywne zarządzanie nią w odpowiedzi na rzeczywiste potrzeby użytkowników.

Skorzystaj z poniższych wskazówek, aby pomóc w utworzeniu małej przestrzeni Genie:

  • Bądź skoncentrowany: uwzględnij tylko tabele niezbędne do udzielenia odpowiedzi na pytania, które mają być obsługiwane przez przestrzeń. Celem jest pięć lub mniej tabel. Tym bardziej koncentrujesz się na wyborze, tym lepiej. Utrzymywanie miejsca wąsko skoncentrowanego na niewielkiej ilości danych jest idealne, więc ogranicz liczbę kolumn w dołączonych tabelach.
  • Zaplanuj iterację: zacznij od minimalnej konfiguracji dla miejsca, koncentrując się na podstawowych tabelach i instrukcjach. Dodaj bardziej szczegółowe wskazówki i przykłady, udoskonalając obszar z biegiem czasu, zamiast dążyć do doskonałości od razu.
  • Opracuj na podstawie dobrze adnotowanych tabel: Usługa Genie używa nazw kolumn i opisów Unity Catalog do generowania odpowiedzi. Jasne nazwy kolumn i opisy pomagają w tworzeniu odpowiedzi wysokiej jakości. Opisy kolumn powinny zawierać dokładne informacje kontekstowe. Unikaj niejednoznacznych lub niepotrzebnych szczegółów. Sprawdź wszystkie opisy generowane przez sztuczną inteligencję pod kątem dokładności i jasności i używaj ich tylko wtedy, gdy są one zgodne z tym, co należy podać ręcznie.

Posiadanie eksperta w dziedzinie definiowania przestrzeni

Skuteczny twórca przestrzeni musi zrozumieć dane i szczegółowe informacje, które można z niego zebrać. Analitycy danych, którzy są biegli w języku SQL, zazwyczaj mają wiedzę i umiejętności, aby zarządzać zasobami.

Definiowanie przeznaczenia miejsca

Zidentyfikowanie określonej grupy odbiorców i celu twojej przestrzeni pomaga zdecydować, które dane, instrukcje i pytania testowe mają być używane. Obszar powinien odpowiadać na pytania dotyczące określonego tematu i odbiorców, a nie pytania ogólne w różnych domenach. Zestawy danych można uprościć, wcześniej łącząc tabele i usuwając niepotrzebne kolumny przed dodaniem danych do przestrzeni danych. Podczas dodawania danych do miejsca należy zachować ścisłe skupienie się na zdefiniowanym celu przestrzeni. Ukryj wszystkie kolumny, które mogą być mylące lub nieistotne. Zobacz Pokaż lub ukryj kolumny.

Dodawanie metadanych i synonimów

Synonimy kolumn i opisy niestandardowe można dodawać do danych w przestrzeni Genie. Metadane te są ograniczone do przestrzeni Genie i nie nadpisują metadanych przechowywanych w katalogu Unity. Opisy kolumny jakościowej i synonimy pomagają Genie lepiej zrozumieć kolumnę, wybrać ją pod kątem odpowiednich pytań i napisać bardziej precyzyjny kod SQL. Zobacz Edytowanie metadanych kolumn.

Włączanie próbkowania danych Genie

Ważne

Ta funkcja jest dostępna w publicznej wersji testowej.

Administrator obszaru roboczego może włączyć Genie Data Sampling dla obszaru roboczego. Próbkowanie danych zwiększa dokładność usługi Genie przez próbkowanie wartości z zestawów danych w przestrzeni, co pomaga lepiej dopasować monity użytkownika do poprawnych kolumn i wartości. Po włączeniu Genie automatycznie pobiera próbki wartości z tabel podczas tworzenia przestrzeni. Możesz zarządzać kolumnami, które mają próbkowane dane. Zobacz Manage data objects (Zarządzanie obiektami danych ) i Use value sampling (Używanie próbkowania wartości), aby poprawić dokładność usługi Genie.

Podaj ukierunkowane przykłady i instrukcje

Genie spaces najlepiej działają z ograniczonym, skoncentrowanym zestawem instrukcji. Usługa Databricks zaleca wykorzystywanie przykładowych zapytań SQL do udzielania instrukcji w Twojej przestrzeni. Przykładowe zapytania SQL umożliwiają usłudze Genie dopasowanie monitów użytkownika do zweryfikowanych zapytań SQL i poznanie przykładów w celu udzielenia odpowiedzi na powiązane pytania. Zobacz Dodawanie przykładowych zapytań SQL i funkcji.

W przypadku kontekstu, który powinien być stosowany globalnie w przestrzeni Genie, mały, dobrze zorganizowany zestaw instrukcji zwykłego tekstu może również pomóc zachować istotność i poprawić jakość odpowiedzi. Zbyt wiele instrukcji może zmniejszyć skuteczność, zwłaszcza w dłuższych rozmowach, ponieważ Genie może mieć trudności z ustaleniem priorytetów najważniejszych wskazówek. Aby uzyskać szczegółowe informacje, zobacz Zapewnianie instrukcji.

Testowanie i dostosowywanie

Musisz być pierwszym użytkownikiem miejsca. Po utworzeniu nowego miejsca rozpocznij zadawanie pytań. Dokładnie sprawdź kod SQL wygenerowany w odpowiedzi na pytania. Jeśli Genie błędnie interpretuje dane, pytania lub żargon biznesowy, możesz interweniować, edytując wygenerowany język SQL lub podając inne szczegółowe instrukcje. Kontynuuj testowanie i edytowanie, dopóki nie otrzymasz niezawodnych odpowiedzi.

Po przejrzeniu pytania, możesz dodać je jako pytanie wzorcowe, którego można użyć do testowania i oceniania miejsca w celu systematycznej oceny ogólnej dokładności. Możesz użyć odmian i różnych fraz pytań, aby przetestować odpowiedzi Genie. Zobacz Używanie testów porównawczych w przestrzeni Genie.

Zobacz Rozwiązywanie problemów po pomysły naprawy błędnych odpowiedzi.

Przeprowadź testy użytkowników

Po zweryfikowaniu jakości odpowiedzi za pomocą testów, zrekrutuj użytkownika biznesowego do wypróbowania przestrzeni Genie. Skorzystaj z poniższych wskazówek, aby zapewnić płynną podróż użytkownika i zebrać opinie na temat ciągłej poprawy:

  • Wyznacz oczekiwania, że ich zadaniem jest pomoc w dopracowaniu pomieszczenia.
  • Poproś ich o skupienie się na testach dotyczących konkretnego tematu i pytaniach, na które ma odpowiedzieć przestrzeń.
  • Jeśli otrzymają niepoprawną odpowiedź, zachęcamy użytkowników do dodawania dodatkowych instrukcji i wyjaśnień na czacie w celu uściślenia odpowiedzi. Po podaniu poprawnej odpowiedzi użytkownicy powinni ocenić ją pozytywnie, aby zminimalizować podobne błędy w przyszłych interakcjach.
  • Zachęć użytkowników do głosowania na odpowiedzi za pomocą wbudowanego mechanizmu przesyłania opinii.
  • Zaproś użytkowników, aby podzielili się dodatkowymi opiniami i nierozwiązanymi pytaniami bezpośrednio z autorami przestrzeni. Autorzy i redaktorzy mogą używać opinii do uściślenia instrukcji, przykładów i zaufanych zasobów.

Rozważ dostarczenie materiałów szkoleniowych lub pisemnego dokumentu z wytycznymi dotyczącymi testowania pokoju i przekazywania opinii. Kierowanie użytkowników biznesowych do korzystania z obszaru Genie w celu eksplorowania danych biznesowych , aby pomóc im rozpocząć pracę z nową przestrzenią Genie.

Gdy użytkownicy biznesowi testują przestrzeń, edytory przestrzeni mogą zobaczyć pytania, które zadawali na karcie Monitorowanie. Kontynuuj dodawanie kontekstu, aby Genie mógł poprawnie interpretować pytania i dane oraz zapewnić dokładne odpowiedzi. Zobacz Monitorowanie przestrzeni, aby dowiedzieć się więcej na temat monitorowania przestrzeni Genie. Możesz również użyć dzienników audytu, aby monitorować opinie o Przestrzeni Genie i przeglądać żądania. Zobacz Monitorowanie użycia sztucznej inteligencji/analizy biznesowej przy użyciu dzienników inspekcji i alertów.

Uwaga

Użytkownicy biznesowi muszą być członkami źródłowego obszaru roboczego, aby uzyskać dostęp do Twojego obszaru roboczego. Zobacz Wymagane uprawnienia , aby dowiedzieć się, jak zapewnić odpowiednie uprawnienia do interakcji z przestrzenią.

Rozwiązywanie problemów

W poniższych sekcjach opisano sposób rozwiązywania typowych problemów.

Niezrozumiany żargon biznesowy

Większość firm lub domen ma określone skróty, których używają do komunikowania się o wydarzeniach specyficznych dla branży. Na przykład w przypadku odwoływania się do roku może to zawsze oznaczać rok obrachunkowy, a ten rok obrachunkowy może rozpoczynać się w lutym lub marcu zamiast stycznia. Aby umożliwić Genie naturalne i dokładne odpowiadanie na te pytania, dołącz instrukcje, które jawnie mapują żargon biznesowy na słowa i pojęcia, które Genie może zrozumieć. Zobacz Zapewnianie instrukcji.

Nieprawidłowe użycie tabeli lub kolumny

Jeśli usługa Genie próbuje ściągnąć dane z nieprawidłowej tabeli lub uruchomić analizę nieprawidłowych kolumn, możesz dostosować dane w jeden z następujących sposobów:

  • Podaj jasne i dokładne opisy: Sprawdź tabele i skojarzone metadane, aby sprawdzić, czy używana terminologia jest zgodna z terminologią użytkowników w przesłanych pytaniach. Jeśli tak nie jest, uściślij opis lub dodaj instrukcję, która mapuje terminologię używaną w tabeli do terminologii używanej w pytaniu.
  • Dodaj przykładowe zapytania: podaj przykładowe zapytania SQL, których usługa Genie może użyć, aby dowiedzieć się, jak odpowiedzieć na określone pytania. Zobacz Zapewnianie instrukcji.
  • Usuwanie tabel lub kolumn z przestrzeni: Niektóre tabele mogą zawierać nakładające się kolumny lub pojęcia, które utrudniają Genie ustalenie, które dane powinny być używane w odpowiedzi. Jeśli to możliwe, usuń niepotrzebne lub nakładające się tabele lub kolumny. Aby szybko ukryć kolumny z interfejsu użytkownika obszaru Genie, bez zmieniania bazowych obiektów danych, zobacz Pokaż lub ukryj kolumny.

Błędy filtrowania

Wygenerowane zapytania często zawierają klauzulę filtrowania WHERE wyników zgodnie z określoną wartością. Gdy usługa Genie nie ma wglądu w wartości danych, może ustawić klauzulę WHERE , aby filtrować nieprawidłową wartość. Na przykład może próbować dopasować nazwę "California", gdy w tabeli są używane skróty, takie jak "CA".

W takich sytuacjach wypróbuj jedną z następujących strategii:

  • W razie potrzeby administrator obszaru roboczego powinien włączyć Próbkowanie danych Genie z poziomu strony Podglądy. Umożliwia to funkcje, które pomagają Genie lepiej dopasowywać monity użytkownika do wartości kolumn. Zobacz Użyj próbkowania wartości, aby poprawić dokładność Genie.
  • Sprawdź, czy odpowiednie kolumny mają włączone przykładowe wartości i słowniki wartości . Jeśli nowe dane zostały dodane do odpowiednich tabel, odśwież wartości. Zobacz Wyświetlanie kolumn.

Nieprawidłowe połączenia

Jeśli odwołania do klucza obcego nie są zdefiniowane w katalogu Unity, Twój system może nie wiedzieć, jak połączyć różne tabele.

Spróbuj zaimplementować co najmniej jedno z następujących rozwiązań:

  • Zdefiniuj odwołania do kluczy obcych w katalogu Unity, jeśli to możliwe. Zobacz CONSTRAINT klauzulę.
  • Podaj przykładowe zapytania, w których łączysz tabele w standardowy sposób.
  • Jeśli relacje kluczów obcych w tabelach nie są określone w katalogu Unity, udokumentuj je w instrukcjach.

Jeśli żaden z tych elementów nie rozwiąże problemu, należy zintegrować tabelę z widokiem i użyć jej jako danych wejściowych dla przestrzeni. Ta strategia jest przydatna w przypadku bardziej złożonych scenariuszy łączenia, takich jak samodzielne łączenia.

Komentarze kolumn nie są synchronizowane z tabel obcych

Usługa Azure Databricks nie zarządza metadanymi, danymi ani semantykami zapisów w tabelach obcych. W zależności od tabeli źródłowej komentarze mogą nie być dostępne w usłudze Azure Databricks. Aby udostępnić komentarze, usługa Azure Databricks zaleca wykonanie jednej z następujących czynności:

Problemy z obliczeniami metryk

Sposób, w jaki metryki są obliczane i agregowane, może być dowolnie skomplikowany i obejmować wiele szczegółów biznesowych, których twój dział nie rozumie. Może to prowadzić do nieprawidłowego raportowania.

Spróbuj zaimplementować co najmniej jedno z następujących rozwiązań:

  • Jeśli metryki są agregowane z tabel bazowych, podaj przykładowe zapytania SQL obliczeniowe dla każdej wartości zbiorczej.
  • Jeśli metryki zostały wstępnie obliczone i znajdują się w zagregowanych tabelach, wyjaśnij to w komentarzach tabeli. Określ prawidłowe agregacje dla każdego wskaźnika, jeśli metryki w tej tabeli mogą być dodatkowo zsumowane.
  • Jeśli język SQL, który próbujesz wygenerować, jest bardzo skomplikowany, spróbuj utworzyć widoki, które już zagregowały metryki dla miejsca.

Nieprawidłowe obliczenia oparte na czasie

Genie może nie zawsze być w stanie wywnioskować strefę czasową reprezentowaną w danych lub strefę czasową, w której należy przeprowadzić analizę, chyba że jawnie podasz dodatkowe wskazówki.

Dołącz bardziej jawne instrukcje szczegółowo opisujące oryginalną strefę czasową źródła, funkcję konwersji i docelową strefę czasową. W poniższych przykładach pokazano, jak zmienić ogólne instrukcje dotyczące bardziej niezawodnych konwersji strefy czasowej:

  • Zawsze konwertuj czasy na określoną strefę czasową: w tym przykładzie załóżmy, że sygnatura czasowa źródła to UTC i chcesz uzyskać wyniki w America/Los_Angeles strefie czasowej. Dodaj następujące treści do instrukcji, zastępując <timezone-column> odpowiednią nazwą kolumny.
    • Strefy czasowe w tabelach znajdują się w UTC.
    • Przekonwertuj wszystkie strefy czasowe przy użyciu następującej funkcji: convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • Przekonwertuj formaty daty/godziny innej niż UTC na UTC: Jeśli domyślna strefa czasowa obszaru roboczego to UTC , ale użytkownicy w Los Angeles muszą odwoływać się dzisiaj do określonego zestawu rekordów, dodaj następujące informacje do ogólnych instrukcji obszaru:
    • Aby odwołać się do dzisiaj, użyj polecenia "date(convert_timezone('UTC", "America/Los_Angeles", current_timestamp()))

Zobacz convert_timezone funkcję , aby uzyskać więcej szczegółów i składni.

Ignorowanie instrukcji

Nawet jeśli wyjaśniłeś swoje tabele i kolumny w komentarzach i podałeś ogólne instrukcje, przestrzeń może nadal nie używać ich poprawnie.

Wypróbuj co najmniej jedną z następujących strategii:

  • Podaj przykładowe zapytania, które prawidłowo używają tabel. Przykładowe zapytania są szczególnie skuteczne w przypadku nauczania przestrzeni, w jaki sposób korzystać z danych.
  • Ukryj nieistotne kolumny w przestrzeni Genie. Zobacz Pokaż lub ukryj kolumny.
  • Utwórz widoki na podstawie tabel, które zapewniają prostszy widok danych.
  • Przejrzyj instrukcje i spróbuj skupić się na przestrzeni, usuwając nieistotne tabele lub instrukcje.
  • Spróbuj uruchomić nowy czat. Poprzednie interakcje mogą mieć wpływ na odpowiedzi Genie w danym czacie, ale rozpoczęcie nowego czatu daje pusty punkt wyjścia do testowania nowych instrukcji.

Problemy z wydajnością

Gdy Genie musi wygenerować wyjątkowo długie zapytania lub odpowiedzi tekstowe, reakcja może zająć dużo czasu lub nawet nastąpić przekroczenie limitu czasu przy przetwarzaniu.

Spróbuj wykonać co najmniej jedną z następujących akcji, aby zwiększyć wydajność:

Zawodne odpowiedzi na pytania o znaczeniu krytycznym

Użyj zaufanych zasobów, aby podać zweryfikowane odpowiedzi na konkretne pytania, których oczekujesz od użytkowników. Zobacz Use trusted assets in AI/BI Genie spaces (Używanie zaufanych zasobów w przestrzeniach usługi AI/BI Genie).

Ostrzeżenie dotyczące limitu tokenu

Tokeny to podstawowe jednostki tekstu używane przez genie do przetwarzania i zrozumienia języka. Tekst dołączony jako instrukcje lub metadane w obszarze Genie jest konwertowany na tokeny. Jeśli liczba tokenów w twoim obszarze zbliża się do limitu, produkt powiadamia Cię o ostrzeżeniach. Genie stosuje inteligentne filtrowanie kontekstowe, aby wybrać tokeny reprezentujące metadane i niektóre typy instrukcji zawartych w przestrzeni Genie. Nawet jeśli przekroczysz limit, przestrzeń powinna nadal generować odpowiedzi na pytania.

Jeśli obszar Genie zbliża się do limitu tokenów, Genie może określić priorytety, uwzględniając tylko części schematu tabeli oraz najbardziej istotne instrukcje związane z pytaniem. Może to zmniejszyć jakość odpowiedzi, jeśli ważny kontekst zostanie odfiltrowany. Rozważ następujące rozwiązania, aby zmniejszyć liczbę tokenów:

  • Usuwanie niepotrzebnych kolumn: niepotrzebne kolumny w tabelach mogą znacząco przyczynić się do użycia tokenów. jeśli jest to możliwe, utwórz widoki, aby wykluczyć nadmiarowe lub nie istotne pola z nieprzetworzonych tabel. Możesz również ukryć niepotrzebne kolumny w przestrzeni Genie. Zobacz Pokaż lub ukryj kolumny.
  • Usprawnij opisy kolumn: Chociaż opisy kolumn są ważne, unikaj duplikowania informacji już przekazywanych według nazw kolumn. Jeśli na przykład kolumna ma nazwę account_name, opis taki jak "nazwa konta" może być nadmiarowy i można go pominąć.
  • Edytowanie metadanych kolumn w obszarze Genie: Zobacz Edytowanie metadanych kolumn, aby dowiedzieć się, jak edytować opisy i udostępniać synonimy w metadanych kolumn.
  • Przykładowe instrukcje języka SQL w języku Prune: uwzględnij zróżnicowany zakres przykładowych instrukcji SQL, aby uwzględnić różne typy pytań, ale usunąć nakładające się lub nadmiarowe przykłady.
  • Upraszczanie instrukcji: Sprawdź, czy instrukcje są jasne i zwięzłe. Unikaj niepotrzebnych słów.

Twoje konto nie jest aktywowane do przetwarzania międzyregionowego

Genie to wyznaczona usługa zarządzana przez usługę Azure Databricks. Wyznaczone usługi używają usługi Databricks Geos do zarządzania miejscem przechowywania danych. Nie można przetworzyć danych w tym samym obszarze geograficznym co obszar roboczy dla niektórych regionów. Jeśli obszar roboczy znajduje się w jednym z tych regionów, przetwarzanie między regionami musi być aktywowane przez administratora konta.

Osiąganie limitów przepływności

Podczas uzyskiwania dostępu do obszarów Genie za pośrednictwem interfejsu użytkownika Azure Databricks wydajność jest ograniczona do 20 pytań na minutę na obszar roboczy we wszystkich obszarach Genie.

W przypadku uzyskiwania dostępu do przestrzeni Genie przy użyciu bezpłatnej warstwy interfejsu API konwersacji (publiczna wersja zapoznawcza) przepustowość jest ograniczona do pięciu pytań na minutę na każdy obszar roboczy, z dołożeniem wszelkich starań we wszystkich przestrzeniach Genie. Zobacz Jak korzystać z interfejsu API konwersacji Genie do integracji Genie z aplikacjami.