Udostępnij za pośrednictwem


dokumentacja składni wyszukiwania Data Catalog

Azure Data Catalog to w pełni zarządzana usługa hostowana na platformie Microsoft Azure, która służy jako system rejestracji i systemu odnajdywania dla źródeł danych przedsiębiorstwa. Usługa Azure Data Catalog ma możliwości umożliwiające użytkownikom technicznym i niezwiązanym z nimi odnajdywanie, interpretowanie i używanie źródeł danych.

Kluczowym aspektem odnajdywania danych jest możliwość wyszukiwania źródeł danych zarejestrowanych w usłudze Azure Data Catalog. Usługa Azure Data Catalog ma zaawansowaną składnię wyszukiwania, która umożliwia użytkownikom łatwe tworzenie zapytań, które zwracają dane, których potrzebują użytkownicy.

Omówienie składni wyszukiwania

Wyszukiwanie w usłudze Azure Data Catalog jest podobne do wyszukiwań używanych przez systemy Microsoft Windows i Microsoft Outlook, a które powinny być znane użytkownikom tych narzędzi.

Techniki tworzenia zapytań

Technika Zastosowanie Przykład
Wyszukiwanie podstawowe Wyszukiwanie podstawowe przy użyciu co najmniej jednego terminu wyszukiwania. Wyniki obejmują wszystkie zasoby, których dowolne właściwości są zgodne z co najmniej jednym terminem. sales data
Wyznaczanie zakresu właściwości Zwracaj tylko źródła danych, w których wyszukiwany termin jest zgodny z określoną właściwością name:finance
Operatory logiczne Rozszerzanie lub zawężanie wyszukiwania przy użyciu operacji logicznych finance NOT corporate
Grupowanie za pomocą nawiasów Użyj nawiasów do grupowania części zapytania w celu uzyskania izolacji logicznej, szczególnie w połączeniu z operatorami logicznymi name:finance AND (tags:tag1 OR tags:tag2)
Operatory porównania Użyj porównań innych niż równość dla właściwości, które mają numeryczne i datowe typy danych creationTime>"11/05/2014"

Dopasowywanie, porównywanie i operatory logiczne

Słowo kluczowe/symbol Przykłady Funkcja
: experts:user@domain.com tags:tag1 Użyj określania zakresu właściwości i zwracaj tylko te zasoby, w których dana właściwość zawiera wyszukiwany tekst. Semantyka zapytania to "dopasowanie prefiksu".
= name=Sales name="Soft Drink Sales" Umożliwia użytkownikowi określenie dokładnego dopasowania. Zostaną zwrócone tylko te zasoby, które zawierają właściwość z dokładnie wartością terminu wyszukiwania.
<> experts<>user1 tags<>tag2 Operator "Nie równa się". Zwróci tylko te zasoby, które nie mają wartości wskazanej w zapytaniu wyszukiwania.
"" "social security" Znajduje elementy, które zawierają dokładne frazy zabezpieczenia społecznego. Istnieje jeden szczególny przypadek użycia cudzysłowów. Jeśli cudzysłowy są używane z właściwością określania zakresu semantyki są grupowane, ale nie dokładne frazy. W takim przypadku zachowanie jest takie samo jak dwukrotne określanie nazwanej właściwości. Przykład: name:"social security" znajduje wszelkie aktywa, które mają właściwość name ze słowem social w nim lub właściwość name ze słowem zabezpieczenia w nim.
() (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) Znajduje elementy zawierające tag1 i tag2 lub nazwę sprzedaży w bazie danych salesfy15. Zwykle używane w połączeniu z operatorami logicznymi
>,>= timestamp>"11/05/2014" Znajduje elementy o zmodyfikowanej dacie po 11.05.2014.
<,<= timestamp<"11/05/2014" Znajduje elementy z datą przed 11.05.2014.
NOT social NOT security Znajduje elementy, które zawierają elementy społecznościowe, ale nie zabezpieczenia.
AND social AND security Znajduje elementy zawierające zabezpieczenia i zabezpieczenia społeczne.
LUB social OR security Znajduje elementy, które zawierają zabezpieczenia społeczne.
Hsa: has:tags has:description Zezwalaj na filtrowanie i zwracanie tylko tych zasobów, w których ustawiono daną właściwość (lub jeśli właściwość reprezentuje kolekcję — zawiera co najmniej jeden element).

Uwagi

Semantyka prefiksów

Domyślnie wszystkie wyszukiwania w usłudze Azure Data Catalog są wykonywane przy użyciu techniki o nazwie Semantyka dopasowania prefiksu. Oznacza to, że każdy termin wyszukiwania rozpoczyna dopasowanie na początku właściwości elementu zawartości.

Rozważmy na przykład dwa fikcyjne zasoby zarejestrowane w usłudze Azure Data Catalog o następujących nazwach:

  • Salesdata
  • Oferty sprzedawcy

Wyszukiwanie "sales" zwraca oba te zasoby, ponieważ ich nazwy zaczynają się od słowa "sales". Przyszłe wersje usługi Azure Data Catalog obejmują obsługę dokładnych operatorów dopasowania.

Wyszukiwanie w zakresie właściwości

Gramatyka zapytań usługi Azure Data Catalog obsługuje określanie zakresu właściwości. W bieżącej wersji zapoznawczej zakresy właściwości są uwzględniane w wielkości liter. Oznacza to, że aby zapytanie działało, rzeczywista wielkość liter właściwości w zapytaniu wyszukiwania musi odpowiadać temu, co znajduje się w indeksie.

Wyszukiwanie nieprawidłowych właściwości (właściwości, które nie istnieją) powoduje błąd.

Cudzysłowy zachowują się w specjalny sposób podczas korzystania z określania zakresu właściwości. Cudzysłowy w dowolnym innym kontekście wskazują dokładną frazę. Jednak gdy cudzysłowy są używane we właściwości określania zakresu semantyki są grupowane. Na przykład name:"Sales Products" funkcja wyszukiwania wolnego tekstu wyszukuje zawartość właściwości name, wyszukując frazę "Sales" lub "Products". W związku z tym semantyka elementu : name:"Sales Products" jest dokładnie taka sama jak name:Sales name:Products.

Ogólna zasada dla nazw właściwości w właściwościach z możliwością wyszukiwania to camel-case, co oznacza, że pierwsza litera jest małymi literami, a następnie każda z pierwszych liter słowa jest wielką literą.

Poniżej wymieniono najbardziej przydatne właściwości.

Właściwość Zastosowanie Przykład
name Znajduje elementy, w których wyszukiwany termin pojawia się w nazwie źródła danych name:finance
description (opis) Znajduje elementy, w których wyszukiwany termin pojawia się w opisie źródła danych description:finance
Objecttype Znajduje elementy określonego typu obiektu, takie jak tabela, widok lub kluczowy wskaźnik wydajności objectType:table
Sourcetype Znajduje elementy określonego typu źródła danych, takie jak SQL Server lub SQL Server Analysis Services wielowymiarowe sourceType:"tabular"
tags Znajduje elementy, w których wyszukiwany termin pojawia się w tagach źródła danych tags:finance
sygnatura czasowa Wyszukuje elementy na podstawie daty i godziny, w których metadane zostały ostatnio zmodyfikowane timestamp:>"11/05/2014"
lastRegisteredTime Znajduje elementy na podstawie daty i godziny zarejestrowania metadanych lastRegisteredTime:>"11/05/2014"
Friendlyname Znajduje elementy, w których wyszukiwany termin pojawia się w przyjaznej nazwie źródła danych friendlyName: finance
Ekspertów Znajduje elementy, w których ekspert źródła danych pasuje do terminu wyszukiwania experts:user@example.com experts:user
nazwa_terminu Znajduje elementy, w których wyszukiwany termin pojawia się w terminach słownika biznesowego zastosowanych do zasobu danych termName:marketing

Możesz również użyć następujących nazw właściwości wraz z filtrem "has:", aby sprawdzić, gdzie zasoby mają określone właściwości ustawione.

Właściwość Zastosowanie Przykład
podglądy Znajduje elementy zawierające podgląd has:preview
dokumentacja Znajduje elementy zawierające dokumentację has:documentation
tableDataProfiles Znajduje elementy, które mają profil tabeli (rozmiar, liczba wierszy itp.) has:tableDataProfiles
columnsDataProfiles Znajduje elementy, które mają profil danych kolumny (liczba odrębnych wartości, min, maksimum itp.) has:columnsDataProfiles

Przykłady wyszukiwania

W poniższych sekcjach przedstawiono kilka przykładów wyszukiwania.

Zwracanie wszystkich zasobów z wartością "sales" w nazwie

name:sales

Zwróć wszystkie zasoby zarejestrowane po 20.04.2015, które zawierają "sprzedaż" w dowolnej właściwości

sales AND lastRegisteredTime&gt;"4/20/2015"

Zwróć wszystkie zasoby, które zawierają sprzedaż w dowolnej właściwości i które nie mają tagu Q1FY2013

sales AND tags&lt;&gt;"Q1FY2013"

Zwracanie wszystkich zasobów, które nie mają ekspertów ani przypisanej dokumentacji

not has:experts and not has:documentation