dokumentacja składni wyszukiwania Data Catalog
Azure Data Catalog to w pełni zarządzana usługa hostowana na platformie Microsoft Azure, która służy jako system rejestracji i systemu odnajdywania dla źródeł danych przedsiębiorstwa. Usługa Azure Data Catalog ma możliwości umożliwiające użytkownikom technicznym i niezwiązanym z nimi odnajdywanie, interpretowanie i używanie źródeł danych.
Kluczowym aspektem odnajdywania danych jest możliwość wyszukiwania źródeł danych zarejestrowanych w usłudze Azure Data Catalog. Usługa Azure Data Catalog ma zaawansowaną składnię wyszukiwania, która umożliwia użytkownikom łatwe tworzenie zapytań, które zwracają dane, których potrzebują użytkownicy.
Omówienie składni wyszukiwania
Wyszukiwanie w usłudze Azure Data Catalog jest podobne do wyszukiwań używanych przez systemy Microsoft Windows i Microsoft Outlook, a które powinny być znane użytkownikom tych narzędzi.
Techniki tworzenia zapytań
Technika | Zastosowanie | Przykład |
---|---|---|
Wyszukiwanie podstawowe | Wyszukiwanie podstawowe przy użyciu co najmniej jednego terminu wyszukiwania. Wyniki obejmują wszystkie zasoby, których dowolne właściwości są zgodne z co najmniej jednym terminem. | sales data |
Wyznaczanie zakresu właściwości | Zwracaj tylko źródła danych, w których wyszukiwany termin jest zgodny z określoną właściwością | name:finance |
Operatory logiczne | Rozszerzanie lub zawężanie wyszukiwania przy użyciu operacji logicznych | finance NOT corporate |
Grupowanie za pomocą nawiasów | Użyj nawiasów do grupowania części zapytania w celu uzyskania izolacji logicznej, szczególnie w połączeniu z operatorami logicznymi | name:finance AND (tags:tag1 OR tags:tag2) |
Operatory porównania | Użyj porównań innych niż równość dla właściwości, które mają numeryczne i datowe typy danych | creationTime>"11/05/2014" |
Dopasowywanie, porównywanie i operatory logiczne
Słowo kluczowe/symbol | Przykłady | Funkcja |
---|---|---|
: | experts:user@domain.com tags:tag1 |
Użyj określania zakresu właściwości i zwracaj tylko te zasoby, w których dana właściwość zawiera wyszukiwany tekst. Semantyka zapytania to "dopasowanie prefiksu". |
= | name=Sales name="Soft Drink Sales" |
Umożliwia użytkownikowi określenie dokładnego dopasowania. Zostaną zwrócone tylko te zasoby, które zawierają właściwość z dokładnie wartością terminu wyszukiwania. |
<> | experts<>user1 tags<>tag2 |
Operator "Nie równa się". Zwróci tylko te zasoby, które nie mają wartości wskazanej w zapytaniu wyszukiwania. |
"" | "social security" |
Znajduje elementy, które zawierają dokładne frazy zabezpieczenia społecznego. Istnieje jeden szczególny przypadek użycia cudzysłowów. Jeśli cudzysłowy są używane z właściwością określania zakresu semantyki są grupowane, ale nie dokładne frazy. W takim przypadku zachowanie jest takie samo jak dwukrotne określanie nazwanej właściwości. Przykład: name:"social security" znajduje wszelkie aktywa, które mają właściwość name ze słowem social w nim lub właściwość name ze słowem zabezpieczenia w nim. |
() | (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) |
Znajduje elementy zawierające tag1 i tag2 lub nazwę sprzedaży w bazie danych salesfy15. Zwykle używane w połączeniu z operatorami logicznymi |
>,>= | timestamp>"11/05/2014" |
Znajduje elementy o zmodyfikowanej dacie po 11.05.2014. |
<,<= | timestamp<"11/05/2014" |
Znajduje elementy z datą przed 11.05.2014. |
NOT | social NOT security |
Znajduje elementy, które zawierają elementy społecznościowe, ale nie zabezpieczenia. |
AND | social AND security |
Znajduje elementy zawierające zabezpieczenia i zabezpieczenia społeczne. |
LUB | social OR security |
Znajduje elementy, które zawierają zabezpieczenia społeczne. |
Hsa: | has:tags has:description |
Zezwalaj na filtrowanie i zwracanie tylko tych zasobów, w których ustawiono daną właściwość (lub jeśli właściwość reprezentuje kolekcję — zawiera co najmniej jeden element). |
Uwagi
Semantyka prefiksów
Domyślnie wszystkie wyszukiwania w usłudze Azure Data Catalog są wykonywane przy użyciu techniki o nazwie Semantyka dopasowania prefiksu. Oznacza to, że każdy termin wyszukiwania rozpoczyna dopasowanie na początku właściwości elementu zawartości.
Rozważmy na przykład dwa fikcyjne zasoby zarejestrowane w usłudze Azure Data Catalog o następujących nazwach:
- Salesdata
- Oferty sprzedawcy
Wyszukiwanie "sales" zwraca oba te zasoby, ponieważ ich nazwy zaczynają się od słowa "sales". Przyszłe wersje usługi Azure Data Catalog obejmują obsługę dokładnych operatorów dopasowania.
Wyszukiwanie w zakresie właściwości
Gramatyka zapytań usługi Azure Data Catalog obsługuje określanie zakresu właściwości. W bieżącej wersji zapoznawczej zakresy właściwości są uwzględniane w wielkości liter. Oznacza to, że aby zapytanie działało, rzeczywista wielkość liter właściwości w zapytaniu wyszukiwania musi odpowiadać temu, co znajduje się w indeksie.
Wyszukiwanie nieprawidłowych właściwości (właściwości, które nie istnieją) powoduje błąd.
Cudzysłowy zachowują się w specjalny sposób podczas korzystania z określania zakresu właściwości. Cudzysłowy w dowolnym innym kontekście wskazują dokładną frazę. Jednak gdy cudzysłowy są używane we właściwości określania zakresu semantyki są grupowane. Na przykład name:"Sales Products"
funkcja wyszukiwania wolnego tekstu wyszukuje zawartość właściwości name, wyszukując frazę "Sales" lub "Products". W związku z tym semantyka elementu : name:"Sales Products"
jest dokładnie taka sama jak name:Sales name:Products
.
Ogólna zasada dla nazw właściwości w właściwościach z możliwością wyszukiwania to camel-case, co oznacza, że pierwsza litera jest małymi literami, a następnie każda z pierwszych liter słowa jest wielką literą.
Poniżej wymieniono najbardziej przydatne właściwości.
Właściwość | Zastosowanie | Przykład |
---|---|---|
name | Znajduje elementy, w których wyszukiwany termin pojawia się w nazwie źródła danych | name:finance |
description (opis) | Znajduje elementy, w których wyszukiwany termin pojawia się w opisie źródła danych | description:finance |
Objecttype | Znajduje elementy określonego typu obiektu, takie jak tabela, widok lub kluczowy wskaźnik wydajności | objectType:table |
Sourcetype | Znajduje elementy określonego typu źródła danych, takie jak SQL Server lub SQL Server Analysis Services wielowymiarowe | sourceType:"tabular" |
tags | Znajduje elementy, w których wyszukiwany termin pojawia się w tagach źródła danych | tags:finance |
sygnatura czasowa | Wyszukuje elementy na podstawie daty i godziny, w których metadane zostały ostatnio zmodyfikowane | timestamp:>"11/05/2014" |
lastRegisteredTime | Znajduje elementy na podstawie daty i godziny zarejestrowania metadanych | lastRegisteredTime:>"11/05/2014" |
Friendlyname | Znajduje elementy, w których wyszukiwany termin pojawia się w przyjaznej nazwie źródła danych | friendlyName: finance |
Ekspertów | Znajduje elementy, w których ekspert źródła danych pasuje do terminu wyszukiwania | experts:user@example.com experts:user |
nazwa_terminu | Znajduje elementy, w których wyszukiwany termin pojawia się w terminach słownika biznesowego zastosowanych do zasobu danych | termName:marketing |
Możesz również użyć następujących nazw właściwości wraz z filtrem "has:", aby sprawdzić, gdzie zasoby mają określone właściwości ustawione.
Właściwość | Zastosowanie | Przykład |
---|---|---|
podglądy | Znajduje elementy zawierające podgląd | has:preview |
dokumentacja | Znajduje elementy zawierające dokumentację | has:documentation |
tableDataProfiles | Znajduje elementy, które mają profil tabeli (rozmiar, liczba wierszy itp.) | has:tableDataProfiles |
columnsDataProfiles | Znajduje elementy, które mają profil danych kolumny (liczba odrębnych wartości, min, maksimum itp.) | has:columnsDataProfiles |
Przykłady wyszukiwania
W poniższych sekcjach przedstawiono kilka przykładów wyszukiwania.
Zwracanie wszystkich zasobów z wartością "sales" w nazwie
name:sales
Zwróć wszystkie zasoby zarejestrowane po 20.04.2015, które zawierają "sprzedaż" w dowolnej właściwości
sales AND lastRegisteredTime>"4/20/2015"
Zwróć wszystkie zasoby, które zawierają sprzedaż w dowolnej właściwości i które nie mają tagu Q1FY2013
sales AND tags<>"Q1FY2013"
Zwracanie wszystkich zasobów, które nie mają ekspertów ani przypisanej dokumentacji
not has:experts and not has:documentation