Data Catalog söksyntaxreferens

Azure Data Catalog är en fullständigt hanterad tjänst i Microsoft Azure som fungerar som ett system för registrering och identifiering av företagsdatakällor. Azure Data Catalog har funktioner som gör det möjligt för tekniska och icke-tekniska användare att identifiera, förstå och använda datakällor.

En viktig aspekt av dataidentifiering är möjligheten att söka efter datakällor som har registrerats i Azure Data Catalog. Azure Data Catalog har en kraftfull söksyntax som gör det möjligt för användare att enkelt skapa frågor som returnerar de data som användarna behöver.

Översikt över söksyntax

Azure Data Catalog sökningar liknar det som används av Microsoft Windows och Microsoft Outlook och bör vara bekant för användarna av dessa verktyg.

Frågetekniker

Teknik Användning Exempel
Grundläggande sökning Grundläggande sökning med ett eller flera söktermer. Resultatet returnerar tillgångar där ett eller flera av de angivna villkoren matchar en egenskap. sales data
Egenskapsomfång Returnera endast datakällor där söktermen matchas med den angivna egenskapen name:finance
Booleska operatorer Bredda eller begränsa en sökning med hjälp av booleska åtgärder finance NOT corporate
Gruppera med parenteser Gruppera delar av frågan med parenteser för logisk isolering, särskilt i kombination med booleska operatorer name:finance AND (tags:tag1 OR tags:tag2)
Jämförelseoperatorer Använda andra jämförelser än lika med för egenskaper som innehåller datum och numeriska datatyper creationTime>"11/05/2014"

Matchning, jämförelse och booleska operatorer

Nyckelord/symbol Exempel Funktion
: experts:user@domain.com tags:tag1 Använd egenskapsomfång och returnera endast de tillgångar där en viss egenskap innehåller texten som genomsöks. Semantiken för frågan är "prefixmatchning".
= name=Sales name="Soft Drink Sales" Tillåter att användaren anger en exakt matchning. Endast de tillgångar som innehåller egenskapen med exakt värdet för söktermen returneras.
<> experts<>user1 tags<>tag2 Operatorn "Inte lika med". Returnerar endast de tillgångar som inte har det värde som anges i sökfrågan.
"" "social security" Söker efter objekt som innehåller den exakta frasen social trygghet. Det finns ett specialfall för att använda citattecken. Om citattecken används med egenskapsomfång grupperar semantiken men inte exakt frasering. I det här fallet är beteendet detsamma som att ange den namngivna egenskapen två gånger. Exempel: name:"social security" hittar alla tillgångar som har en namnegenskap med ordet social i sig eller en namnegenskap med ordet säkerhet i sig.
() (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) Söker efter objekt som innehåller tag1 och tag2 eller som har namnet försäljning i databasen salesfy15. Används vanligtvis tillsammans med booleska operatorer
>,>= timestamp>"11/05/2014" Söker efter objekt med ett ändrat datum efter 2014-11-05.
<,<= timestamp<"11/05/2014" Söker efter objekt med ett datum före 2014-11-05.
NOT social NOT security Hittar objekt som innehåller sociala, men inte säkerhetsrelaterade.
AND social AND security Söker efter objekt som innehåller social- och säkerhetsinformation.
ELLER social OR security Söker efter objekt som innehåller social- eller säkerhetsinformation.
Hsa: has:tags has:description Tillåt filtrering och returnera endast de tillgångar där en viss egenskap har angetts (eller om egenskapen representerar en samling – den innehåller minst ett element).

Kommentarer

Prefixsemantik

Som standard görs alla sökningar i Azure Data Catalog med hjälp av en teknik som kallas prefixmatchningssemantik. Det innebär att alla sökord startar en matchning i början av tillgångens egenskaper.

Tänk dig till exempel två fiktiva tillgångar som är registrerade i Azure Data Catalog med följande namn:

  • SalesData
  • Säljare offerter

En sökning efter "försäljning" returnerar båda dessa tillgångar, eftersom namnen båda börjar med ordet "försäljning". Framtida versioner av Azure Data Catalog har stöd för exakta matchningsoperatorer.

Sökningar med egenskapsomfång

Azure Data Catalog-fråge grammatik har stöd för egenskapsomfång. I den aktuella förhandsversionen är egenskapsomfången skiftlägeskänsliga. Det innebär att för att frågan ska fungera måste den faktiska höljet för egenskapen i sökfrågan matcha det som finns i indexet.

Sökningar efter ogiltiga egenskaper (egenskaper som inte finns) resulterar i ett fel.

Citattecken fungerar på ett särskilt sätt när du använder egenskapsomfång. Citattecken i andra sammanhang indikerar exakt frasering. Men när citattecken används i egenskapsomfång grupperas semantiken. Gör till exempel name:"Sales Products" en fritextsökning som tittar på innehållet i namnegenskapen och letar efter "Försäljning" eller "Produkter". Därför är semantiken för: name:"Sales Products" exakt samma som name:Sales name:Products.

Den allmänna principen för egenskapsnamn i Sökbara egenskaper är camel-case, vilket innebär att första bokstaven är gemen och sedan var och en av ordets första bokstäver är versaler.

De mest användbara egenskaperna visas nedan.

Egenskap Användning Exempel
name Söker efter objekt där söktermen visas i datakällans namn name:finance
beskrivning Söker efter objekt där söktermen visas i beskrivningen av datakällan description:finance
objectType Söker efter objekt av en viss objekttyp, till exempel tabell, vy eller KPI objectType:table
sourceType Söker efter objekt av en viss typ av datakälla, till exempel SQL Server eller SQL Server Analysis Services flerdimensionella sourceType:"tabular"
tags Söker efter objekt där söktermen visas i datakällans taggar tags:finance
timestamp Söker efter objekt baserat på datum och tid då deras metadata senast ändrades timestamp:>"11/05/2014"
lastRegisteredTime Söker efter objekt baserat på datum och tid då deras metadata registrerades lastRegisteredTime:>"11/05/2014"
friendlyName Söker efter objekt där söktermen visas i det egna namnet på datakällan friendlyName: finance
Experter Söker efter objekt där datakällans expert matchar söktermen experts:user@example.com experts:user
termName Söker efter objekt där söktermen visas i affärsordlistetermer som tillämpas på datatillgången termName:marketing

Du kan också använda följande egenskapsnamn tillsammans med filtret "has:" för att kontrollera var tillgångar har specifika egenskaper inställda.

Egenskap Användning Exempel
förhandsvisa Söker efter objekt som innehåller förhandsgranskning has:preview
documentation (dokumentation) Söker efter objekt som innehåller dokumentation has:documentation
tableDataProfiles Söker efter objekt som har en tabellprofil (storlek, antal rader osv.) has:tableDataProfiles
columnsDataProfiles Söker efter objekt som har en kolumndataprofil (antal distinkta värden, min, max osv.) has:columnsDataProfiles

Sökexempel

I följande avsnitt visas några sökexempel.

Returnera alla tillgångar med "försäljning" i namnet

name:sales

Returnera alla tillgångar som registrerats efter 2015-04-20 som inkluderar "försäljning" i alla fastigheter

sales AND lastRegisteredTime&gt;"4/20/2015"

Returnera alla tillgångar som inkluderar försäljning i en egenskap och som inte har taggen Q1FY2013

sales AND tags&lt;&gt;"Q1FY2013"

Returnera alla tillgångar som inte har tilldelats experter eller dokumentation

not has:experts and not has:documentation