Beskriva Azure Synapse Analytics SQL

Slutförd

Med Azure Synapse SQL kan du implementera informationslagerlösningar eller utföra datavirtualisering.

Ett informationslager är en central komponent i BUSINESS Intelligence-lösningar (BI) som tillhandahåller en central lagringsplats med data som lagras i relationstabeller. Det underlättar lösningar kring beskrivande analys. Data hämtas, rensas och transformeras från en rad olika källdatasystem och hanteras sedan i ett strukturerat relationsformat som vanligtvis kallas ett star-schema.

Relational star schema

Data i ett informationslager lagras i permanenta tabeller som fylls i med hjälp av en ETL-process (extrahering, transformering och inläsning) av tjänster som Azure Synapse-pipelines eller Azure Data Factory. Därför måste du förstå de data som lagras i källsystemen, hur de ska tas emot i informationslagret, vilket i sin tur avgör hur du ska rensa eller transformera data.

Med datavirtualisering kan du interagera med data utan att behöva förstå hur data formateras, struktureras eller vad som är dess datatyp. Det gör att du kan utforska data utan att förstå de tekniska specifikationerna för källdata, vilket kan vara till stor hjälp när du utför diagnostikanalys där behovet av att komma åt data i tid för att besvara en fråga är viktigare.

Datavirtualisering möjliggör även scenarier för ad hoc-dataförberedelse, där organisationer vill låsa upp insikter från sina egna datalager utan att gå igenom de formella processerna för att konfigurera ett informationslager. Du kan extrahera data från ett källsystem i ett rådataformat och läsa in dem i en datasjö. Härifrån kan transformeringar tillämpas för att presentera data efter behov. Eftersom den mest komplexa delen av elt-processen (extract, load, and transform) är i slutet innebär det att åtkomsten till data är mycket snabbare.

Data virtualization

För att uppfylla leveransen av dessa typer av lösningar erbjuder Azure Synapse SQL både en dedikerad och serverlös modell av tjänsten för att uppfylla de olika kraven för båda lösningarna.

Den dedikerade modellen kallas dedikerade SQL-pooler. Den refererar till de datalagerfunktioner som är allmänt tillgängliga i Azure Synapse Analytics. Dedikerade SQL-pooler representerar en samling analysresurser som etableras när du använder Synapse SQL. När du behöver förutsägbara prestanda och kostnader är det bästa sättet att skapa dedikerade SQL-pooler för att reservera bearbetningskraft för data som lagras permanent i SQL-tabeller i ett informationslager den bästa metoden.

Den serverlösa modellen är perfekt för oplanerade eller ad hoc-arbetsbelastningar som diagnostikanalysmetoden skulle generera. Därför, om du utför datautforskning, förbereder data för datavirtualisering, skulle SQL Serverless vara den bättre modellen att använda.