Proiectează o soluție de integrare a datelor și analiză cu Azure Synapse Analytics

Finalizat

Azure Synapse Analytics combină funcționalități ale analizei big data, stocării datelor la nivel enterprise și integrării datelor. Serviciul vă permite să rulați interogări pe date fără server sau date la scară. Azure Synapse suportă ingestia, explorarea, transformarea și gestionarea datelor și susține analiza pentru toate nevoile tale de BI și machine learning.

Lucruri de știut despre Azure Synapse Analytics

Azure Synapse Analytics implementează o arhitectură de procesare masiv paralelă (MPP) și are următoarele caracteristici.

  • Arhitectura Azure Synapse Analytics include un nod de control și un pool de noduri calcul.

    Diagramă care arată arhitectura Azure Synapse Analytics.

    Nodul de control este creierul arhitecturii. Este front-end-ul care interacționează cu toate aplicațiile. Nodurile de calcul furnizează puterea de calcul. Datele care urmează să fie procesate sunt distribuite uniform între noduri.

  • Trimiți interogări sub forma instrucțiunilor Transact-SQL, iar Azure Synapse Analytics le rulează.

  • Azure Synapse folosește o tehnologie numită PolyBase care îți permite să recuperezi și să interogezi date din surse relaționale și nerelaționale. Poți salva datele citite ca tabele SQL în serviciul Azure Synapse.

Components of Azure Synapse Analytics

Azure Synapse Analytics este compus din cele cinci elemente:

Diagramă care arată o prezentare generală a capabilităților Azure Synapse Analytics.

  • Azure Synapse SQL pool: Alege între pool-uri SQL dedicate pentru performanță și cost constante sau endpoint-uri SQL serverless pentru sarcini flexibile, la cerere.

  • Azure Synapse Spark pool: Rulează clustere Apache Spark pentru a procesa date folosind Python, Scala, SQL sau C#.

  • Azure Synapse Pipeline: Folosiți fluxuri de lucru ETL bazate pe cloud pentru a muta și transforma datele la scară largă, combinând mai multe surse dacă este necesar.

  • Azure Synapse Link: Conectează-te la Azure Cosmos DB pentru analize aproape în timp real asupra datelor operaționale.

  • Azure Synapse Studio: Lucrează într-un IDE central bazat pe web pentru a gestiona pool-urile SQL și Spark, pipeline-urile și legăturile de date.

Opțiuni analitice

Azure Synapse Analytics suportă o gamă largă de scenarii analitice. Pe măsură ce revizuiți tabelul, luați în considerare modul în care scenariile se aplică organizației Tailwind Traders.

Analiză Scenariu Descriere
Descriptiv Ce se întâmplă? Azure Synapse aplică funcționalitatea dedicată a unui pool SQL care îți permite să creezi un depozit de date persistent pentru a analiza întrebările ce acum. Puteți utiliza pool-ul SQL serverless pentru a pregăti date din fișierele stocate într-un lac de date pentru a crea un depozit de date în mod interactiv.
Diagnosticare De ce se întâmplă? Poți folosi funcționalitatea serverless SQL pool din Azure Synapse pentru a explora interactiv datele dintr-un data lake. Pool-urile SQL serverless pot permite rapid unui utilizator să caute alte date care l-ar putea ajuta să înțeleagă de ce întrebări.
Predictive Ce este probabil să se întâmple? Azure Synapse Analytics folosește motorul său integrat Apache Spark și pool-urile Azure Synapse Spark pentru analiza predictivă. Combină această acțiune cu alte servicii, cum ar fi Azure Machine Learning Services și Azure Databricks pentru a vă ajuta să răspundeți la întrebările ce viitor.
Prescriptiv Ce trebuie făcut? Puteți utiliza date de analiză prescriptivă în timp real sau aproape în timp real pentru a vă ajuta să identificați soluții pentru întrebările dvs. Azure Synapse Analytics oferă această funcționalitate prin Apache Spark și Azure Synapse Link, precum și prin integrarea tehnologiilor de streaming precum Azure Stream Analytics.

Scenariu de business

Să examinăm un scenariu în care compania servește clienților informații despre piața bursieră. Trebuie să furnizați o combinație de procesare în lot și în flux pentru a susține infrastructura Tailwind Traders. Datele actualizate pot fi utilizate pentru a ajuta la monitorizarea în timp real, unde este necesară o decizie instantanee pentru a lua decizii informate de cumpărare sau vânzare într-o fracțiune de secundă. Datele istorice sunt la fel de importante pentru o vizualizare a tendințelor de performanță. Ce fel de depozit de date și soluție de integrare a datelor ați recomanda pentru a oferi acces la fluxurile de date brute și la informațiile de afaceri pregătite derivate din aceste date? Cu Azure Synapse Analytics, poți prelua date din surse externe și apoi le poți transforma și agrega într-un format potrivit pentru procesarea analitică.

Lucruri de luat în considerare atunci când alegi Azure Data Factory sau Azure Synapse Analytics

Tabelul următor compară criteriile soluției de stocare pentru utilizarea Azure Data Factory cu Azure Synapse Analytics. Revizuiți criteriile și luați în considerare ce soluție este optimă pentru comercianții Tailwind.

Compara Azure Data Factory Azure Synapse Analytics
Partajarea datelor Datele pot fi partajate între diferite fabrici de date Neacceptat
Șabloane de soluții Șabloanele de soluții sunt furnizate împreună cu galeria de șabloane Azure Data Factory Șabloanele de soluții sunt oferite în Centrul de Cunoștințe Synapse Workspace
Fluxuri între regiuni în timpul rulării integrării Sunt acceptate fluxurile de date între regiuni Neacceptat
Monitorizați datele Monitorizarea datelor este integrată cu Azure Monitor Jurnalele de diagnostic sunt disponibile în Azure Monitor
Monitorizarea lucrărilor Spark pentru fluxul de date Neacceptat Lucrările Spark pot fi monitorizate pentru fluxul de date utilizând pool-urile Spark Synapse

Azure Synapse Analytics este o soluție ideală pentru multe alte scenarii. Luați în considerare următoarele opțiuni:

  • Luați în considerare varietatea surselor de date. Când ai diverse surse de date care folosesc Azure Synapse Analytics pentru activități ETL fără cod și flux de date.

  • Ia în considerare Machine Learning. Când ai nevoie să implementezi soluții de Machine Learning folosind Apache Spark, poți folosi Azure Synapse Analytics pentru suport integrat pentru Azure Machine Learning.

  • Luați în considerare integrarea lacului de date. Când aveți date existente stocate pe un lac de date și aveți nevoie de integrare cu Azure Data Lake și alte surse de intrare, Azure Synapse Analytics oferă o integrare fără întreruperi între cele două componente.

  • Luați în considerare analize în timp real. Când ai nevoie de analize în timp real, poți folosi funcții precum Azure Synapse Link pentru a analiza datele în timp real și a oferi informații.

  • Ia în considerare Microsoft Fabric. Microsoft recomandă Microsoft Fabric în locul noilor implementări Synapse.

Sfat

Află mai multe cu instruirea în ritm propriu, Introducere în analiza completă folosind Microsoft Fabric.