Proiectează o soluție de integrare a datelor și analiză cu Azure Synapse Analytics
Azure Synapse Analytics combină funcționalități ale analizei big data, stocării datelor la nivel enterprise și integrării datelor. Serviciul vă permite să rulați interogări pe date fără server sau date la scară. Azure Synapse suportă ingestia, explorarea, transformarea și gestionarea datelor și susține analiza pentru toate nevoile tale de BI și machine learning.
Lucruri de știut despre Azure Synapse Analytics
Azure Synapse Analytics implementează o arhitectură de procesare masiv paralelă (MPP) și are următoarele caracteristici.
Arhitectura Azure Synapse Analytics include un nod de control și un pool de noduri calcul.
Nodul de control este creierul arhitecturii. Este front-end-ul care interacționează cu toate aplicațiile. Nodurile de calcul furnizează puterea de calcul. Datele care urmează să fie procesate sunt distribuite uniform între noduri.
Trimiți interogări sub forma instrucțiunilor Transact-SQL, iar Azure Synapse Analytics le rulează.
Azure Synapse folosește o tehnologie numită PolyBase care îți permite să recuperezi și să interogezi date din surse relaționale și nerelaționale. Poți salva datele citite ca tabele SQL în serviciul Azure Synapse.
Components of Azure Synapse Analytics
Azure Synapse Analytics este compus din cele cinci elemente:
Azure Synapse SQL pool: Alege între pool-uri SQL dedicate pentru performanță și cost constante sau endpoint-uri SQL serverless pentru sarcini flexibile, la cerere.
Azure Synapse Spark pool: Rulează clustere Apache Spark pentru a procesa date folosind Python, Scala, SQL sau C#.
Azure Synapse Pipeline: Folosiți fluxuri de lucru ETL bazate pe cloud pentru a muta și transforma datele la scară largă, combinând mai multe surse dacă este necesar.
Azure Synapse Link: Conectează-te la Azure Cosmos DB pentru analize aproape în timp real asupra datelor operaționale.
Azure Synapse Studio: Lucrează într-un IDE central bazat pe web pentru a gestiona pool-urile SQL și Spark, pipeline-urile și legăturile de date.
Opțiuni analitice
Azure Synapse Analytics suportă o gamă largă de scenarii analitice. Pe măsură ce revizuiți tabelul, luați în considerare modul în care scenariile se aplică organizației Tailwind Traders.
| Analiză | Scenariu | Descriere |
|---|---|---|
| Descriptiv | Ce se întâmplă? | Azure Synapse aplică funcționalitatea dedicată a unui pool SQL care îți permite să creezi un depozit de date persistent pentru a analiza întrebările ce acum. Puteți utiliza pool-ul SQL serverless pentru a pregăti date din fișierele stocate într-un lac de date pentru a crea un depozit de date în mod interactiv. |
| Diagnosticare | De ce se întâmplă? | Poți folosi funcționalitatea serverless SQL pool din Azure Synapse pentru a explora interactiv datele dintr-un data lake. Pool-urile SQL serverless pot permite rapid unui utilizator să caute alte date care l-ar putea ajuta să înțeleagă de ce întrebări. |
| Predictive | Ce este probabil să se întâmple? | Azure Synapse Analytics folosește motorul său integrat Apache Spark și pool-urile Azure Synapse Spark pentru analiza predictivă. Combină această acțiune cu alte servicii, cum ar fi Azure Machine Learning Services și Azure Databricks pentru a vă ajuta să răspundeți la întrebările ce viitor. |
| Prescriptiv | Ce trebuie făcut? | Puteți utiliza date de analiză prescriptivă în timp real sau aproape în timp real pentru a vă ajuta să identificați soluții pentru întrebările dvs. Azure Synapse Analytics oferă această funcționalitate prin Apache Spark și Azure Synapse Link, precum și prin integrarea tehnologiilor de streaming precum Azure Stream Analytics. |
Scenariu de business
Să examinăm un scenariu în care compania servește clienților informații despre piața bursieră. Trebuie să furnizați o combinație de procesare în lot și în flux pentru a susține infrastructura Tailwind Traders. Datele actualizate pot fi utilizate pentru a ajuta la monitorizarea în timp real, unde este necesară o decizie instantanee pentru a lua decizii informate de cumpărare sau vânzare într-o fracțiune de secundă. Datele istorice sunt la fel de importante pentru o vizualizare a tendințelor de performanță. Ce fel de depozit de date și soluție de integrare a datelor ați recomanda pentru a oferi acces la fluxurile de date brute și la informațiile de afaceri pregătite derivate din aceste date? Cu Azure Synapse Analytics, poți prelua date din surse externe și apoi le poți transforma și agrega într-un format potrivit pentru procesarea analitică.
Lucruri de luat în considerare atunci când alegi Azure Data Factory sau Azure Synapse Analytics
Tabelul următor compară criteriile soluției de stocare pentru utilizarea Azure Data Factory cu Azure Synapse Analytics. Revizuiți criteriile și luați în considerare ce soluție este optimă pentru comercianții Tailwind.
| Compara | Azure Data Factory | Azure Synapse Analytics |
|---|---|---|
| Partajarea datelor | Datele pot fi partajate între diferite fabrici de date | Neacceptat |
| Șabloane de soluții | Șabloanele de soluții sunt furnizate împreună cu galeria de șabloane Azure Data Factory | Șabloanele de soluții sunt oferite în Centrul de Cunoștințe Synapse Workspace |
| Fluxuri între regiuni în timpul rulării integrării | Sunt acceptate fluxurile de date între regiuni | Neacceptat |
| Monitorizați datele | Monitorizarea datelor este integrată cu Azure Monitor | Jurnalele de diagnostic sunt disponibile în Azure Monitor |
| Monitorizarea lucrărilor Spark pentru fluxul de date | Neacceptat | Lucrările Spark pot fi monitorizate pentru fluxul de date utilizând pool-urile Spark Synapse |
Azure Synapse Analytics este o soluție ideală pentru multe alte scenarii. Luați în considerare următoarele opțiuni:
Luați în considerare varietatea surselor de date. Când ai diverse surse de date care folosesc Azure Synapse Analytics pentru activități ETL fără cod și flux de date.
Ia în considerare Machine Learning. Când ai nevoie să implementezi soluții de Machine Learning folosind Apache Spark, poți folosi Azure Synapse Analytics pentru suport integrat pentru Azure Machine Learning.
Luați în considerare integrarea lacului de date. Când aveți date existente stocate pe un lac de date și aveți nevoie de integrare cu Azure Data Lake și alte surse de intrare, Azure Synapse Analytics oferă o integrare fără întreruperi între cele două componente.
Luați în considerare analize în timp real. Când ai nevoie de analize în timp real, poți folosi funcții precum Azure Synapse Link pentru a analiza datele în timp real și a oferi informații.
Ia în considerare Microsoft Fabric. Microsoft recomandă Microsoft Fabric în locul noilor implementări Synapse.
Sfat
Află mai multe cu instruirea în ritm propriu, Introducere în analiza completă folosind Microsoft Fabric.