Mi az az adatkonvergálás?
A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics
Tipp.
Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!
A szervezeteknek képesnek kell lennie arra, hogy megvizsgálhassák az adatok előkészítéséhez és kezeléséhez szükséges kritikus üzleti adatokat, hogy pontos elemzést nyújtsanak a napról napra növekvő összetett adatokról. Az adatok előkészítésére azért van szükség, hogy a szervezetek különböző üzleti folyamatokban használják az adatokat, és csökkentsék az értékhez szükséges időt.
A Data Factory lehetővé teszi a kód nélküli adatelőkészítést felhőbeli léptékben, iteratív módon a Power Query használatával. A Data Factory integrálható a Power Query Online-nal, és folyamattevékenységként teszi elérhetővé a Power Query M-függvényeket.
A Data Factory lefordítja a Power Query Online Mashup Editor által létrehozott M-t a felhőbeli méretezés végrehajtására szolgáló Spark-kódra az M Azure Data Factory-Adatfolyam való fordításával. Az adatok Power Queryvel és adatfolyamokkal való kezelése különösen hasznos az adatmérnökök vagy a "civil adat integrátorok" számára.
Használati esetek
Gyors interaktív adatfeltárás és -előkészítés
Több adatmérnök és állampolgári adat integrátor interaktívan feltárhatja és előkészítheti az adathalmazokat felhőalapú méretekben. Az adattavakban lévő adatok mennyiségének, változatosságának és sebességének növekedésével a felhasználóknak hatékony módszerre van szükségük az adathalmazok feltárásához és előkészítéséhez. Előfordulhat például, hogy létre kell hoznia egy adatkészletet, amely "2017 óta minden ügyfél demográfiai információval rendelkezik az új ügyfelek számára". Nem egy ismert célhoz van megfeleltetve. Az adathalmazok felfedezése, átrendezése és előkészülete egy követelménynek való megfelelés érdekében, mielőtt közzétennénk azokat a tóban. A Wrangling gyakran kevésbé formális elemzési forgatókönyvekhez használatos. Az előtöredezett adathalmazok átalakításokhoz és gépi tanulási műveletekhez használhatók az alsóbb rétegben.
Kód nélküli agilis adatok előkészítése
A civil adat integrátorok az idejük több mint 60%-át az adatok keresése és előkészítése során töltik. Kódmentesen szeretnék elvégezni a működés hatékonyságát. Az olyan ismert eszközökkel, mint a Power Query Online, jelentősen skálázható módon bővíthetik, alakíthatják és tehetik közzé az adatokat az állampolgári adatbevándorlók. Az Azure Data Factoryben való váltás lehetővé teszi, hogy a jól ismert Power Query Online-adategyesítési szerkesztő lehetővé tegye a polgárok adatbevivői számára a hibák gyors kijavításának, az adatok szabványosításának és a kiváló minőségű adatok előállításának engedélyezését az üzleti döntések támogatásához.
Adatérvényesítés és -feltárás
A gyors elemzés érdekében vizuálisan kódmentesen vizsgálhatja az adatokat, hogy eltávolítsa az esetleges kiugró értékeket, rendellenességeket, és megfeleltethesse azokat egy alakzatnak.
Támogatott források
Connector | Adatformátum | Hitelesítés típusa |
---|---|---|
Azure Blob Storage | CSV, Parquet, Excel | Fiókkulcs, szolgáltatásnév, MSI |
1. generációs Azure Data Lake Storage | CSV, Parquet, Excel | Szolgáltatásnév, MSI |
Azure Data Lake Storage Gen2 | CSV, Parquet, Excel | Fiókkulcs, szolgáltatásnév, MSI |
Azure SQL Database | - | SQL-hitelesítés, MSI, szolgáltatásnév |
Azure Synapse Analytics | - | SQL-hitelesítés, MSI, szolgáltatásnév |
A mashup editor
Power Query-tevékenység létrehozásakor minden forrásadatkészlet adathalmaz-lekérdezéssé válik, és az ADFResource mappába kerül. Alapértelmezés szerint a UserQuery az első adathalmaz-lekérdezésre mutat. Minden átalakítást el kell végezni a UserQueryben, mivel az adathalmaz-lekérdezések módosításai nem támogatottak, és nem is maradnak meg. A lekérdezések átnevezése, hozzáadása és törlése jelenleg nem támogatott.
Jelenleg nem minden Power Query M-függvény támogatott az adatkonvergáláshoz annak ellenére, hogy a létrehozás során elérhető. A Power Query-tevékenységek létrehozásakor a következő hibaüzenet jelenik meg, ha egy függvény nem támogatott:
The Power Query Spark Runtime does not support the function
A támogatott átalakításokról további információt a Power Query adatmegváltó függvényei című témakörben talál.
Kapcsolódó tartalom
Megtudhatja, hogyan hozhat létre adatösszesítő Power Query-összefésülést.