Mi az az adatkonvergálás?

A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!

A szervezeteknek képesnek kell lennie arra, hogy megvizsgálhassák az adatok előkészítéséhez és kezeléséhez szükséges kritikus üzleti adatokat, hogy pontos elemzést nyújtsanak a napról napra növekvő összetett adatokról. Az adatok előkészítésére azért van szükség, hogy a szervezetek különböző üzleti folyamatokban használják az adatokat, és csökkentsék az értékhez szükséges időt.

A Data Factory lehetővé teszi a kód nélküli adatelőkészítést felhőbeli léptékben, iteratív módon a Power Query használatával. A Data Factory integrálható a Power Query Online-nal, és folyamattevékenységként teszi elérhetővé a Power Query M-függvényeket.

A Data Factory lefordítja a Power Query Online Mashup Editor által létrehozott M-t a felhőbeli méretezés végrehajtására szolgáló Spark-kódra az M Azure Data Factory-Adatfolyam való fordításával. Az adatok Power Queryvel és adatfolyamokkal való kezelése különösen hasznos az adatmérnökök vagy a "civil adat integrátorok" számára.

Használati esetek

Gyors interaktív adatfeltárás és -előkészítés

Több adatmérnök és állampolgári adat integrátor interaktívan feltárhatja és előkészítheti az adathalmazokat felhőalapú méretekben. Az adattavakban lévő adatok mennyiségének, változatosságának és sebességének növekedésével a felhasználóknak hatékony módszerre van szükségük az adathalmazok feltárásához és előkészítéséhez. Előfordulhat például, hogy létre kell hoznia egy adatkészletet, amely "2017 óta minden ügyfél demográfiai információval rendelkezik az új ügyfelek számára". Nem egy ismert célhoz van megfeleltetve. Az adathalmazok felfedezése, átrendezése és előkészülete egy követelménynek való megfelelés érdekében, mielőtt közzétennénk azokat a tóban. A Wrangling gyakran kevésbé formális elemzési forgatókönyvekhez használatos. Az előtöredezett adathalmazok átalakításokhoz és gépi tanulási műveletekhez használhatók az alsóbb rétegben.

Kód nélküli agilis adatok előkészítése

A civil adat integrátorok az idejük több mint 60%-át az adatok keresése és előkészítése során töltik. Kódmentesen szeretnék elvégezni a működés hatékonyságát. Az olyan ismert eszközökkel, mint a Power Query Online, jelentősen skálázható módon bővíthetik, alakíthatják és tehetik közzé az adatokat az állampolgári adatbevándorlók. Az Azure Data Factoryben való váltás lehetővé teszi, hogy a jól ismert Power Query Online-adategyesítési szerkesztő lehetővé tegye a polgárok adatbevivői számára a hibák gyors kijavításának, az adatok szabványosításának és a kiváló minőségű adatok előállításának engedélyezését az üzleti döntések támogatásához.

Adatérvényesítés és -feltárás

A gyors elemzés érdekében vizuálisan kódmentesen vizsgálhatja az adatokat, hogy eltávolítsa az esetleges kiugró értékeket, rendellenességeket, és megfeleltethesse azokat egy alakzatnak.

Támogatott források

Connector Adatformátum Hitelesítés típusa
Azure Blob Storage CSV, Parquet, Excel Fiókkulcs, szolgáltatásnév, MSI
1. generációs Azure Data Lake Storage CSV, Parquet, Excel Szolgáltatásnév, MSI
Azure Data Lake Storage Gen2 CSV, Parquet, Excel Fiókkulcs, szolgáltatásnév, MSI
Azure SQL Database - SQL-hitelesítés, MSI, szolgáltatásnév
Azure Synapse Analytics - SQL-hitelesítés, MSI, szolgáltatásnév

A mashup editor

Power Query-tevékenység létrehozásakor minden forrásadatkészlet adathalmaz-lekérdezéssé válik, és az ADFResource mappába kerül. Alapértelmezés szerint a UserQuery az első adathalmaz-lekérdezésre mutat. Minden átalakítást el kell végezni a UserQueryben, mivel az adathalmaz-lekérdezések módosításai nem támogatottak, és nem is maradnak meg. A lekérdezések átnevezése, hozzáadása és törlése jelenleg nem támogatott.

Wrangling

Jelenleg nem minden Power Query M-függvény támogatott az adatkonvergáláshoz annak ellenére, hogy a létrehozás során elérhető. A Power Query-tevékenységek létrehozásakor a következő hibaüzenet jelenik meg, ha egy függvény nem támogatott:

The Power Query Spark Runtime does not support the function

A támogatott átalakításokról további információt a Power Query adatmegváltó függvényei című témakörben talál.

Megtudhatja, hogyan hozhat létre adatösszesítő Power Query-összefésülést.