Microsoft Fabric terminológia

Megismerheti a Microsoft Fabricben használt kifejezések definícióit, beleértve a Synapse Data Warehouse-ra, a Synapse adatmérnök ingre, a Synapse Adattudomány- és a Synapse Real-Time Analyticsre, a Data Factoryre és a Power BI-ra vonatkozó kifejezéseket.

Általános feltételek

  • Kapacitás: A kapacitás egy dedikált erőforráskészlet, amely egy adott időpontban használható. A kapacitás határozza meg, hogy egy erőforrás képes-e tevékenység elvégzésére vagy kimenet létrehozására. A különböző elemek egy adott időpontban eltérő kapacitást használnak fel. A Fabric kapacitást kínál a Fabric termékváltozatán és próbaverzióján keresztül. További információ: Mi a kapacitás?

  • Tapasztalat: Adott funkciókra vonatkozó képességek gyűjteménye. A Háló-szolgáltatások közé tartozik a Synapse Data Warehouse, a Synapse adatmérnök ing, a Synapse Adattudomány, a Synapse Valós idejű elemzés, a Data Factory és a Power BI.

  • Elem: Egy elem egy felhasználói felületen belüli képességek készlete. A felhasználók létrehozhatják, szerkeszthetik és törölhetik őket. Minden elemtípus különböző képességeket biztosít. Az adatmérnök például a lakehouse, a jegyzetfüzet és a Spark-feladatdefiníció elemeit is tartalmazza.

  • Bérlő: A bérlő a Szervezet Hálójának egyetlen példánya, és egy Microsoft Entra-azonosítóval van összhangban.

  • Munkaterület: A munkaterület olyan elemek gyűjteménye, amelyek egyetlen, együttműködésre tervezett környezetben egyesítik a különböző funkciókat. Tárolóként működik, amely kapacitást használ a végrehajtott munkához, és vezérlőket biztosít, hogy ki férhet hozzá a benne lévő elemekhez. Például egy munkaterületen a felhasználók jelentéseket, jegyzetfüzeteket, szemantikai modelleket stb. hoznak létre. További információ: Munkaterületek cikk.

Synapse Data Engineering

  • Lakehouse: A lakehouse fájlok, mappák és táblák gyűjteménye, amelyek egy adatbázist képviselnek az Apache Spark motor és az SQL-motor által a big data feldolgozáshoz használt data lake-en keresztül. A lakehouse továbbfejlesztett képességeket tartalmaz az ACID-tranzakciókhoz a nyílt forráskódú Delta formátumú táblák használatakor. A lakehouse-elem egy egyedi munkaterületi mappában található a Microsoft OneLake-ben. Különböző formátumú (strukturált és strukturálatlan) fájlokat tartalmaz mappákba és almappákba rendezve. További információ: Mi az a tóház?

  • Jegyzetfüzet: A Fabric-jegyzetfüzet egy többnyelvű interaktív programozási eszköz, gazdag függvényekkel. Ezek közé tartozik a kód és a markdown létrehozása, a Spark-feladatok futtatása és monitorozása, az eredmények megtekintése és vizualizációja, valamint a csapattal való együttműködés. Segít az adatmérnököknek és az adatelemzőknek az adatok feltárásában és feldolgozásában, valamint gépi tanulási kísérletek létrehozásában kóddal és alacsony kódszámú felhasználói felülettel. Könnyen átalakítható folyamattevékenységgé vezénylés céljából.

  • Spark-alkalmazás: Az Apache Spark-alkalmazások olyan programok, amelyeket a felhasználók a Spark API-nyelveinek (Scala, Python, Spark SQL vagy Java) vagy a Microsoft által hozzáadott nyelvek (.NET C# vagy F# használatával) használatával írtak. Amikor egy alkalmazás fut, egy vagy több Spark-feladatra van osztva, amelyek párhuzamosan futnak az adatok gyorsabb feldolgozásához. További információ: Spark-alkalmazásfigyelés.

  • Apache Spark-feladat: A Spark-feladat egy Spark-alkalmazás része, amely párhuzamosan fut az alkalmazás többi feladatával. A feladatok több tevékenységből állnak. További információ: Spark-feladatok monitorozása.

  • Apache Spark-feladatdefiníció: A Spark-feladatdefiníciók a felhasználó által beállított paraméterek, amelyek azt jelzik, hogyan kell futtatni egy Spark-alkalmazást. Lehetővé teszi kötegelt vagy streamelési feladatok küldését a Spark-fürtbe. További információ: Mi az Apache Spark-feladatdefiníció?

  • V-order: Írásoptimalizálás a parquet fájlformátumra, amely gyors olvasást tesz lehetővé, és költséghatékonyságot és jobb teljesítményt biztosít. Alapértelmezés szerint minden Fabric-motor v-ordered parquet fájlokat ír.

Data Factory

  • Csatlakozás or: A Data Factory számos olyan összekötőt kínál, amelyek lehetővé teszik a különböző típusú adattárakhoz való csatlakozást. A csatlakozás után átalakíthatja az adatokat. További információ: összekötők.

  • Adatfolyam: A Data Factoryben egy adatfolyamot használnak az adatáthelyezés és -átalakítás vezénylésére. Ezek a folyamatok eltérnek a Fabric üzembehelyezési folyamatától. További információ: Folyamatok a Data Factory áttekintésében.

  • Adatfolyam Gen2: Az adatfolyamok alacsony kódú felületet biztosítanak több száz adatforrásból származó adatok betöltéséhez és az adatok átalakításához. A Fabric adatfolyamait adatfolyam Gen2-nek nevezzük. Az 1. generációs adatfolyam a Power BI-ban létezik. A Dataflow Gen2 további képességeket kínál az Azure Data Factoryben vagy a Power BI-ban futó adatfolyamokhoz képest. Nem frissíthet Gen1-ről Gen2-re. További információ: Adatfolyamok a Data Factory áttekintésében.

Synapse Data Science

  • Data Wrangler: A Data Wrangler egy jegyzetfüzet-alapú eszköz, amely magával ragadó élményt nyújt a felhasználóknak a feltáró adatelemzés elvégzéséhez. A funkció a rácsszerű adatmegjelenítést dinamikus összefoglaló statisztikákkal és gyakori adattisztítási műveletekkel kombinálja, és mindegyik elérhető néhány kiválasztott ikonnal. Minden művelet olyan kódot hoz létre, amelyet újrahasználható szkriptként menthet vissza a jegyzetfüzetbe.

  • Kísérlet: A gépi tanulási kísérlet az összes kapcsolódó gépi tanulási futtatás szervezetének és vezérlésének elsődleges egysége. További információ: Gépi tanulási kísérletek a Microsoft Fabricben.

  • Modell: A gépi tanulási modellek olyan fájlok, amelyek bizonyos típusú minták felismerésére vannak betanítve. Betanít egy modellt egy adatkészleten, és egy olyan algoritmust biztosít neki, amelyet az adott adatkészletben való érveléshez és tanuláshoz használ. További információ: Gépi tanulási modell.

  • Futtatás: A futtatás a modellkód egyetlen végrehajtásának felel meg. Az MLflow-ban a nyomkövetés kísérleteken és futtatásokon alapul.

Synapse adattárház

  • SQL Analytics-végpont: Minden Lakehouse rendelkezik egy SQL Analytics-végponttal, amely lehetővé teszi a felhasználó számára, hogy tSQL-en keresztül lekérdezhesse a deltatáblák adatait. További információ: SQL Analytics-végpont.

  • Synapse Data Warehouse: A Synapse Adattárház hagyományos adattárházként működik, és támogatja a vállalati adattárházaktól elvárható teljes tranzakciós T-SQL-képességeket. További információ: Synapse Data Warehouse.

Synapse Real-Time Analytics

  • KQL-adatbázis: A KQL-adatbázis olyan formátumban tárolja az adatokat, amelyeken KQL-lekérdezéseket hajthat végre. További információ: KQL-adatbázis lekérdezése.

  • KQL-lekérdezéskészlet: A KQL-lekérdezéskészlet a lekérdezések futtatására, az eredmények megtekintésére és a lekérdezések eredményeinek módosítására szolgál az Adatkezelő adatbázisából származó adatokon. A lekérdezéskészlet tartalmazza az adatbázisokat és táblákat, a lekérdezéseket és az eredményeket. A KQL-lekérdezéskészlet lehetővé teszi a lekérdezések későbbi használatra való mentését, illetve a lekérdezések exportálását és megosztását másokkal. További információ: Lekérdezési adatok a KQL-lekérdezéskészletben

  • Eseménystream: A Microsoft Fabric eseménystreamek szolgáltatása központi helyet biztosít a Fabric platformon a valós idejű események rögzítéséhez, átalakításához és átirányításához a célhelyekre kód nélküli felülettel. Az eseménystreamek különböző streamelési adatforrásokból, betöltési célhelyekből és eseményfeldolgozóból állnak, amikor szükség van az átalakításra. További információ: Microsoft Fabric eseménystreamek.

OneLake

  • Parancsikon: A parancsikonok olyan beágyazott hivatkozások a OneLake-ben, amelyek más fájltároló helyekre mutatnak. Lehetővé teszik a meglévő adatokhoz való csatlakozást anélkül, hogy közvetlenül át kellene másolniuk őket. További információ: OneLake billentyűparancsok.