Megosztás:


Táblák és nézetek az Azure Databricksben

Ez a cikk áttekintést nyújt az Azure Databricksben található táblákról, nézetekről, streamelő táblákról és materializált nézetekről.

Asztal

A táblák egy adott helyen tárolt strukturált adatkészletek. Az Azure Databricksben létrehozott alapértelmezett táblatípus egy Unity Catalog által felügyelt tábla. A táblák lekérdezhetők és kezelhetők SQL-parancsokkal vagy DataFrame API-kkal, amelyek támogatják az olyan műveleteket, mint a INSERT, UPDATE, DELETEés MERGE INTO. Az Azure Databricks-táblák megtekintése

Megtekintés

A nézet egy lekérdezés által meghatározott virtuális tábla, amely nem tárol adatokat, és egy vagy több táblából származó adatokat jeleníthet meg egy adott formátumban vagy absztrakcióban. A nézetek hasznosak az összetett lekérdezések leegyszerűsítéséhez, az üzleti logika beágyazásához, valamint a mögöttes adatok konzisztens felületének biztosításához a tárolás duplikálása nélkül. Lásd : Mi az a nézet?

Materializált nézet

A nézethez hasonlóan a materializált nézetet egy lekérdezés határozza meg. A nézetekkel ellentétben azonban a materializált nézet előre lefordítja és tárolja a lekérdezés eredményét. A lekérdezések gyorsabban futhatnak a materializált nézetekkel szemben, mint a nézetek, de további tárterületet is igénybe vehetnek. A Databricks SQL használatával önálló materializált nézetet hozhat létre és frissíthet, vagy a Lakeflow Spark deklaratív folyamataival létrehozhat és frissíthet egy vagy több materializált nézetet, streamelési táblázatot és nézetet. Lásd: Materializált nézetek használata a Databricks SQL-ben és Materializált nézetek.

Adatfolyam tábla

A streamelő táblák a Unity Catalog felügyelt tábláinak egy típusa, amely magában foglalja a folyamatokat használó feldolgozási logikát annak definiálásához. A Databricks SQL használatával önálló streamtáblát hozhat létre és frissíthet, vagy a Lakeflow Spark Déclaratív Pipeline-eket használva létrehozhat és frissíthet egy vagy több streamtáblát, materializált nézetet és nézeteket. Lásd streamelési táblák használata a Databricks SQL-ben és streamelési táblákat.

Materializált nézet vs. folyamatos adatfolyam táblázat

A materializált nézetek és a streamelési táblák két gyakori adatobjektumok az adatelemzéshez. A materializált nézetek kötegelt szemantikát használnak, a streamelési táblák pedig streamelési szemantikát használnak. A batch és a streamelés összehasonlítását, valamint az adatelemzési számítási feladatokhoz való kiválasztásával kapcsolatos szempontokat lásd: Batch és streamelési adatfeldolgozás az Azure Databricksben.