Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A nézet egy írásvédett objektum, amely egy Unity Catalog-metaadattár egy vagy több táblájára és nézetére vonatkozó lekérdezés eredménye. Több sémában és katalógusban lévő táblákból és más nézetekből is létrehozhat nézetet.
Ez a cikk ismerteti a Azure Databricks létrehozható nézeteket, és ismerteti a lekérdezéshez szükséges engedélyeket és számításokat.
A nézetek létrehozásával kapcsolatos információkért lásd:
- Nézetek létrehozása
- Metrikanézetek létrehozása
- Materializált nézetek
- dinamikus nézetek
Nézetek a Unity Catalogban
A Unity Catalogban a nézetek a háromszintű névtér harmadik szintjén (catalog.schema.view):
összpontosít.
A nézet egy lekérdezés szövegét általában egy vagy több adatforráson vagy táblán tárolja a metaadattárban. Az Azure Databricksben a nézet egyenértékű egy Spark DataFrame-rel, amely objektumként van tárolva egy sémában. A DataFrame-ekkel ellentétben az Azure Databricks bármely pontjáról lekérdezheti a nézeteket, feltéve, hogy rendelkezik erre engedéllyel. A nézet létrehozása nem dolgoz fel és nem ír adatokat. A társított sémában csak a lekérdezés szövege van regisztrálva a metaadattárban.
Feljegyzés
A nézetek eltérő végrehajtási szemantikával rendelkezhetnek, ha a Delta-tábláktól eltérő adatforrások is alátámasztják őket. A Databricks azt javasolja, hogy mindig adjon meg nézeteket úgy, hogy adatforrásokra hivatkozik egy tábla vagy nézetnév használatával. Az adathalmazok nézeteinek elérési út vagy URI megadásával történő meghatározása zavaró adatszabályozási követelményekhez vezethet.
Metrika nézetek
A Unity Catalog metrikanézetei olyan újrafelhasználható üzleti metrikákat határoznak meg, amelyek központilag karbantartottak és elérhetők a munkaterület összes felhasználója számára. A metrikanézet absztrakciót alkalmaz a gyakran használt KPI-k (például bevétel, ügyfélszám vagy konverziós arány) mögött, így folyamatosan lekérdezhetők az irányítópultok, jegyzetfüzetek és jelentések között. Minden metrikanézet egy forrástáblán, nézeten vagy SQL-lekérdezésen alapuló mértékeket és dimenziókat határoz meg. A metrikanézetek a YAML-ben vannak definiálva, és sql használatával kérdezhetők le.
A metrikanézetek használatával csökkenthetők a metrikadefiníciók inkonzisztenciái, amelyek egyébként több eszköz és munkafolyamat között duplikálhatók. További információt a Metrikák nézeteiben talál.
Materializált nézetek
A materializált nézetek növekményesen kiszámítják és frissítik a definiáló lekérdezés által visszaadott eredményeket. A Azure Databricks materializált nézetei a Delta-táblák speciális típusai. Míg a Azure Databricks összes többi nézete úgy számítja ki az eredményeket, hogy kiértékeli a nézetet lekérdezéskor definiáló logikát, a materializált nézetek feldolgozzák az eredményeket, és egy mögöttes táblában tárolják őket, amikor a frissítések feldolgozása frissítési ütemezéssel vagy folyamatfrissítés futtatásával történik.
Materializált nézeteket regisztrálhat a Unity Catalogban a Databricks SQL használatával, vagy definiálhatja őket a Lakeflow Spark Deklaratív folyamatok részeként. Lásd: Materializált nézetek használata a Databricks SQL-ben és a Lakeflow Spark Deklaratív folyamatokban.
Ideiglenes nézetek
Az ideiglenes nézet hatóköre és megőrzése korlátozott, és nincs regisztrálva sémában vagy katalógusban. Az ideiglenes nézet élettartama a használt környezettől függően eltérő:
- A jegyzetfüzetekben és a feladatokban az ideiglenes nézetek hatóköre a jegyzetfüzet vagy a szkript szintjére terjed ki. Nem hivatkozhatók azon a jegyzetfüzeten kívül, amelyben deklarálva vannak, és megszűnnek létezni, amikor a jegyzetfüzet leválik a fürtről.
- A Databricks SQL-ben az ideiglenes nézetek hatóköre a lekérdezési szintre terjed ki. Az ugyanabban a lekérdezésben több utasítás is használhatja az ideiglenes nézetet, de más lekérdezésekben nem hivatkozhat rá, még ugyanazon az irányítópulton belül sem.
Dinamikus nézetek
A dinamikus nézetek az adatmaszkolás mellett sor- és oszlopszintű hozzáférés-vezérlést is biztosítanak. Lásd: Dinamikus nézet létrehozása.
Nézetek a Hive metaadattárában (örökölt)
Az örökölt Hive-nézeteket bármely adatforráshoz definiálhatja, és regisztrálhatja őket az örökölt Hive-metaadattárban. A Databricks azt javasolja, hogy migrálja az összes régi Hive-nézetet a Unity Catalogba. Lásd: Nézetek a Hive metaadattárában.
Hive globális ideiglenes nézet (régi)
A globális ideiglenes nézetek egy örökölt Azure Databricks funkció, amely lehetővé teszi a számítási erőforráson futó összes számítási feladat számára elérhető ideiglenes nézet regisztrálását. A globális átmeneti nézetek a Hive és a HDFS hagyományos örökségét képezik. A Databricks nem javasolja a globális ideiglenes nézetek használatát.
Nézetek lekérdezésére vonatkozó követelmények
A Unity Katalógusban regisztrált nézetek olvasásához a szükséges engedélyek a számítási típustól, a Databricks Futtatókörnyezet verziójától és a hozzáférési módtól függnek.
Feljegyzés
Minden nézet esetében az engedélyellenőrzések mind a nézeten, mind az alapul szolgáló táblákon és nézeteken történnek. Az a felhasználó, akinek az engedélyeit a mögöttes táblák és nézetek esetében ellenőrizni kell, a számítási környezettől függ. A következők esetében a Unity Catalog ellenőrzi a nézet tulajdonosának engedélyeit a mögöttes adatokon:
- SQL-raktárak.
- Standard számítás (korábban megosztott számítás).
- Dedikált számítás (korábban egyfelhasználós számítás) a Databricks Runtime 15.4 LTS-en és újabb verziókon, részletes hozzáférés-vezérléssel engedélyezve.
A Databricks Runtime 15.3-at és újabb verziót futtató dedikált számításhoz a Unity Catalog ellenőrzi a nézet tulajdonosának engedélyeit és a felhasználó jogosultságait a mögöttes adatokon.
Ez a viselkedés az alábbi követelményekben is tükröződik. Mindkét esetben a nézet tulajdonosának fenn kell tartania az alapul szolgáló adatokra vonatkozó engedélyeket ahhoz, hogy a felhasználók hozzáférjenek a nézethez.
- Az összes számítási erőforrás esetében magán a nézeten
SELECT, a szülőkatalógusbanUSE CATALOG, és a szülősémábanUSE SCHEMAkell lennie. Ez a Unity Catalogot támogató összes számítási erőforrás típusra vonatkozik, beleértve az SQL-raktárakat, a normál hozzáférési módú fürtöket és a dedikált hozzáférési módú fürtöket a Databricks Runtime 15.4-es vagy újabb verzióin. - A Dedikált hozzáférési módot használó, Databricks Runtime 15.3-as és annál korábbi verziókon futó fürtök esetében szükséges
SELECTjoggal rendelkezni minden olyan táblán és nézeten, amelyet a nézet hivatkozik, valamintUSE CATALOGjoggal a szülőkatalógusokon ésUSE SCHEMAjoggal a szülősémákon.
Feljegyzés
Ha dedikált fürtöt használ a Databricks Runtime 15.4 LTS-en és újabb verziókon, és el szeretné kerülni, hogy a mögöttes táblákon és nézeteken szükség legyen SELECT -re, ellenőrizze, hogy a munkaterület engedélyezve van-e a kiszolgáló nélküli számításhoz.
A kiszolgáló nélküli számítás kezeli az adatszűrést, amely lehetővé teszi a nézethez való hozzáférést anélkül, hogy engedélyre van szüksége a mögöttes táblákhoz és nézetekhez. Vegye figyelembe, hogy kiszolgáló nélküli számítási díjakat vonhat maga után, amikor dedikált számítást használ a nézetek lekérdezéséhez. További információ: Részletes hozzáférés-vezérlés dedikált számításon.