Skratky oneLake
Skratky v službe Microsoft OneLake umožňujú zjednotenie údajov v rámci domén, cloudov a kont vytvorením jediného virtuálneho dátového jazera pre celý podnik. Všetky skúsenosti so službou Fabric a analytické nástroje sa môžu priamo pripojiť k vašim existujúcim zdrojom údajov, ako sú Azure, Amazon Web Services (AWS) a OneLake prostredníctvom zjednoteného priestoru názvov. OneLake spravuje všetky povolenia a poverenia, takže nie je potrebné samostatne nakonfigurovať každú vyťaženie služby Fabric, aby ste sa mohli pripojiť ku každému zdroju údajov. Okrem toho môžete použiť odkazy na odstránenie okrajových kópií údajov a zníženie latencie procesu, ktorá sa spája s kópiami údajov a fázou.
Čo sú skratky?
Skratky sú objekty v službe OneLake, ktoré smerujú na iné miesta úložiska. Umiestnenie môže byť interné alebo externé pre OneLake. Umiestnenie, na ktoré odkaz odkazuje, sa označuje ako cieľová cesta odkazu. Miesto, kde sa odkaz zobrazí, je známe ako cesta odkazu. Skratky sa zobrazia ako priečinky v službe OneLake a môžete ich použiť vo všetkých vyťaženiach alebo službách, ktoré majú prístup k službe OneLake. Skratky sa správajú ako symbolické prepojenia. Sú to nezávislé objekty od cieľa. Ak skratku odstránite, cieľ zostane nezmenený. Ak presuniete, premenujete alebo odstránite cieľovú cestu, odkaz môže porušiť.
Kde môžem vytvárať skratky?
Skratky môžete vytvoriť v databázach lakehouses a Kusto Query Language (KQL). Okrem toho môžu odkazy, ktoré vytvoríte v rámci týchto položiek, smerovať na iné umiestnenia OneLake, službu Azure Data Lake Storage (ADLS) Gen2, kontá úložiska Amazon S3 alebo Dataverse. Môžete dokonca vytvoriť odkazy na lokálne alebo na obmedzené miesta so sieťou s použitím lokálnej brány údajov služby Fabric (OPDG).
Používateľské rozhranie služby Fabric môžete použiť na interaktívne vytváranie skratiek a pomocou rozhrania REST API môžete vytvárať klávesové skratky pomocou programovania.
Lakehouse
Pri vytváraní skratiek v objekte lakehouse musíte pochopiť štruktúru priečinkov položky. Služby Lakehouses sa skladajú z dvoch priečinkov najvyššej úrovne: priečinka Tables (Tabuľky) a priečinka Files ( Súbory ). Priečinok Tables predstavuje spravovanú časť jazera, zatiaľ čo priečinok Files tvorí nespravovanú časť úložného jazera. V priečinku Tabuľky môžete vytvoriť iba odkazy na najvyššej úrovni. Skratky nie sú podporované v iných podadresároch priečinka Tabuľky . Ak cieľ odkazu obsahuje údaje vo formáte Delta\Parquet, lakehouse automaticky synchronizuje metaúdaje a rozpozná priečinok ako tabuľku. V priečinku Súbory sa nedajú žiadne obmedzenia týkajúce sa toho, kde môžete vytvárať odkazy. Môžete ich vytvoriť na ľubovoľnej úrovni hierarchie priečinkov. Vyhľadávanie tabuliek sa neuskupí v priečinku Súbory .
Databáza KQL
Keď vytvoríte odkaz v databáze KQL, zobrazí sa v priečinku Shortcuts (Skratky ) databázy. Databáza KQL zaobchádza s odkazmi ako s externými tabuľkami. Ak chcete odkaz dotazovať, použite external_table
funkciu jazyka dotazu Kusto.
Kde môžem získať prístup k odkazom?
Akékoľvek služby fabric alebo non-Fabric, ktoré môžu získať prístup k údajom v službe OneLake, môžu používať klávesové skratky. Skratky sú transparentné pre akúkoľvek službu, ktorá pristupuje k údajom prostredníctvom rozhrania API OneLake. Skratky sa zobrazia ako ďalší priečinok v úložiske Lake. Apache Spark, SQL, Real-Time Intelligence a Analysis Services môžu pri dotazovaní údajov používať skratky.
Apache Spark
Notebooky Apache Spark a Apache Spark môžu používať skratky, ktoré vytvoríte v službe OneLake. Cesty relatívnych súborov možno použiť na priame čítanie údajov z odkazov. Okrem toho, ak vytvoríte odkaz v časti Tabuľky na jazere a je vo formáte Delta, môžete ju prečítať ako spravovanú tabuľku pomocou syntaxe Apache Spark SQL.
df = spark.read.format("delta").load("Tables/MyShortcut")
display(df)
df = spark.sql("SELECT * FROM MyLakehouse.MyShortcut LIMIT 1000")
display(df)
Poznámka
Formát Delta nepodporuje tabuľky s medzerami v názve. Žiadna skratka obsahujúca medzeru v názve nebude objavená ako tabuľka Delta v úchyte jazera.
SQL
Môžete si tiež prečítať odkazy v sekcii Tabuľky domov jazera cez koncový bod analýzy SQL pre lakehouse. Ku koncovému bodu SQL Analytics môžete získať prístup prostredníctvom selektora režimu jazera alebo prostredníctvom nástroja SQL Server Management Studio (SSMS).
SELECT TOP (100) *
FROM [MyLakehouse].[dbo].[MyShortcut]
Inteligencia v reálnom čase
Skratky v databázach KQL sú rozpoznané ako externé tabuľky. Ak chcete odkaz dotazovať, použite external_table
funkciu jazyka dotazu Kusto.
external_table('MyShortcut')
| take 100
Analysis Services
Môžete vytvoriť sémantické modely pre úžináreň lakehouse, ktoré obsahujú skratky v sekcii Tabuľky v úžine lakehouse. Keď je sémantický model spustený v režime Direct Lake, služba Analysis Services môže čítať údaje priamo z odkazu.
Non-Fabric
Aplikácie a služby mimo služby Fabric môžu tiež získať prístup k odkazom prostredníctvom rozhrania API OneLake. OneLake podporuje podmnožinu rozhraní ADLS Gen2 a rozhrania API ukladacieho priestoru objektu Blob. Ďalšie informácie o rozhraní API OneLake nájdete v téme Prístup do služby OneLake s rozhraniami API.
https://onelake.dfs.fabric.microsoft.com/MyWorkspace/MyLakhouse/Tables/MyShortcut/MyFile.csv
Typy skratiek
Skratky OneLake podporujú viacero zdrojov údajov systému súborov. Patria sem interné umiestnenia OneLake, Azure Data Lake Storage (ADLS) Gen2, Amazon S3, S3 Compatible, Google Cloud Storage(GCS) a Dataverse.
Interné skratky OneLake
Interné skratky OneLake vám umožňujú odkazovať na údaje v rámci existujúcich položiek služby Fabric. Medzi tieto položky patria domovy lakehouse, databázy KQL a dátové sklady. Odkaz môže odkazovať na umiestnenie priečinka v rámci tej istej položky v rámci položiek v rámci toho istého pracovného priestoru alebo dokonca naprieč položkami v rôznych pracovných priestoroch. Keď vytvoríte odkaz na položky, typy položiek sa nemusia zhodovať. Môžete napríklad vytvoriť odkaz v úchyte jazera, ktorá odkazuje na údaje v sklade údajov.
Keď používateľ pristupuje k údajom prostredníctvom odkazu na iné miesto v službe OneLake, identita volajúceho používateľa sa použije na oprávnenie prístupu k údajom v cieľovej ceste skratky*. Tento používateľ musí mať povolenia na čítanie údajov v cieľovom umiestnení.
Dôležité
Pri prístupe k odkazom prostredníctvom sémantických modelov služby Power BI alebo T-SQL sa identita volajúceho používateľa neprenesie do cieľa odkazu. Namiesto toho sa odovzdáva identita vlastníka volajúceho položky, ktorá delegovala prístup volajúcemu používateľovi.
Skratky ADLS
Skratky možno vytvoriť aj na kontá úložiska ADLS Gen2. Keď vytvoríte odkazy na ADLS, cieľová cesta môže smerovať na ľubovoľný priečinok v rámci hierarchického priestoru názvov. Cieľová cesta musí aspoň obsahovať názov kontajnera.
Access
Skratky ADLS musia odkazovať na koncový bod DFS pre konto úložiska.
Príklad: https://accountname.dfs.core.windows.net/
Ak je vaše konto úložiska chránené bránou firewall úložiska, môžete nakonfigurovať dôveryhodný prístup k službe. Pozrite si tému Dôveryhodný prístup k pracovnému priestoru
Oprávnenie
Skratky ADLS používajú delegovaný model oprávnenia. V tomto modeli tvorca odkazu určuje poverenia pre odkaz ADLS a celý prístup k tejto odkaze je oprávnený pomocou tohto poverenia. Podporované delegované typy sú konto organizácie, kľúč konta, podpis zdieľaného prístupu (SAS) a objekt služby.
- Konto organizácie – musí mať rolu vlastníka údajov ukladacieho priestoru OBJEKTU BLOB, prispievateľa údajov ukladacieho priestoru objektu BLOB alebo vlastníka údajov ukladacieho priestoru objektu BLOB v konte úložiska
- Podpis zdieľaného prístupu (SAS) – musí obsahovať aspoň nasledujúce povolenia: Čítanie, Zoznam a Vykonanie
- Objekt služby – musí mať čítačku údajov ukladacieho priestoru objektu BLOB, prispievateľa údajov ukladacieho priestoru objektu BLOB alebo rolu vlastníka údajov ukladacieho priestoru objektu BLOB v konte úložiska
- Identita pracovného priestoru – musí mať čítačku údajov ukladacieho priestoru objektu BLOB, prispievateľa údajov ukladacieho priestoru objektu BLOB alebo rolu vlastníka údajov ukladacieho priestoru objektu BLOB v konte úložiska
Poznámka
Musíte mať povolené hierarchické priestory názvov vo vašom konte úložiska ADLS Gen2.
Skratky S3
Môžete tiež vytvoriť odkazy na kontá Amazon S3. Keď vytvoríte odkazy na Amazon S3, cieľová cesta musí obsahovať minimálne názov kontajnera. S3 natívne nepodporuje hierarchické priestory názvov, ale môžete použiť predpony na napodobňovanie štruktúry adresárov. Predpony môžete zahrnúť do cesty odkazu, aby ste mohli ďalej zúžiť rozsah údajov prístupných prostredníctvom odkazu. Pri prístupe k údajom prostredníctvom skratky S3 sú predpony zastúpené ako priečinky.
Access
Skratky S3 musia odkazovať na koncový bod https pre sektor S3.
Príklad: https://bucketname.s3.region.amazonaws.com/
Poznámka
Nie je potrebné zakázať nastavenie S3 Block Public Access pre vaše konto S3 pre odkaz S3 na funkciu.
Prístup ku koncovému bodu S3 nesmie byť blokovaný bránou firewall úložiska ani virtuálnym súkromným cloudom.
Oprávnenie
Skratky S3 používajú delegovaný model oprávnenia. V tomto modeli tvorca odkazu určuje poverenia pre odkaz S3 a celý prístup k tejto odkazu je oprávnený pomocou tohto poverenia. Podporované delegované prihlasovacie údaje sú kľúčom a tajným kľúčom používateľa služby IAM.
Používateľ IAM musí mať nasledujúce povolenia v kontajneri, na ktorý odkaz ukazuje.
S3:GetObject
S3:GetBucketLocation
S3:ListBucket
Poznámka
Skratky S3 sú iba na čítanie. Nepodporujú operácie zapisovania bez ohľadu na povolenia používateľa IAM.
Skratky ukladacieho priestoru Google Cloud Storage
Odkazy je možné vytvoriť v službe Google Cloud Storage(GCS) pomocou rozhrania XML API pre GCS. Keď vytvoríte odkazy na úložisko Google Cloud Storage, cieľová cesta musí obsahovať minimálne názov kontajnera. Rozsah odkazu môžete tiež obmedziť zadaním predpony/priečinka, na ktorý chcete odkazovať v hierarchii úložiska.
Access
Pri konfigurácii pripojenia odkazu na GCS môžete buď zadať globálny koncový bod pre službu úložiska, alebo použiť konkrétny koncový bod kontajnera.
- Príklad globálneho koncového bodu:
https://storage.googleapis.com
- Príklad koncového bodu špecifického kontajnera:
https://<BucketName>.storage.googleapis.com
Oprávnenie
Skratky GCS používajú delegovaný model oprávnenia. V tomto modeli tvorca odkazu určuje poverenia pre odkaz GCS a celý prístup k tejto odkazu je oprávnený pomocou tohto poverenia. Podporované delegované poverenia sú kľúčom HMAC a tajným kľúčom konta služby alebo používateľského konta.
Konto musí mať povolenie na prístup k údajom v kontajneri GCS. Ak sa v pripojení pre odkaz použil konkrétny koncový bod kontajnera, konto musí mať nasledujúce povolenia:
storage.objects.get
stoage.objects.list
Ak sa v pripojení pre odkaz použil globálny koncový bod, konto musí mať tiež nasledujúce povolenie:
storage.buckets.list
Poznámka
Skratky GCS sú iba na čítanie. Nepodporujú operácie zapisovania bez ohľadu na povolenia používaného konta.
Skratky služby Dataverse
Priama integrácia služby Dataverse so službou Microsoft Fabric umožňuje organizáciám rozšíriť svoje Dynamics 365 podnikové aplikácie a podnikové procesy do služby Fabric. Táto integrácia sa vykonáva pomocou skratiek, ktoré možno vytvoriť dvoma spôsobmi: prostredníctvom portálu tvorcu služby PowerApps alebo priamo cez službu Fabric.
Vytváranie odkazov prostredníctvom portálu PowerApps Maker
Oprávnení používatelia služby PowerApps majú prístup k portálu tvorcu služby PowerApps a používajú funkciu Prepojenie na Microsoft Fabric . Z tejto jednej akcie sa v službe Fabric vytvorí lakehouse a pre každú tabuľku v prostredí Dataverse sa automaticky vygenerujú skratky. Ďalšie informácie nájdete v téme Priama integrácia platformy Dataverse so službou Microsoft Fabric.
Vytváranie skratiek prostredníctvom služby Fabric
Používatelia služby Fabric môžu tiež vytvoriť odkazy na funkciu Dataverse. V používateľských rozhraniach na vytváranie skratiek môžu používatelia vybrať položku Dataverse, zadať URL adresu svojho prostredia a prehľadávať dostupné tabuľky. Toto prostredie umožňuje používateľom selektívne vybrať tabuľky, ktoré sa majú preniesť do služby Fabric namiesto uvedenia všetkých tabuliek.
Poznámka
Tabuľky Dataverse musia byť najprv k dispozícii v uxverznom spravovanom jazere predtým, než sú viditeľné v rozhraní služby Fabric na vytváranie skratiek. Ak sa v službe Fabric nezobrazujú vaše tabuľky, použite funkciu Prepojenie na službu Microsoft Fabric na portáli tvorcu služby PowerApps.
Oprávnenie
Skratky Dataverse používajú delegovaný model oprávnenia. V tomto modeli tvorca odkazu určuje poverenia pre odkaz Dataverse a celý prístup k tejto odkazu je oprávnený pomocou tohto poverenia. Podporovaným delegovaným typom poverení je konto organizácie (OAuth2). Konto organizácie musí mať povolenie správcu systému na prístup k údajom v úlomku Dataverse Managed Lake.
Poznámka
Objekty služby pridané do pracovného priestoru tkaniny musia mať rolu správcu na autorizáciu odkazu Dataverse.
Caching
Používanie odkazu na ukladanie do vyrovnávacej pamäte sa dá použiť na zníženie nákladov výstupov spojených s prístupom ku údajom medzi cloudmi. Pri čítaní súborov pomocou externej skratky sa súbory ukladajú do vyrovnávacej pamäte pracovného priestoru služby Fabric. Následné požiadavky na čítanie sa odosielajú z vyrovnávacej pamäte a nie z poskytovateľa vzdialeného úložiska. Súbory vo vyrovnávacej pamäti majú obdobie uchovávania 24 hodín. Pri každom prístupe k súboru sa obdobie uchovávania údajov obnoví. Ak je súbor vo vzdialenom úložisku novší ako súbor vo vyrovnávacej pamäti, požiadavka sa odošle od poskytovateľa vzdialeného úložiska a aktualizovaný súbor sa uloží do vyrovnávacej pamäte. Ak k súboru nebol prístup viac ako 24hodín, z vyrovnávacej pamäte sa vymaže. Jednotlivé súbory, ktoré sú väčšie ako 1 GB, sa neuchovajú vo vyrovnávacej pamäti.
Poznámka
Ukladanie odkazov do vyrovnávacej pamäte je v súčasnosti podporované len pre skratky kompatibilné so službami GCS, S3 a S3.
Ak chcete povoliť ukladanie skratiek do vyrovnávacej pamäte, otvorte panel Nastavenia pracovného priestoru. Vyberte kartu OneLake. Prepnite nastavenie vyrovnávacej pamäte do zapnutej a vyberte položku Uložiť.
Ako skratky využívajú cloudové pripojenia
Oprávnenie ADLS a S3 shortcut sa delegujú pomocou cloudových pripojení. Keď vytvoríte novú skratku ADLS alebo S3, vytvoríte nové pripojenie alebo vyberiete existujúce pripojenie pre zdroj údajov. Nastavenie pripojenia pre odkaz je operácia naviazania. Operáciu naviazať môžu iba používatelia s povolením na pripojenie. Ak nemáte povolenia na pripojenie, nemôžete vytvárať nové skratky pomocou tohto pripojenia.
Zabezpečenie odkazu
Skratky vyžadujú určité povolenia na správu a používanie. Zabezpečenie OneLake shortcut sa zaoberá povoleniami potrebnými na vytváranie skratiek a na prístup k údajom, ktoré ich používajú.
Ako skratky riešia odstránenia?
Skratky nevykonávajú kaskádové odstraňovanie. Keď v odkaze vykonáte operáciu odstránenia, odstránite iba objekt odkazu. Údaje v cieli odkazu zostanú nezmenené. Ak však vykonáte operáciu odstránenia v súbore alebo priečinku v rámci odkazu a máte povolenia v cieli odkazu na vykonanie operácie odstránenia, súbory a/alebo priečinky sa v cieli odstránia. Tento bod je znázornený v nasledujúcom príklade.
Odstránenie príkladu
Používateľ A má v službe lakehouse nasledujúcu cestu:
MyLakehouse\Files\MyShortcut\Foo\Bar
MyShortcut je skratka, ktorá odkazuje na konto služby ADLS Gen2, ktoré obsahuje adresáre Foo\Bar .
Odstránenie objektu odkazu
Používateľ A vykoná operáciu odstránenia na nasledujúcej ceste:
MyLakehouse\Files\MyShortcut
V tomto prípade je MyShortcut odstránený z jazera. Skratky nevykonávajú kaskádové odstraňovanie, a preto súbory a adresáre v konte služby ADLS Gen2 Foo\Bar zostanú nezmenené.
Odstránenie obsahu, na ktorý odkazuje skratka
Používateľ A vykoná operáciu odstránenia na nasledujúcej ceste:
MyLakehouse\Files\MyShortcut\Foo\Bar
V tomto prípade, ak používateľ A má povolenia na zápis v konte ADLS Gen2, pruhový adresár sa odstráni z konta ADLS Gen2.
Zobrazenie pôvodu pracovného priestoru
Pri vytváraní odkazov medzi viacerými položkami služby Fabric v rámci pracovného priestoru môžete vizualizovať vzťahy skratiek prostredníctvom zobrazenia pôvodu pracovného priestoru. Vyberte tlačidlo zobrazenia Pôvod ( ) v pravom hornom rohu prieskumníka pracovného priestoru.
Poznámka
Zobrazenie pôvodu je obmedzené na jeden pracovný priestor. Odkazy na miesta mimo vybratého pracovného priestoru sa nezobrazia.
Obmedzenia a dôležité informácie
- Maximálny počet skratiek na položku služby Fabric je 100 000. V tomto kontexte položka výrazu odkazuje na: aplikácie, jazerá, sklady, zostavy a ďalšie.
- Maximálny počet skratiek v jednej ceste OneLake je 10.
- Maximálny počet priamych odkazov na prepojenia odkazu je 5.
- Cieľové cesty SDLS a S3 nemôžu obsahovať žiadne vyhradené znaky z RFC 3986 sekcie 2.2. Povolené znaky nájdete v časti 2.3 nástroja RFC 3968.
- Názvy odkazov OneLake, nadradené cesty a cieľové cesty nemôžu obsahovať znaky "%" alebo "+".
- Skratky nepodporujú znaky iné ako latinka.
- Kopírovať rozhranie API objektu Blob nie je podporované pre skratky ADLS alebo S3.
- Funkcia Kopírovať nefunguje skratiek, ktoré priamo odkazujú na kontajnery ADLS. Odporúča sa vytvoriť skratky ADLS k adresáru, ktorý je aspoň o jednu úroveň pod kontajnerom.
- Ďalšie skratky nie je možné vytvárať v rámci skratiek ADLS alebo S3.
- Pôvod odkazov na sklady údajov a sémantické modely nie je momentálne k dispozícii.
- Rozpoznanie nových skratiek môže trvať až minútu, kým rozhranie API tabuľky rozpozná.