Bezserverový fond SQL ve službě Azure Synapse Analytics
Každý pracovní prostor Azure Synapse Analytics obsahuje bezserverové koncové body fondu SQL, které můžete použít k dotazování dat v Azure Data Lake (Parquet, Delta Lake, formáty textu s oddělovači), Azure Cosmos DB nebo Dataverse.
Bezserverový fond SQL je dotazovací služba pro data v datovém jezeře. Umožňuje přístup k datům prostřednictvím následujících funkcí:
- Známá syntaxe T-SQL pro dotazování dat bez nutnosti kopírovat nebo načítat data do specializovaného úložiště. Další informace najdete v části Podpora T-SQL.
- Integrované připojení prostřednictvím rozhraní T-SQL, které nabízí širokou škálu nástrojů pro business intelligence a ad hoc dotazování, včetně nejoblíbenějších ovladačů. Další informace najdete v části Klientské nástroje. Další informace najdete ve videu Úvod do bezserverových fondů SQL Synapse.
Bezserverový fond SQL je distribuovaný systém pro zpracování dat vytvořený pro rozsáhlé datové a výpočetní funkce. Bezserverový fond SQL umožňuje analyzovat velké objemy dat v řádu sekund až minut v závislosti na úloze. Díky integrované odolnosti proti chybám spouštění dotazů poskytuje systém vysokou spolehlivost a úspěšnost i pro dlouhotrvající dotazy zahrnující velké datové sady.
Bezserverový fond SQL je bezserverový, a proto není k dispozici žádná infrastruktura pro nastavení ani clustery, které by bylo potřeba udržovat. Součástí každého pracovního prostoru Azure Synapse je výchozí koncový bod pro tuto službu, takže můžete začít s dotazováním dat okamžitě po vytvoření pracovního prostoru.
Za rezervované prostředky se neúčtují žádné poplatky. Za data zpracovávaná dotazy, které spouštíte, se účtují jenom poplatky, a proto se jedná o skutečný model s platbami za použití.
Pokud ve svém datovém kanálu používáte Apache Spark pro Azure Synapse, pro přípravu, čištění nebo rozšiřování dat, můžete dotazovat externí tabulky Sparku, které jste v procesu vytvořili, přímo z bezserverového fondu SQL. Pomocí služby Private Link přeneste koncový bod bezserverového fondu SQL do virtuální sítě spravovaného pracovního prostoru.
Výhody bezserverového fondu SQL
Pokud potřebujete prozkoumat data v datovém jezeře, získejte z něj přehled nebo optimalizujte stávající kanál transformace dat, můžete využít bezserverový fond SQL. Je vhodný pro následující scénáře:
- Základní zjišťování a zkoumání – rychle zdůvodnění dat v různých formátech (Parquet, CSV, JSON) ve vašem datovém jezeře, abyste mohli naplánovat, jak z nich extrahovat přehledy.
- Logický datový sklad – Poskytuje relační abstrakci nad nezpracovaná nebo různorodá data, aniž by bylo potřeba data přemístit a transformovat, což umožňuje vždy aktuální zobrazení dat. Přečtěte si další informace o vytváření logického datového skladu.
- Transformace dat – jednoduchý, škálovatelný a výkonný způsob, jak transformovat data v jezeře pomocí T-SQL, aby je bylo možné doručovat do BI a dalších nástrojů nebo je načíst do relačního úložiště dat (databáze Synapse SQL, Azure SQL Database atd.).
Různé profesionální role můžou využívat bezserverový fond SQL:
- Datoví technici mohou prozkoumat jezero, transformovat a připravit data pomocí této služby a zjednodušit jejich kanály transformace dat. Další informace najdete v tomto kurzu.
- Datoví vědci mohou rychle zdůvodnět obsah a strukturu dat v jezeře díky funkcím, jako je OPENROWSET a automatické odvozování schématu.
- Datoví analytici mohou zkoumat data a externí tabulky Sparku vytvořené Datoví vědci nebo Datoví technici pomocí známého jazyka T-SQL nebo jejich oblíbených nástrojů, které se můžou připojit k bezserverovém fondu SQL.
- Odborníci na BI můžou rychle vytvářet sestavy Power BI nad daty v tabulkách Lake a Spark.
Jak začít používat bezserverový fond SQL
Koncový bod bezserverového fondu SQL se poskytuje v rámci každého pracovního prostoru Azure Synapse. Pracovní prostor můžete vytvořit a začít dotazovat data okamžitě pomocí nástrojů, které znáte.
Ujistěte se, že používáte osvědčené postupy pro dosažení nejlepšího výkonu.
Klientské nástroje
Bezserverový fond SQL umožňuje stávající ad hoc dotazování SQL a nástroje business intelligence pro přístup k datovému jezeře. Protože poskytuje známou syntaxi T-SQL, každý nástroj schopný navázat připojení TDS k nabídkám SQL se může připojit k Synapse SQL a dotazovat se na něj. Můžete se připojit pomocí Azure Data Studia a spouštět ad hoc dotazy nebo se připojit pomocí Power BI, abyste získali přehledy během několika minut.
Podpora T-SQL
Bezserverový fond SQL nabízí oblast dotazování T-SQL, která je mírně rozšířená nebo rozšířená v některých aspektech, aby vyhovovala prostředím pro dotazování na částečně strukturovaná a nestrukturovaná data. Některé aspekty jazyka T-SQL se navíc nepodporují kvůli návrhu bezserverového fondu SQL, například funkce DML se v současné době nepodporují.
- Úlohy je možné uspořádat pomocí známých konceptů:
- Databáze – koncový bod bezserverového fondu SQL může mít více databází.
- Schémata – V databázi může existovat jedna nebo mnoho skupin vlastnictví objektů, které se nazývají schémata.
- Zobrazení, uložené procedury, funkce hodnot vložených tabulek
- Externí prostředky – zdroje dat, formáty souborů a tabulky
Zabezpečení je možné vynutit pomocí:
- Přihlášení a uživatelé
- Přihlašovací údaje pro řízení přístupu k účtům úložiště
- Udělení, odepření a odvolání oprávnění na úrovni objektu
- Integrace Microsoft Entra
Podporovaný jazyk T-SQL:
- Podporuje se úplná oblast povrchu SELECT , včetně většiny funkcí SQL.
- CETAS – VÝBĚR VYTVOŘENÍ EXTERNÍ TABULKY
- Příkazy DDL související s zobrazeními a pouze zabezpečením
Bezserverový fond SQL nemá žádné místní úložiště, pouze objekty metadat jsou uloženy v databázích. T-SQL související s následujícími koncepty se proto nepodporuje:
- Tabulky
- Aktivační události
- Materializovaná zobrazení
- Jiné příkazy DDL než příkazy související se zobrazeními a zabezpečením
- Příkazy DML
Poznámka:
Dotazy bezserverového fondu SQL mají časový limit. Další informace o vypršení časového limitu dotazu, který může ovlivnit vaši úlohu, najdete v tématu omezení systému bezserverového fondu SQL. V současné době nemůžete časový limit změnit.
Rozšíření
Aby bylo možné zajistit bezproblémové prostředí pro dotazování dat umístěných v souborech v datovém jezeře, bezserverový fond SQL rozšiřuje stávající funkci OPENROWSET přidáním následujících funkcí:
Dotazování na více souborů nebo složek
Analytické úložiště Azure Cosmos DB
Čtení vybrané podmnožině sloupců
Práce se složitými typy a vnořenými nebo opakovanými datovými strukturami
Zabezpečení
Bezserverový fond SQL nabízí mechanismy pro zabezpečení přístupu k vašim datům.
Integrace Microsoft Entra a vícefaktorové ověřování
Bezserverový fond SQL umožňuje centrálně spravovat identity uživatelů databáze a dalších služby Microsoft s integrací Microsoft Entra. Tato možnost zjednodušuje správu oprávnění a zvyšuje zabezpečení. Microsoft Entra ID podporuje vícefaktorové ověřování (MFA) za účelem zvýšení zabezpečení dat a aplikací při podpoře procesu jednotného přihlašování.
Ověřování
Ověřování bezserverového fondu SQL označuje, jak uživatelé při připojování ke koncovému bodu prokázali svou identitu. Podporují se dva typy ověřování:
Ověřování SQL
Tato metoda ověřování používá uživatelské jméno a heslo.
Ověřování Microsoft Entra:
Tato metoda ověřování používá identity spravované id Microsoft Entra. Pro uživatele Microsoft Entra je možné povolit vícefaktorové ověřování. Kdykoliv to půjde, použijte ověřování pomocí Active Directory (integrované zabezpečení).
Autorizace
Autorizace odkazuje na to, co může uživatel dělat v bezserverové databázi fondu SQL a řídí se členstvími rolí databáze vašeho uživatelského účtu a oprávněními na úrovni objektů.
Pokud se používá ověřování SQL, uživatel SQL existuje pouze v bezserverovém fondu SQL a oprávnění jsou vymezena na objekty v bezserverovém fondu SQL. Přístup k zabezpečitelným objektům v jiných službách (například Azure Storage) nelze udělit uživateli SQL přímo, protože existuje pouze v oboru bezserverového fondu SQL. Uživatel SQL musí pro přístup k souborům použít jeden z podporovaných typů autorizace.
Pokud se používá ověřování Microsoft Entra, může se uživatel přihlásit k bezserverovém fondu SQL a dalším službám, jako je Azure Storage, a může udělit oprávnění uživateli Microsoft Entra.
Přístup k účtům úložiště
Uživatel, který je přihlášený ke službě bezserverového fondu SQL, musí mít oprávnění k přístupu k souborům a dotazování na soubory ve službě Azure Storage. Bezserverový fond SQL podporuje následující typy autorizace:
Sdílený přístupový podpis (SAS) poskytuje delegovaný přístup k prostředkům v účtu úložiště. Pomocí sdíleného přístupového podpisu můžete klientům udělit přístup k prostředkům v účtu úložiště bez sdílení klíčů účtu. Sas poskytuje podrobnou kontrolu nad typem přístupu, který udělujete klientům, kteří mají SAS: interval platnosti, udělená oprávnění, přijatelný rozsah IP adres, přijatelný protokol (https/http).
Identita uživatele (označovaná také jako "průchozí") je typ autorizace, kde se identita uživatele Microsoft Entra, který se přihlásil k bezserverovém fondu SQL, slouží k autorizaci přístupu k datům. Před přístupem k datům musí správce služby Azure Storage udělit oprávnění uživateli Microsoft Entra pro přístup k datům. Tento typ autorizace používá uživatele Microsoft Entra, který se přihlásil do bezserverového fondu SQL, a proto se nepodporuje pro typy uživatelů SQL.
Identita pracovního prostoru je typ autorizace, kde se identita pracovního prostoru Synapse používá k autorizaci přístupu k datům. Před přístupem k datům musí správce služby Azure Storage udělit oprávnění identitě pracovního prostoru pro přístup k datům.
Přístup ke službě Azure Cosmos DB
Pro přístup k analytickému úložišti Azure Cosmos DB potřebujete vytvořit přihlašovací údaje na úrovni serveru nebo databáze s klíčem jen pro čtení účtu služby Azure Cosmos DB.
Další kroky
Další informace o připojení ke koncovému bodu a dotazování souborů najdete v následujících článcích: