Co je Azure Data Lake Storage Gen1?
Poznámka
Azure Data Lake Storage Gen1 je teď vyřazený. Podívejte se na oznámení o vyřazení z provozu tady. Data Lake Storage Gen1 prostředky už nejsou přístupné. Pokud potřebujete zvláštní pomoc, kontaktujte nás.
Azure Data Lake Storage Gen1 je podnikové úložiště s hyperškálem pro analytické úlohy s velkými objemy dat. Azure Data Lake umožňuje zaznamenávat data libovolné velikosti, typu a rychlosti příjmu do jediného místa pro účely provozní a zjišťovací analýzy.
Data Lake Storage Gen1 je možné získat přístup z Hadoopu (k dispozici s clusterem HDInsight) pomocí rozhraní REST API kompatibilních s WebHDFS. Je navržená tak, aby umožňovala analýzu uložených dat, a je vyladěná na výkon pro scénáře analýzy dat. Data Lake Storage Gen1 zahrnuje všechny možnosti na podnikové úrovni: zabezpečení, možnosti správy, škálovatelnost, spolehlivost a dostupnost.
Klíčové funkce
Mezi klíčové funkce Data Lake Storage Gen1 patří následující:
Sestaveno pro Hadoop
Data Lake Storage Gen1 je systém souborů Apache Hadoop, který je kompatibilní se systémem souborů HDFS (Hadoop Distributed File System) a funguje s ekosystémem Hadoop. Vaše stávající aplikace nebo služby HDInsight, které používají rozhraní API WebHDFS, se můžou snadno integrovat s Data Lake Storage Gen1. Data Lake Storage Gen1 také zpřístupňuje rozhraní REST kompatibilní s WebHDFS pro aplikace.
Data uložená v Data Lake Storage Gen1 můžete snadno analyzovat pomocí analytických architektur Hadoop, jako je MapReduce nebo Hive. Clustery Azure HDInsight můžete zřídit a nakonfigurovat pro přímý přístup k datům uloženým v Data Lake Storage Gen1.
Neomezené úložiště, petabajtové soubory
Data Lake Storage Gen1 poskytuje neomezené úložiště a může ukládat různá data pro účely analýzy. Neukládá žádná omezení velikosti účtů, velikostí souborů ani objemu dat, která se dají uložit v datovém jezeře. Velikost jednotlivých souborů může být v rozsahu od kilobajtů až po petabajty. Data jsou trvale uložena vytvářením více kopií. Doba, po kterou mohou být data uložená v datovém jezeře, není nijak omezena.
Optimalizace výkonu pro analýzu velkých objemů dat
Data Lake Storage Gen1 je vytvořená pro provozování rozsáhlých analytických systémů, které vyžadují obrovskou propustnost pro dotazování a analýzu velkých objemů dat. Úložiště Data Lake rozděluje části souborů do několika jednotlivých serverů úložiště. Tím se zvyšuje propustnost čtení při paralelním čtení souboru pro provádění analýz dat.
Připravenost pro podniky: Vysoce dostupná a zabezpečená
Data Lake Storage Gen1 poskytuje standardní dostupnost a spolehlivost. Vaše datové prostředky se ukládají odolným způsobem díky vytváření redundantních kopií, které chrání před neočekávaným selháním.
Data Lake Storage Gen1 také poskytuje zabezpečení uložených dat na podnikové úrovni. Další informace najdete v tématu Zabezpečení dat v Azure Data Lake Storage Gen1.
Všechna data
Data Lake Storage Gen1 mohou ukládat jakákoli data ve svém nativním formátu, aniž by bylo nutné provádět předchozí transformace. Data Lake Storage Gen1 nevyžaduje, aby před načtením dat bylo definováno schéma, takže je na individuálním analytickém rozhraní, které bude interpretovat data a definovat schéma v době analýzy. Možnost ukládat soubory libovolných velikostí a formátů umožňuje Data Lake Storage Gen1 zpracovávat strukturovaná, částečně strukturovaná a nestrukturovaná data.
Data Lake Storage Gen1 kontejnery pro data jsou v podstatě složky a soubory. S uloženými daty pracujete pomocí sad SDK, Azure Portal a Azure PowerShell. Pokud vložíte data do úložiště pomocí těchto rozhraní a odpovídajících kontejnerů, můžete uložit libovolný typ dat. Data Lake Storage Gen1 neprovádí žádné zvláštní zpracování dat na základě typu uložených dat.
Zabezpečení dat
Data Lake Storage Gen1 používá k ověřování Microsoft Entra ID a seznamy řízení přístupu (ACL) ke správě přístupu k vašim datům.
Funkce | Popis |
---|---|
Authentication | Data Lake Storage Gen1 se integruje s Microsoft Entra ID pro správu identit a přístupu pro všechna data uložená v Data Lake Storage Gen1. Díky integraci Data Lake Storage Gen1 výhod všech funkcí Microsoft Entra, jako je vícefaktorové ověřování, podmíněný přístup, řízení přístupu na základě role v Azure, monitorování využití aplikací, monitorování zabezpečení a upozorňování atd. Data Lake Storage Gen1 podporuje protokol OAuth 2.0 pro ověřování v rámci rozhraní REST. Viz Data Lake Storage Gen1 ověřování. |
Řízení přístupu | Data Lake Storage Gen1 poskytuje řízení přístupu podporou oprávnění ve stylu POSIX vystavených protokolem WebHDFS. Seznamy ACL můžete povolit v kořenové složce, v podsložkách a v jednotlivých souborech. Další informace o tom, jak seznamy ACL fungují v kontextu Data Lake Storage Gen1, najdete v tématu Řízení přístupu v Data Lake Storage Gen1. |
Šifrování | Data Lake Storage Gen1 také poskytuje šifrování dat uložených v účtu. Nastavení šifrování zadáte při vytváření účtu Data Lake Storage Gen1. Můžete se rozhodnout, jestli chcete data šifrovat, nebo se rozhodnout pro žádné šifrování. Další informace najdete v tématu Šifrování v Data Lake Storage Gen1. Pokyny k poskytnutí konfigurace související s šifrováním najdete v tématu Začínáme s Data Lake Storage Gen1 používáním Azure Portal. |
Pokyny k zabezpečení dat v Data Lake Storage Gen1 najdete v tématu Zabezpečení dat v Azure Data Lake Storage Gen1.
Kompatibilita aplikací
Data Lake Storage Gen1 je kompatibilní s většinou opensourcových komponent v ekosystému Hadoop. Také se dobře integruje s dalšími službami Azure. Další informace o tom, jak používat Data Lake Storage Gen1 s opensourcovými komponentami a dalšími službami Azure, najdete na následujících odkazech:
- Seznam opensourcových aplikací interoperabilních s Data Lake Storage Gen1 najdete v tématu Aplikace a služby kompatibilní s Azure Data Lake Storage Gen1.
- Informace o tom, jak používat Data Lake Storage Gen1 s jinými službami Azure k zajištění širší škály scénářů, najdete v tématu Integrace s dalšími službami Azure.
- V tématu Scénáře použití Data Lake Storage Gen1 se dozvíte, jak používat Data Lake Storage Gen1 ve scénářích, jako je ingestování dat, zpracování dat, stahování dat a vizualizace dat.
Data Lake Storage Gen1 systému souborů
Data Lake Storage Gen1 je možné získat přístup prostřednictvím systému souborů AzureDataLakeFilesystem (adl://) v prostředích Hadoop (k dispozici v clusteru HDInsight). Aplikace a služby, které používají adl://, můžou využívat další optimalizace výkonu, které v současnosti nejsou v systému WebHDFS dostupné. Díky tomu vám Data Lake Storage Gen1 poskytuje flexibilitu, abyste mohli buď využít nejlepšího výkonu s doporučenou možností použití adl://, nebo zachovat stávající kód tím, že budete pokračovat v přímém používání rozhraní API WebHDFS. Azure HDInsight plně využívá systém AzureDataLakeFilesystem k zajištění nejlepšího výkonu při Data Lake Storage Gen1.
K datům v Data Lake Storage Gen1 můžete přistupovat pomocí .adl://<data_lake_storage_gen1_name>.azuredatalakestore.net
Další informace o tom, jak získat přístup k datům v Data Lake Storage Gen1, najdete v tématu Zobrazení vlastností uložených dat.