OneLake, tüm kuruluşunuz için tek, birleşik, mantıksal bir veri gölüdür. Data Lake, çeşitli kaynaklardan gelen büyük hacimli verileri işler. OneDrive gibi OneLake de her Microsoft Fabric kiracısıyla birlikte otomatik olarak gelir ve tüm analiz verileriniz için tek bir yer olacak şekilde tasarlanmıştır. OneLake müşterileri getirir:
Kuruluşun tamamı için tek bir veri gölü
Birden çok analiz motoruyla kullanılmak üzere bir veri kopyası
Kuruluşun tamamı için tek bir veri gölü
OneLake'ten önce, birden çok kaynağı yönetme ek yüküyle bile müşterilerin tek bir göl üzerinde işbirliği yapmak yerine farklı iş grupları için birden çok göl oluşturması daha kolaydı. OneLake, işbirliğini geliştirerek bu zorlukları ortadan kaldırmaya odaklanır. Her müşteri kiracısı tam olarak bir OneLake'e sahiptir. Hiçbir zaman birden fazla olamaz ve Fabric'iniz varsa sıfır olamaz. Her Doku kiracısı, ayarlayıp yönetecek ek kaynak olmadan OneLake'i otomatik olarak sağlar.
İşbirliği için dağıtılmış sahiplikle varsayılan olarak yönetilir
Kiracı kavramı, SaaS hizmetinin benzersiz bir avantajıdır. Müşterinin kuruluşunun nerede başlayıp bittiğini bilmek, kiracı yöneticisinin denetimi altında olan doğal bir idare ve uyumluluk sınırı sağlar. OneLake'e gelen tüm veriler varsayılan olarak yönetilir. Tüm veriler kiracı yöneticisi tarafından belirlenen sınırlar içinde olsa da, bu yöneticinin kuruluşun diğer bölümlerinin OneLake'e katkıda bulunmasını engelleyen merkezi bir ağ geçidi denetleyicisi olmaması önemlidir.
Kiracı içinde istediğiniz sayıda çalışma alanı oluşturabilirsiniz. Çalışma alanları, kuruluşun farklı bölümlerinin sahiplik ve erişim ilkelerini dağıtmasını sağlar. Her çalışma alanı, belirli bir bölgeye bağlı olan ve ayrı olarak faturalandırılan bir kapasitenin parçasıdır.
Çalışma alanında veri öğeleri oluşturabilir ve OneLake'teki tüm verilere veri öğeleri aracılığıyla erişebilirsiniz. Office'in Word, Excel ve PowerPoint dosyalarını OneDrive'da depolama şekline benzer şekilde Doku, OneLake'de göl evleri, ambarlar ve diğer öğeleri depolar. Öğeler, bir göl evinde Apache Spark geliştirici deneyimi gibi her kişilik için özel deneyimler sağlayabilir.
OneLake'i kullanmaya başlama hakkında daha fazla bilgi için bkz . OneLake ile göl evi oluşturma.
Her düzeyde aç
OneLake her düzeyde açıktır. OneLake, Azure Data Lake Storage (ADLS) 2. Nesil'in üzerine kurulmuştur ve yapılandırılmış veya yapılandırılmamış her tür dosyayı destekleyebilir. Veri ambarları ve lakehouse'lar gibi tüm Doku veri öğeleri, verilerini Otomatik olarak OneLake'te Delta Parquet biçiminde depolar. Veri mühendisi Apache Spark kullanarak bir göle veri yüklerse ve sql geliştiricisi tam işlemsel veri ambarında veri yüklemek için T-SQL kullanırsa, her ikisi de aynı veri gölüne katkıda bulunur. OneLake, tüm tablosal verileri Delta Parquet biçiminde depolar.
OneLake, Azure Databricks de dahil olmak üzere mevcut ADLS 2. Nesil uygulamalarıyla uyumlu olması için aynı ADLS 2. Nesil API'lerini ve SDK'larını destekler. OneLake'deki verileri tüm kuruluş için büyük bir ADLS depolama hesabı gibi ele alabilirsiniz. Her çalışma alanı söz konusu depolama hesabı içinde bir kapsayıcı olarak görünür ve farklı veri öğeleri bu kapsayıcıların içinde klasör olarak görünür.
OneLake, veriler için OneDrive'dır. OneDrive'da olduğu gibi, Windows için OneLake dosya gezginini kullanarak OneLake verilerini Windows'tan kolayca keşfedebilirsiniz. Tüm çalışma alanlarınızda ve veri öğelerinizde gezinebilir, dosyaları Office'te yaptığınız gibi kolayca karşıya yükleyebilir, indirebilir veya değiştirebilirsiniz. OneLake dosya gezgini, veri gölleriyle çalışmayı basitleştirerek teknik olmayan iş kullanıcılarının bile bunları kullanmasını sağlar.
OneLake, veri taşıma veya yineleme olmadan tek bir veri kopyasından mümkün olan en yüksek değeri sağlamayı amaçlar. Artık verileri başka bir altyapıyla kullanmak veya siloları ayırmak için kopyalamanız gerekmez; böylece verileri diğer kaynaklardan alınan verilerle analiz edebilirsiniz.
Kısayollar, verileri veri taşımadan etki alanları arasında birbirine bağlar
Kısayollar, kuruluşunuzun bilgileri gereksiz yere taşımak ve çoğaltmak zorunda kalmadan kullanıcılar ve uygulamalar arasında kolayca veri paylaşmasına olanak tanır. Ekipler ayrı çalışma alanlarında bağımsız olarak çalıştığında, kısayollar farklı iş grupları ve etki alanlarındaki verileri kullanıcının özel ihtiyaçlarına uyacak şekilde bir sanal veri ürününde birleştirmenizi sağlar.
Kısayol, diğer dosya konumlarında depolanan verilere başvurudur. Bu dosya konumları aynı çalışma alanında veya farklı çalışma alanlarında, OneLake'te veya ADLS, S3 veya Dataverse'de OneLake'in dışında olabilir ve yakında daha fazla hedef konum sunulacaktır. Konum ne olursa olsun, kısayollar dosya ve klasörleri yerel olarak depolamış gibi gösterir.
Uygulamalarda depolama ve bilgi işlem ayrımı olsa da, veriler genellikle tek bir altyapı için iyileştirilir ve bu da aynı verilerin birden çok uygulama için yeniden kullanılmasını zorlaştırır. Doku ile farklı analiz altyapıları (T-SQL, Apache Spark, Analysis Services vb.) verileri açık Delta Parquet biçiminde depolar ve aynı verileri birden çok altyapıda kullanmanıza olanak tanır.
Artık verileri başka bir altyapıyla kullanmak için kopyalamaya gerek yoktur. Yapmaya çalıştığınız iş için her zaman en iyi altyapıyı seçebilirsiniz. Örneğin, tamamen işlemsel veri ambarı oluşturan bir SQL mühendisleri ekibiniz olduğunu düşünün. Tablolar oluşturmak, verileri dönüştürmek ve verileri tablolara yüklemek için T-SQL altyapısını ve T-SQL'in tüm gücünü kullanabilirler. Veri bilimcisi bu verileri kullanmak istiyorsa artık özel bir Spark/SQL sürücüsünden geçmesi gerekmez. OneLake tüm verileri Delta Parquet biçiminde depolar. Veri bilimcileri Spark altyapısının ve açık kaynak kitaplıklarının tüm gücünü doğrudan veriler üzerinde kullanabilir.
İş kullanıcıları, Analysis Services altyapısındaki yeni Direct Lake modunu kullanarak Doğrudan OneLake üzerinde Power BI raporları oluşturabilir. Analysis Services altyapısı, Power BI anlam modellerini güçlendiren altyapıdır ve her zaman iki veri erişimi modu sunar: içeri aktarma ve doğrudan sorgu. Direct Lake modu, kullanıcılara verileri kopyalamaya gerek kalmadan tüm içeri aktarma hızını sağlar ve en iyi içeri aktarma ve doğrudan sorguyu birleştirir. Daha fazla bilgi için bkz . Direct Lake.
Spark kullanarak veri yüklemeyi, T-SQL kullanarak sorgulamayı ve verileri Power BI raporunda görüntülemeyi gösteren örnek diyagram.
Demonstrate understanding of common data engineering tasks to implement and manage data engineering workloads on Microsoft Azure, using a number of Azure services.