Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Şunlar için geçerlidir:✅ Microsoft Fabric'te SQL analiz uç noktası ve Ambarı
Bu makalede Lakehouse'un SQL analiz uç noktasıyla veri ambarı iş yükü ve Lakehouse'un veri ambarında kullanımına yönelik senaryolar açıklanmaktadır. Ambar verilerini geliştirmeyi seçmeye ilişkin bir karar kılavuzu için bkz . Microsoft Fabric karar kılavuzu: Ambar ile Lakehouse arasında seçim yapma.
Lakehouse SQL analiz uç noktası nedir?
SQL analiz uç noktası, T-SQL dili ve TDS protokollerini kullanarak Lakehouse'daki verileri sorgulamanıza olanak tanır.
- SQL analiz uç noktası, T-SQL dili kullanılarak sorgulanabilen SQL tabloları olarak Lakehouse'dan Delta tablolarını kullanıma sunar.
- Lakehouse'un her delta tablosu tek bir tablo olarak temsil edilir. Veriler delta biçiminde olmalıdır.
- Her Lakehouse'un bir SQL analiz uç noktası vardır ve her çalışma alanının birden fazla Lakehouse'ı olabilir. Çalışma alanı içindeki SQL analiz uç noktalarının sayısı Lakehouse öğelerinin sayısıyla eşleşir.
Microsoft Fabric'te SQL analiz uç noktası oluşturmanıza gerek yoktur. Her lakehouse, veritabanı veya yansıtılmış veritabanı için otomatik olarak bir SQL analitik uç noktası oluşturulur. SQL analizi uç noktası, üst öğeleri için basit bir veri ambarı özelliği olarak görev yapar ve deponun göl evi mimarisini tamamlar. Bu, Spark veya Fabric yansıtmasının, SQL analiz uç noktasının görüntüleyebilecekleri göl evindeki bir klasör yapısındaki verileri denetlemesine olanak tanır.
Not
Arka planda SQL analiz uç noktası, yüksek performanslı ve düşük gecikme süreli SQL sorgularına hizmet vermek için Warehouse ile aynı altyapıyı kullanır.
Otomatik Metadata Keşfi
Sorunsuz bir işlem, değişiklik günlüklerini ve dosyalar klasöründen okur ve istatistikler gibi tablolar için SQL meta verilerinin her zaman güncel olmasını sağlar. Kullanıcı eylemi gerekmez ve verileri içeri aktarmaya, kopyalamaya veya altyapıyı ayarlamaya gerek yoktur. Daha fazla bilgi için bkz . SQL analytics uç noktasında otomatik olarak oluşturulan şema.
Lakehouse'un veri ambarı için olanak sağladığı senaryolar
Fabric'te bir depo sunuyoruz.
Warehouse tarafından desteklenen SQL analiz uç noktasıyla Lakehouse, toplu iş, akış veya lambda mimarisi desenlerinin geleneksel karar ağacını basitleştirebilir. Göl evi, bir depoyla birlikte birçok ek analiz senaryosuna olanak tanır. Bu bölümde, en iyi analiz stratejisi için bir Lakehouse'un bir Warehouse ile birlikte nasıl kullanılabileceği incelenmektedir.
Fabric Lakehouse'unuzun altın katmanıyla analiz
Göl verisi organizasyonu için iyi bilinen stratejilerden biri, dosyaların ham (bronz), birleştirilmiş (gümüş) ve rafine (altın) katmanlar halinde düzenlendiği bir madalyon mimarisidir . Sql analytics uç noktası, dosyalar Microsoft Fabric OneLake dışında depolanmış olsalar bile, madalyon mimarisinin altın katmanındaki Delta Lake verileri analiz etmek için kullanılabilir.
Synapse Spark veya Azure Databricks altyapıları tarafından yönetilen dış Azure Data Lake depolama hesaplarındaki altın klasörlere başvurmak için OneLake kısayollarını kullanabilirsiniz.
Ambarlar, özel konu için özel analiz gereksinimleri olabilecek konu alanı veya etki alanı odaklı çözümler olarak da eklenebilir.
Verilerinizi Doku'da tutmayı seçerseniz, api'ler, Delta biçimi ve elbette T-SQL aracılığıyla her zaman açık ve erişilebilir olur.
Lakehouse'daki delta tablolarınız ve OneLake'deki diğer öğeler üzerinde hizmet olarak sorgulama
Bir analistin, veri bilimcinin veya veri mühendisinin bir veri gölü içindeki verileri sorgulaması gerekebilecek kullanım örnekleri vardır. Fabric'de, bu uçtan uca deneyim tamamen SaaS tabanlı hale getirilmiştir.
OneLake , tüm kuruluş için tek, birleşik, mantıksal bir veri gölüdür. OneLake, veriler için OneDrive'dır. OneLake, örneğin kuruluş bölümleriniz boyunca birden çok çalışma alanı içerebilir. Fabric'deki her öğe, verileri OneLake aracılığıyla erişilebilir hale getirir.
Microsoft Fabric Lakehouse'daki veriler fiziksel olarak OneLake'de aşağıdaki klasör yapısıyla depolanır:
- klasör,
/Filesanaliz edilmeden önce veri mühendisleri tarafından işlenmesi gereken ham ve çözülmemiş (bronz) dosyalar içerir. Dosyalar CSV, Parquet, farklı görüntü türleri gibi çeşitli biçimlerde olabilir. - Klasör, iş analizi için hazır olan birleştirilmiş, iyileştirilmiş (altın) verileri içerir. Birleştirilmiş veriler Delta Lake biçimindedir.
SQL analiz uç noktası, OneLake içindeki klasördeki /tables verileri okuyabilir. Analiz, Lakehouse'un SQL analiz uç noktasını sorgulamak kadar basittir. Ambar ile birlikte, veritabanları arası sorgular yapabilir ve OneLake verilerinizin üzerine Fabric Veri Ambarı ile ek iş mantığı oluşturarak salt okunur sorgulardan sorunsuz bir şekilde geçiş yapabilirsiniz.
Spark ile Veri Madenciliği ve SQL ile Sunma
Veri temelli kuruluşların arka uç ve analiz sistemlerini müşteriye yönelik uygulamalarla neredeyse gerçek zamanlı olarak eşitlenmiş durumda tutmaları gerekir. İşlemlerin etkisi uçtan uca işlemler, ilgili uygulamalar ve çevrimiçi işlem işleme (OLTP) sistemleri aracılığıyla doğru yansıtılmalıdır.
Fabric'te, verilerinizi düzenlemek için Spark Streaming veya Veri Mühendisliği kullanabilirsiniz. Lakehouse SQL analiz uç noktasını kullanarak veri kalitesini ve mevcut T-SQL işlemlerini doğrulayabilirsiniz. Bu işlem bir madalyon mimarisinde veya Lakehouse'unuzun birden çok katmanında yapılabilir; bronz, gümüş, altın ve hazırlık, seçilmiş ve rafine edilmiş veriler sunma şeklinde gerçekleştirilebilir. Spark aracılığıyla oluşturulan klasörleri ve tabloları, veri mühendisliği ve iş gereksinimlerinizi karşılayacak şekilde özelleştirebilirsiniz. Hazır olduğunda, bir ambar veri kopyalamadan, Görünümler kullanarak veya verileri CREATE TABLE AS SELECT iyileştirerek (CTAS), saklı yordamlar ve diğer DML/DDL komutlarıyla tüm aşağı akış iş zekası uygulamalarınıza ve diğer analiz kullanım örneklerinize hizmet verebilir.
Open Lakehouse'unuzun altın katmanıyla tümleştirme
SQL analiz uç noktası, yalnızca Fabric Lakehouse'daki veri analizi ile sınırlı değildir. SQL analizi uç noktası Synapse Spark, Azure Databricks veya diğer göl merkezli veri mühendisliği altyapısını kullanarak herhangi bir göl evindeki göl verilerini analiz etmenizi sağlar. Veriler Azure Data Lake Storage veya Amazon S3'te depolanabilir.
Fabric Lakehouse ile bu sıkı, çift yönlü tümleştirmeye açık API'lere, Delta biçimine ve elbette T-SQL'e sahip tüm altyapılardan her zaman erişilebilir.
Dış veri göllerinin kısayollarla Sanallaştırılması
Synapse Spark veya Azure Databricks altyapıları tarafından yönetilen dış Azure Data Lake depolama hesaplarındaki altın klasörlere ve Amazon S3'te depolanan tüm delta tablolarına başvurmak için OneLake kısayollarını kullanabilirsiniz.
Kısayol kullanılarak başvuruda bulunılan herhangi bir klasör SQL analiz uç noktasından analiz edilebilir ve başvuruda bulunılan veriler için bir SQL tablosu oluşturulur. SQL tablosu, harici olarak yönetilen veri göllerindeki verileri kullanıma açmak ve bunlar üzerinde analiz sağlamak için kullanılabilir.
Bu kısayol, ek aşağı akış analizi gereksinimleri için bir ambardan yararlanabilen veya doğrudan sorgulanabilen bir sanal ambar görevi görür.
Dış data lake storage hesaplarındaki verileri analiz etmek için aşağıdaki adımları kullanın:
- Azure Data Lake storage veya Amazon S3 hesabındaki bir klasöre başvuran bir kısayol oluşturun. Bağlantı ayrıntılarını ve kimlik bilgilerini girdikten sonra Lakehouse'da bir kısayol gösterilir.
- Lakehouse'un SQL analiz uç noktasına geçin ve kısayol adıyla eşleşen bir ada sahip bir SQL tablosu bulun. Bu SQL tablosu ADLS/S3 klasöründeki klasöre başvurur.
- ADLS/S3'teki verilere başvuran SQL tablosunu sorgula. Tablo, SQL analytics uç noktasındaki diğer herhangi bir tablo olarak kullanılabilir. Farklı depolama hesaplarındaki verilere başvuran tabloları birleştirebilirsiniz.
Not
SQL tablosu SQL analiz uç noktasında hemen gösterilmiyorsa birkaç dakika beklemeniz gerekebilir. Dış depolama hesabındaki verilere başvuran SQL tablosu bir gecikmeyle oluşturulur.
Bir veri gölünde arşivlenmiş veya geçmiş verileri analiz etme
Veri bölümleme, veri göllerinde iyi bilinen bir veri erişim iyileştirme tekniğidir. Bölümlenmiş veri kümeleri hiyerarşik klasör yapılarında /year=<year>/month=<month>/day=<day>biçiminde depolanır; burada year, monthve day bölümleme sütunlarıdır. Bu, geçmiş verileri mantıksal olarak ayrılmış bir biçimde saklamanıza olanak tanır, böylece işlem motorları, performanslı filtreleme ile verileri gerektiği şekilde okuyabilir, tüm dizin içeriğini ve altındaki tüm klasörleri ve dosyaları okumak yerine.
Bölümlenmiş veriler, sorgular bir değerle koşul sütunlarını karşılaştırırken filtreleniyorsa daha hızlı erişim sağlar.
SQL analiz uç noktası, yapılandırma gerektirmeden bu tür verileri kolayca okuyabilir. Örneğin, SQL Server 2022 veya Azure SQL Yönetilen Örneği dahil olmak üzere herhangi bir uygulamayı kullanarak verileri bir veri gölünde arşivleyebilirsiniz. Verileri bölümledikten ve dış tablolarla arşivleme amacıyla bir göle indirdikten sonra, SQL analiz uç noktası bölümlenmiş Delta Lake tablolarını SQL tabloları olarak okuyabilir ve kuruluşunuzun bunları analiz etmelerine olanak tanıyabilir. Bu, toplam sahip olma maliyetini azaltır, veri yinelemesini azaltır ve büyük veri, yapay zeka ve diğer analiz senaryolarını aydınlatıyor.
Fabric verilerinin kısayollarla veri sanallaştırması
Doku'da, çalışma alanları karmaşık iş, coğrafi veya mevzuat gereksinimlerine göre verileri ayırmanıza olanak tanır.
SQL analizi uç noktası, sorunsuz bir sanallaştırma aracılığıyla verileri yerinde bırakmanıza ve diğer Microsoft Fabric çalışma alanlarında bile Ambar veya Lakehouse'da verileri analiz etmeye devam etmenizi sağlar. Her Microsoft Fabric Lakehouse verileri OneLake'te depolar.
Kısayollar , herhangi bir OneLake konumundaki klasörlere başvurmanızı sağlar.
Her Microsoft Fabric Warehouse, tablo verilerini OneLake'te depolar. Tablo yalnızca ekleme ise, tablo verileri OneLake'te Delta Lake verileri olarak kullanıma sunulur. Kısayollar, Ambar tablolarının kullanıma sunulduğu herhangi bir OneLake'teki klasörlere başvurmanızı sağlar.
Çalışma alanları arası paylaşım ve sorgulama
Çalışma alanları karmaşık iş, coğrafi veya mevzuat gereksinimlerine göre verileri toplamanıza olanak sağlarken, bazen belirli analiz gereksinimleri için bu satırlar arasında paylaşımı kolaylaştırmalısınız.
Lakehouse SQL analiz uç noktası, bir kullanıcının kendi kapasitesini ve ambarını getirebileceği departmanlar ve kullanıcılar arasında kolayca veri paylaşımını sağlayabilir. Çalışma alanları departmanları, iş birimlerini veya analitik etki alanlarını düzenler. Kullanıcılar kısayolları kullanarak herhangi bir Warehouse veya Lakehouse verisini bulabilir. Kullanıcılar aynı paylaşılan verilerden kendi özelleştirilmiş analizlerini anında gerçekleştirebilir. Departman geri ödemelerine ve kullanım ayırmaya yardımcı olmaya ek olarak, bu verilerin de sıfır kopyalı bir sürümüdür.
SQL analizi uç noktası, herhangi bir tablonun sorgulanması ve kolay paylaşıma olanak tanır. Ek iş gereksinimlerini karşılamak için daha fazla katman oluşturulabilen çalışma alanı rollerinin ve güvenlik rollerinin ek denetimleri.
Çalışma alanları arası veri analizini etkinleştirmek için aşağıdaki adımları kullanın:
- Erişebileceğiniz bir çalışma alanında bir tabloya veya klasöre başvuran bir OneLake kısayolu oluşturun.
- Analiz etmeyi düşündüğünüz tablo veya Delta Lake klasörünü içeren bir Lakehouse ya da Warehouse seçin. Bir tablo/klasör seçtiğinizde Lakehouse'da bir kısayol gösterilir.
- Lakehouse'un SQL analiz uç noktasına geçin ve kısayol adıyla eşleşen bir ada sahip SQL tablosunu bulun. Bu SQL tablosu başka bir çalışma alanındaki klasöre başvurur.
- Başka bir çalışma alanındaki verilere başvuran SQL tablosunu sorgula. Tablo, SQL analytics uç noktasındaki diğer herhangi bir tablo olarak kullanılabilir. Farklı çalışma alanlarındaki verilere başvuran tabloları birleştirebilirsiniz.
SQL analiz uç noktasında güvenlik hakkında daha fazla bilgi için bkz. SQL analizi uç noktaları için OneLake güvenliği.
Not
SQL tablosu SQL analiz uç noktasında hemen gösterilmiyorsa birkaç dakika beklemeniz gerekebilir. Başka bir çalışma alanındaki verilere başvuran SQL tablosu gecikmeli olarak oluşturulur.
Bölümlenmiş verileri analiz etme
Veri bölümleme, veri göllerinde iyi bilinen bir veri erişim iyileştirme tekniğidir. Bölümlenmiş veri kümeleri hiyerarşik klasör yapılarında /year=<year>/month=<month>/day=<day>biçiminde depolanır; burada year, monthve day bölümleme sütunlarıdır. Bölümlenmiş veri kümeleri, sorguların koşul sütunlarını bir değerle karşılaştırarak verileri filtreleyen koşul ifadelerini kullanarak verileri filtrelemesi halinde daha hızlı veri erişimi sağlar.
SQL analiz uç noktası, bölümlenmiş Delta Lake veri kümelerini SQL tabloları olarak temsil edebilir ve bunları analiz etmenizi sağlayabilir.
Dış verileri sorgulama hakkında daha fazla bilgi ve örnek için bkz. Doku Veri Ambarı veya SQL analiz uç noktasını kullanarak dış data lake dosyalarını sorgulama. Bölümlenmiş parquet dosyalarını sorgulamaya yönelik bir örnek ve kullanım örneği için bkz. Bölümlenmiş verileri sorgulama.
Lakehouse, Warehouse veya Eventhouse'da verileri analiz etme
Lakehouse ve Warehouse ana sayfalarında, Verileri analiz etme menüsünün bir parçası olarak Eventhouse uç noktasını içerir. Eventhouse uç noktası, veri yineleme veya el ile eşitleme olmadan doğrudan Lakehouse ve Warehouse verilerinin üzerinde Eventhouse destekli bir sorgu deneyimi sağlar.
Eventhouse uç noktasını etkinleştirdiğinizde, bir Eventhouse ve KQL veritabanı otomatik olarak kaynak Lakehouse veya Warehouse'un alt öğeleri olarak oluşturulur ve şema eşitlemesi arka planda işlenir. Uç nokta her zaman kaynak verilerin geçerli şemasını yansıtır ve neredeyse gerçek zamanlı analitik erişimi etkinleştirir.
Bu tümleştirme Eventhouse'un, ayarlamanız ve yönetmeniz gereken ayrı bir sistem yerine veri kaynağının doğal bir uzantısı olmasını sağlar. Eventhouse Uç Noktası hakkında daha fazla bilgi için bkz. Lakehouse ve warehouse için Eventhouse uç noktasını etkinleştirme.
İlgili içerik
- Microsoft Fabric'te göl evi nedir?
- Microsoft Fabric karar kılavuzu: Veritabanı Ambarı ve Lakehouse arasında seçim yapma
- Lakehouse ile verilerinizi OneLake'e getirme
- Microsoft Fabric'te Power BI anlam modelleri
- Fabric Lakehouse'a veri alma seçenekleri
- Kopyalama etkinliğini kullanarak verileri kopyalama
- Kopyalama yardımcısı aracılığıyla Azure SQL DB'den Lakehouse'a veri taşıma
- Microsoft Fabric'de veri ambarına bağlantı
- Lakehouse'un SQL analiz uç noktası
- Microsoft Fabric'te SQL analiz uç noktasını veya Ambarı sorgulama