Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu makalede, Power BI anlam modellerindeki ve pandas DataFrame'lerdeki ilişkileri keşfetmek ve doğrulamak için SemPy semantik bağlantı işlevlerinin nasıl kullanılacağı gösterilmektedir.
Veri bilimi ve makine öğrenmesinde, verilerinizdeki yapıyı ve ilişkileri anlamak önemlidir. Power BI, bu yapıları ve ilişkileri modellemenize ve görselleştirmenize olanak tanır. Daha fazla içgörü elde etmek veya makine öğrenmesi modelleri oluşturmak için SemPy kitaplık modüllerindeki anlamsal bağlantı işlevlerini kullanın.
Veri bilimcileri ve iş analistleri, Power BI anlam modellerindeki ilişkileri listelemek, görselleştirmek ve doğrulamak ya da pandas DataFrames'teki ilişkileri bulup doğrulamak için SemPy işlevlerini kullanır.
Önkoşullar
Microsoft Fabric aboneliği alın. Alternatif olarak, ücretsiz bir Microsoft Fabric deneme sürümüne kaydolun.
Ana sayfanızın sol alt tarafındaki deneyim değiştiriciyi kullanarak Fabric'e geçin.
Kod kopyalayıp hücrelere yapıştırmak için yeni bir not defteri oluşturun.
Spark 3.4 ve üzeri sürümler için, Fabric kullandığınızda varsayılan çalışma zamanında anlamsal bağlantı mevcuttur, bu yüzden yüklemenize gerek yoktur. Spark 3.3 veya üzeri için veya anlam bağlantısının en son sürümüne güncelleştirmek için aşağıdaki komutu çalıştırın:
%pip install -U semantic-link
Anlam modellerindeki ilişkileri listeleme
list_relationships Modüldeki sempy.fabric işlev, Power BI anlam modelinde bulunan tüm ilişkilerin listesini döndürür. Liste, verilerinizin yapısını ve farklı tablo ve sütunların nasıl bağlandığınızı anlamanıza yardımcı olur.
Bu işlev, açıklamalı DataFrame'ler sağlamak için anlamsal bağlantı kullanarak çalışır. DataFrame'ler, anlam modeli içindeki ilişkileri anlamak için gerekli meta verileri içerir. Açıklamalı DataFrame'ler, anlamsal modelin yapısını analiz edip makine öğrenmesi modellerinde veya diğer veri çözümleme görevlerinde kullanmayı kolaylaştırır.
işlevini kullanmak list_relationships için önce modülü içeri aktarırsınız sempy.fabric . Ardından, aşağıdaki örnekte gösterildiği gibi Power BI anlam modelinizin adını veya UUID'sini kullanarak işlevini çağırırsınız:
import sempy.fabric as fabric
fabric.list_relationships("my_dataset")
Yukarıdaki kod, list_relationships adlı bir Power BI anlam modeliyle çağırır. İşlev, her ilişki için bir satır içeren bir pandas DataFrame döndürür, böylece anlamsal modeldeki ilişkileri hızla keşfedip analiz edebilirsiniz.
Not
Not defteriniz, Power BI veri kümesi anlam modeliniz ve lakehouse'unuz aynı çalışma alanında veya farklı çalışma alanlarında bulunabilir. Varsayılan olarak, SemPy semantik modelinize şu kaynaktan erişmeye çalışır:
- Not defterinize bir göl evi eklediyseniz, göl evinizin çalışma alanı.
- Ekli göl evi yoksa, not defterinizin çalışma alanı.
Anlam modeliniz bu çalışma alanlarının herhangi birinde yer almıyorsa, SemPy yöntemini çağırırken anlamsal modelinizin çalışma alanını belirtmeniz gerekir.
Anlam modellerinde ilişkileri görselleştirme
plot_relationship_metadata semantik modeldeki ilişkileri görselleştirmek ve modelin nasıl yapılandırıldığını öğrenmek için işlevini kullanın. Bu işlev, tablolar ve sütunlar arasındaki bağlantıları gösteren bir grafik oluşturarak farklı öğelerin nasıl ilişkili olduğunu görmenizi kolaylaştırır.
İşlevin nasıl kullanılacağına ilişkin bir örnek aşağıda verilmişti plot_relationship_metadata :
import sempy.fabric as fabric
from sempy.relationships import plot_relationship_metadata
relationships = fabric.list_relationships("my_dataset")
plot_relationship_metadata(relationships)
Örnekte işlev, list_relationshipsmy_dataset semantik modeldeki ilişkileri alır ve plot_relationship_metadata işlev bu ilişkileri göstermek için bir grafik oluşturur.
Hangi sütunların dahilleneceğini seçerek, eksik anahtarların nasıl işleneceğini ayarlayarak ve daha fazla graphviz özniteliği ekleyerek grafı özelleştirin.
Anlam modellerindeki ilişkileri doğrulama
list_relationship_violations anlam modelinizdeki ilişkileri denetlemek ve sorunları veya tutarsızlıkları bulmak için işlevini kullanın. İşlev, list_relationship_violations tablolarınızın semantik modelinizdeki ilişkilerle eşleştiğinden emin olmak için tablolarınızı denetler.
Bu işlev, ilişki çokluğuyla ilgili tutarsızlıkları bulmanıza ve veri analizinizi veya makine öğrenmesi modellerinizi etkilemeden önce sorunları çözmenize yardımcı olur.
list_relationship_violations işlevini kullanmak için sempy.fabric modülünü içeri aktarın ve anlamsal modelinizdeki tabloları okuyun.
Ardından, tablo adlarını tablo içeriğiyle DataFrame'lere eşleyen bir sözlükle işlevini çağırın.
Aşağıdaki örnek kod, ilişki ihlallerini listelemeyi gösterir:
import sempy.fabric as fabric
tables = {
"Sales": fabric.read_table("my_dataset", "Sales"),
"Products": fabric.read_table("my_dataset", "Products"),
"Customers": fabric.read_table("my_dataset", "Customers"),
}
fabric.list_relationship_violations(tables)
Yukarıdaki kod işlevi, list_relationship_violations anlam modelinden Sales, Products ve Customers tablolarını içeren bir sözlükle çağırır. Bir kapsam eşiği ayarlayarak, eksik anahtarların nasıl işleneceğini seçerek ve rapora eksik anahtar sayısını ayarlayarak işlevi özelleştirebilirsiniz.
İşlev, her ilişki ihlali için bir satır içeren bir pandas DataFrame döndürür, böylece semantik modelinizdeki sorunları hızla bulabilir ve düzeltebilirsiniz.
list_relationship_violations Semantik modelinizin tutarlı ve doğru olmasını sağlamak için işlevini kullanarak daha güvenilir makine öğrenmesi modelleri oluşturun ve verilerinizden daha iyi içgörüler elde edin.
Pandas DataFrames'te ilişkileri bulma
list_relationshipsDoku modülündeki , plot_relationships_dfve list_relationship_violations işlevleri, anlam modellerindeki ilişkileri keşfetmeye yönelik güçlü araçlardır. Bazen pandas DataFrames gibi diğer veri kaynaklarında ilişkileri bulmanız gerekir.
Pandas DataFrames içindeki ilişkileri bulmak için find_relationships modülündeki sempy.relationship işlevini kullanın.
find_relationships Modüldeki sempy.relationships işlev, veri bilimcilerinin ve iş analistlerinin pandas DataFrames listesinde olası ilişkileri bulmasını sağlar. Bu işlev tablolar ve sütunlar arasındaki bağlantıları belirlemenize yardımcı olur, böylece verileriniz ve öğelerinin ilişkisi hakkında daha fazla bilgi edinebilirsiniz.
pandas DataFrames'de ilişkileri şu şekilde bulabilirsiniz:
from sempy.relationships import find_relationships
tables = [df_sales, df_products, df_customers]
find_relationships(tables)
Yukarıdaki kod find_relationships işlevini, üç pandas DataFrame içeren bir liste ile çağırır: df_sales, df_products, ve df_customers.
İşlev, her olası ilişki için bir satır içeren bir pandas DataFrame döndürür, böylece verilerinizdeki ilişkileri inceleyip analiz edebilirsiniz.
Kapsam eşiği, ad benzerliği eşiği, dışlanması gereken ilişkilerin listesi ve çoka çok ilişkilerin dahil edilip edilmeyeceğini belirleyerek işlevi özelleştirin.
pandas DataFrames'te ilişkileri doğrulama
find_relationships işlevini kullanarak pandas DataFrame'lerinizde olası ilişkileri bulduktan sonra, bu ilişkileri doğrulamak ve herhangi bir sorun veya tutarsızlığı belirlemek için list_relationship_violations işlevini kullanın.
Tablolarınızın, bulunan ilişkilerle uygun olduğundan emin olmak için list_relationship_violations işlevi denetler. Veri analizinizi veya makine öğrenmesi modellerinizi etkilemeden önce sorunları çözebilmeniz için, belirtilen ilişki çokluğuyla tutarsızlıkları bulmak için bu işlevi kullanın.
Aşağıda pandas DataFrames'te ilişki ihlallerinin nasıl bulunduğunu gösteren bir örnek verilmiştir:
from sempy.relationships import find_relationships, list_relationship_violations
tables = [df_sales, df_products, df_customers]
relationships = find_relationships(tables)
list_relationship_violations(tables, relationships)
Örnek, list_relationship_violations işlevini üç pandas DataFrame ile çağırır: df_sales, df_products, ve df_customers, ve find_relationships işlevinin ilişkiler DataFrame'i ile birlikte.
İşlev, her ilişki ihlali için bir satır içeren bir pandas DataFrame döndürür. Bu nedenle, verilerinizdeki sorunları hızlıca bulabilir ve düzeltebilirsiniz.
Kapsam eşiği ayarlayarak, eksik anahtarların nasıl işleneceğini seçerek ve kaç eksik anahtarın raporleneceğini tanımlayarak işlevi özelleştirin.
Verilerinizi tutarlı ve doğru tutmak için pandas DataFrames ile list_relationship_violations işlevini kullanın. Bu, güvenilir makine öğrenmesi modelleri oluşturmanıza ve verilerinizden daha derin içgörüler elde etmenize yardımcı olur.
İlgili içerik
- Anlamsal işlevler hakkında bilgi edinin
- SemPy başvuru belgelerini kullanmaya başlama
- Öğretici: Anlamsal bağlantı kullanarak anlamsal modeldeki ilişkileri bulma
- Öğretici: Anlam bağlantısı kullanarak Synthea veri kümesindeki ilişkileri bulma
- Verilerinizdeki işlevsel bağımlılıkları algılama, keşfetme ve doğrulama