Aracılığıyla paylaş


Power BI kullanım senaryoları: Gelişmiş veri hazırlama

Not

Bu makale, Power BI uygulama planlama makale serisinin bir bölümünü oluşturur. Bu seri öncelikle Microsoft Fabric içindeki Power BI deneyimine odaklanır. Seriye giriş için bkz . Power BI uygulama planlaması.

Veri hazırlama (bazen Ayıklama, Dönüştürme ve Yükleme kısaltması olan ETL olarak da adlandırılır) etkinlikleri genellikle büyük bir çaba gerektirir. Verilerin toplanması, temizlenmesi, birleştirilmesi ve zenginleştirilmesiyle ilgili zaman, beceri ve çaba, kaynak verilerin kalitesine ve yapısına bağlıdır.

Merkezi veri hazırlamaya zaman ve çaba harcama, şunların gerçekleştirilmesine yardımcı olur:

  • Yeniden kullanılabilirliği geliştirin ve veri hazırlama çabalarından maksimum değer elde edin.
  • Birden çok takıma tutarlı veri sağlama becerisini geliştirin.
  • Diğer içerik oluşturucuların gerektirdiği çaba düzeyini azaltın.
  • Ölçek ve performans elde edin.

Gelişmiş veri hazırlama kullanım senaryosu, self servis veri hazırlama senaryosuna göre genişler. Gelişmiş veri hazırlama, çeşitli ekiplerde ve çeşitli kullanım örnekleri için birden çok kullanıcı tarafından veri akışının yeniden kullanımını artırmayla ilgilidir.

Veri akışı amacına göre düzenlenmiş ayrı çalışma alanları, özellikle kuruluştaki farklı ekiplerde bulunan birden çok anlam modeli (daha önce veri kümesi olarak bilinir) oluşturucularına veri akışı çıkışı sağlandığında yararlıdır. Ayrı çalışma alanları, veri akışları oluşturan ve yöneten kişiler bunları kullanan kişilerden farklı olduğunda güvenlik rollerini yönetmek için de yararlıdır.

Not

Gelişmiş veri hazırlama senaryosu, veri hazırlama senaryolarının ikincisidir. Bu senaryo, self servis veri hazırlama senaryosunda açıklandığı gibi merkezi veri akışlarıyla neler yapılabilmesi gerektiğini temel alır.

Gelişmiş veri hazırlama senaryosu, self servis BI senaryolarından biridir. Ancak, merkezi bir ekip üyesi teknikleri yönetilen self servis BI senaryosunda açıklanana benzer şekilde kullanabilir. Self servis senaryolarının tam listesi için Power BI kullanım senaryoları makalesine bakın.

Kısalık için, içerik işbirliği ve teslim senaryoları konusunda açıklanan bazı yönler bu makalede ele alınmıyor. Tam kapsam için önce bu makaleleri okuyun.

Senaryo diyagramı

İpucu

Aşina değilseniz self servis veri hazırlama kullanım senaryosunu gözden geçirmenizi öneririz. Gelişmiş self servis veri hazırlama senaryosu bu senaryoyu oluşturur.

Bu gelişmiş veri hazırlama senaryosunun odak noktası:

  • Amaca göre ayrı veri akışları kullanımı: hazırlama, dönüştürme veya son. Belirli kullanıcı gereksinimlerini desteklemek üzere çeşitli kombinasyonlarda daha fazla yeniden kullanım elde etmek için birleştirilebilir yapı taşları kullanmanızı öneririz. Birleştirilebilir yapı taşları bu makalenin devamında açıklanmıştır.
  • Veri akışı oluşturucularını veya veri akışı tüketicilerini destekleyen ayrı çalışma alanlarının kullanılması. Veri akışlarını kullanan veri modelleyicileri farklı ekiplerde olabilir ve/veya farklı kullanım örneklerine sahip olabilir.
  • Bağlı tabloların (bağlantılı varlıklar olarak da bilinir), hesaplanan tabloların (hesaplanan varlıklar olarak da bilinir) ve gelişmiş işlem altyapısının kullanımı.

Not

Bazen anlam modeli ve veri modeli terimleri birbirinin yerine kullanılır. Genel olarak, Power BI hizmeti perspektiften bakıldığında anlamsal model olarak adlandırılır. Geliştirme açısından bakıldığında veri modeli (veya kısaca model) olarak adlandırılır. Bu makalede her iki terim de aynı anlama sahiptir. Benzer şekilde, anlamsal model oluşturucu ve veri modelleyici de aynı anlama sahiptir.

Aşağıdaki diyagramda, gelişmiş veri hazırlama senaryolarını destekleyen en yaygın kullanıcı eylemlerine ve Power BI bileşenlerine yönelik üst düzey bir genel bakış gösterilmiştir.

Diyagramda, veri akışlarının erişim ve yeniden kullanılabilirliğini geliştirmeyle ilgili gelişmiş veri hazırlığı gösterilmektedir. Diyagramdaki öğeler aşağıdaki tabloda açıklanmıştır.

İpucu

Sununuza , belgelerinize veya blog gönderinize eklemek veya bunu duvar posteri olarak yazdırmak istiyorsanız senaryo diyagramını indirmenizi öneririz. Ölçeklenebilir Vektör Grafikleri (SVG) görüntüsü olduğundan, kalite kaybı olmadan ölçeği artırıp azaltabilirsiniz.

Senaryo diyagramında aşağıdaki kullanıcı eylemleri, araçları ve özellikleri gösterilir:

Kalem Açıklama
Öğe 1. Veri akışı oluşturucusu, veri akışı içinde bir tablo koleksiyonu geliştirir. Yeniden kullanıma yönelik bir veri akışı için, oluşturucunun kuruluş sınırları (BT, kurumsal iş zekası veya Mükemmellik Merkezi gibi) kullanıcıları destekleyen merkezi bir ekiba ait olması yaygın (ancak gerekli değildir).
Öğe 2. Veri akışı, bir veya daha fazla veri kaynağındaki verilere bağlanır.
Öğe 3. Bazı veri kaynakları, özel bir kuruluş ağı içinde bulunanlar gibi veri yenileme için şirket içi veri ağ geçidi veya sanal ağ geçidi gerektirebilir. Bu ağ geçitleri hem Power Query Online'da veri akışını yazmak hem de veri akışını yenilemek için kullanılır.
Öğe 4. İlgili tüm çalışma alanlarının lisans modu Doku kapasitesi, Premium kapasite, Kullanıcı Başına Premium veya Embedded olarak ayarlanmıştır. Bu lisans modları, bu senaryoda gerekli olan bağlı tabloların ve hesaplanan tabloların çalışma alanları arasında kullanılmasına olanak sağlar.
Öğe 5. Veri akışı oluşturucuları, Power Query'nin web tabanlı bir sürümü olan Power Query Online'ı kullanarak veri akışları geliştirir.
Öğe 6. Hazırlama veri akışı, veri akışlarının merkezi yönetimine ayrılmış bir çalışma alanında oluşturulur. Hazırlama veri akışı ham verileri olduğu gibi kaynaktan kopyalar. Varsa, az sayıda dönüştürme uygulanır.
Öğe 7. Aynı çalışma alanında bir dönüştürme veri akışı (temizlenmiş veri akışı olarak da bilinir) oluşturulur. Hazırlama veri akışına bağlı tabloları kullanarak veri kaynağı oluşturur. Hesaplanan tablolar , verileri hazırlayan, temizleyen ve yeniden şekillendiren dönüştürme adımlarını içerir.
Öğe 8. Veri akışı oluşturucuları, veri akışlarının merkezi yönetimine ayrılmış çalışma alanındaki içeriği yönetme erişimine sahiptir.
Öğe 9. Üretime hazır verileri veri modellerine sunan son veri akışına erişim sağlamayı amaçlayan bir veya daha fazla çalışma alanı daha vardır.
Öğe 10. Son veri akışı , veri modelleyicilerin kullanabileceği bir çalışma alanında oluşturulur. Dönüştürme veri akışına bağlı tabloları kullanarak veri kaynağı oluşturur. Hesaplanan tablolar, çalışma alanı görüntüleyici rolü verilen veri modelleyicileri tarafından görünen hazırlanmış çıkışı temsil ediyor.
Öğe 11. Anlam modeli oluşturucuları (veri akışı çıkışını kullananlar), son veri akışı çıkışını içeren çalışma alanına görüntüleyici erişimine sahiptir. Veri akışı oluşturucuları ayrıca çalışma alanındaki içeriği yönetme ve yayımlama erişimine de sahiptir (senaryo diyagramında gösterilmez).
Öğe 12. Anlam modeli oluşturucuları, Power BI Desktop'ta veri modeli geliştirirken veri kaynağı olarak son veri akışını kullanır. Anlam modeli oluşturucusu hazır olduğunda, veri modelini içeren Power BI Desktop dosyasını (.pbix) Power BI hizmeti (senaryo diyagramında gösterilmez) yayımlar.
Öğe 13. Doku yöneticileri Yönetici portalında ayarları yönetir.
Öğe 14. Yönetici portalında Power BI yöneticileri, veri akışı verilerini Azure Data Lake Storage 2. Nesil (ADLS 2. Nesil) hesaplarında depolamak için Azure bağlantıları ayarlayabilir. Ayarlar kiracı düzeyinde depolama hesabı atamayı ve çalışma alanı düzeyinde depolama izinlerini etkinleştirmeyi içerir.
Öğe 15. Varsayılan olarak, veri akışları Power BI hizmeti tarafından yönetilen iç depolamayı kullanarak verileri depolar. İsteğe bağlı olarak, veri akışı tarafından veri çıkışı kuruluşun ADLS 2. Nesil hesabında depolanabilir.
Öğe 16. Doku yöneticileri Doku portalında etkinliği izler ve izler.

Önemli noktalar

Aşağıda, gelişmiş veri hazırlama senaryosu hakkında vurgu edilmesi gereken bazı önemli noktalar yer alır.

Veri akışları

Veri akışı bir tablo koleksiyonundan (varlıklar olarak da bilinir) oluşur. Her tablo, tabloyu verilerle yüklemek için gereken veri hazırlama adımlarını içeren bir sorgu tarafından tanımlanır. Veri akışı oluşturmak için tüm çalışmalar Power Query Online'da gerçekleştirilir. Power Apps, Dynamics 365 Customer Analizler ve Power BI gibi birden çok üründe veri akışı oluşturabilirsiniz.

Not

Power BI hizmeti kişisel çalışma alanında veri akışları oluşturamazsınız.

Veri akışı türleri

Birleştirilebilir yapı taşları kullanımı, sistem bileşenlerini yönetmenize, dağıtmanıza ve güvenli hale getirmenize ve ardından bunları çeşitli kombinasyonlarda kullanmanıza olanak tanıyan bir tasarım ilkesidir. Bir amaca özgü modüler, bağımsız veri akışları oluşturmak en iyi yöntemdir. Veri yeniden kullanımı ve kurumsal ölçek elde etmeye yardımcı olur. Modüler veri akışlarını yönetmek ve test etmek de daha kolaydır.

Senaryo diyagramında üç tür veri akışı gösterilir: hazırlama veri akışı, dönüştürme veri akışı ve son veri akışı.

Hazırlama veri akışı

Hazırlama veri akışı (bazen veri ayıklama veri akışı olarak adlandırılır), ham verileri kaynaktan olduğu gibi kopyalar. Ham verilerin en az dönüşümle ayıklanması, aşağı akış dönüştürme veri akışlarının (bundan sonra açıklanmıştır) hazırlama veri akışını kaynakları olarak kullanabileceği anlamına gelir. Bu modülerlik şu durumlarda kullanışlıdır:

  • Bir veri kaynağına erişim, dar zaman pencereleri ve/veya birkaç kullanıcıyla sınırlıdır.
  • Zamansal tutarlılık, tüm aşağı akış veri akışlarının (ve ilgili anlam modellerinin) veri kaynağından ayıklanan verileri aynı anda teslim etmesini sağlamak için istenir.
  • Kaynak sistem kısıtlamaları veya analiz sorgularını destekleyebilmesi nedeniyle veri kaynağına gönderilen sorgu sayısının azaltılması gerekir.
  • Kaynak verilerin bir kopyası, mutabakat işlemleri ve veri kalitesi doğrulamaları için yararlıdır.

Dönüştürme veri akışı

Dönüştürme veri akışı (bazen temizlenmiş veri akışı olarak adlandırılır ) verilerini hazırlama veri akışına bağlanan bağlı tablolardan kaynaklanır. Dönüşümleri veri ayıklama işleminden ayırmak en iyi yöntemdir.

Dönüştürme veri akışı, verileri hazırlamak ve yeniden yapılandırmak için gereken tüm dönüştürme adımlarını içerir. Ancak, veri akışının birden çok kullanım örneğine ve amacına uygun olduğundan emin olmak için bu katmanda yeniden kullanılabilirliğe odaklanılmaktadır.

Son veri akışı

Son veri akışı, hazırlanan çıkışı temsil eder. Bazı ek dönüştürmeler kullanım örneğine ve amacına göre gerçekleşebilir. Analiz için yıldız şeması tablosu (boyut veya olgu), son veri akışının tercih edilen tasarımıdır.

Hesaplanan tablolar, çalışma alanı görüntüleyici rolü verilen veri modelleyicileri tarafından görülebilir. Bu tablo türü, aşağıdaki veri akışı tablolarının türleri konusunda açıklanmıştır.

Not

Veri gölleri genellikle bronz, gümüş ve altın gibi bölgelere sahiptir. Üç veri akışı türü benzer bir tasarım desenini temsil eder. Mümkün olan en iyi veri mimarisi kararlarını vermek için verileri kimin koruyacağını, verilerin beklenen kullanımını ve verilere erişen kişilerin gerektirdiği beceri düzeyini dikkate alın.

Veri akışları için çalışma alanları

Tüm veri akışlarını tek bir çalışma alanında oluşturursanız, bu durum yeniden kullanılabilirliğin kapsamını önemli ölçüde sınırlandırır. Tek bir çalışma alanı kullanmak, ekipler arasında ve/veya farklı kullanım örnekleri için birden çok kullanıcı türünü desteklerken kullanılabilen güvenlik seçeneklerini de sınırlar. Birden çok çalışma alanı kullanmanızı öneririz. Kuruluşun çeşitli alanlarından self servis oluşturucuları desteklemeniz gerektiğinde daha iyi esneklik sağlar.

Senaryo diyagramında gösterilen iki çalışma alanı türü şunlardır:

  • Çalışma Alanı 1: Merkezi olarak yönetilen veri akışlarını (bazen arka uç çalışma alanı olarak adlandırılır) depolar. Aynı kişiler tarafından yönetildiği için hem hazırlama hem de dönüştürme veri akışlarını içerir. Veri akışı oluşturucuları genellikle BT, BI veya Mükemmellik Merkezi gibi merkezi bir ekiptendir. Çalışma alanı yöneticisine, üyesine veya katkıda bulunan rolüne atanmalıdır.
  • Çalışma Alanı 2: Verilerin tüketicilerine son veri akışı çıkışını depolar ve sunar (bazen kullanıcı çalışma alanı olarak da adlandırılır). Anlam modeli oluşturucuları genellikle self servis analistleri, güçlü kullanıcılar veya vatandaş veri mühendisleridir. Yalnızca son veri akışının çıkışını kullanmaları gerektiğinden, çalışma alanı görüntüleyici rolüne atanmaları gerekir. Kuruluşun çeşitli alanlarından anlam modeli oluşturucularını desteklemek için, kullanım örneği ve güvenlik gereksinimlerine göre bunun gibi çok sayıda çalışma alanı oluşturabilirsiniz.

İpucu

Self servis veri hazırlama kullanım senaryosunda açıklandığı gibi anlam modeli oluşturucularını destekleme yollarını gözden geçirmenizi öneririz. Anlamsal model oluşturucularının Power BI Desktop'ta Power Query'nin tüm özelliklerini kullanmaya devam ettiğini anlamak önemlidir. Veri akışı verilerini daha fazla dönüştürmek veya veri akışı çıkışını diğer kaynaklarla birleştirmek için sorgu adımları eklemeyi seçebilirler.

Veri akışı tablo türleri

Senaryo diyagramında üç tür veri akışı tablosu (varlıklar olarak da bilinir) gösterilmiştir.

  • Standart tablo: Veritabanı gibi bir dış veri kaynağını sorgular. Senaryo diyagramında, standart tablolar hazırlama veri akışında gösterilmiştir.
  • Bağlı tablo: Başka bir veri akışından bir tabloya başvurur. Bağlı tablo verileri çoğaltmaz. Bunun yerine, standart bir tablonun birden çok amaç için birden çok kez yeniden kullanılmasına izin verir. Bağlantılı tablolar, izinleri özgün veri akışından devraldığından çalışma alanı görüntüleyicileri tarafından görülemez. Senaryo diyagramında bağlı tablolar iki kez gösterilir:
    • Hazırlama veri akışındaki verilere erişmek için dönüştürme veri akışında.
    • Dönüştürme veri akışındaki verilere erişmek için son veri akışında.
  • Hesaplanan tablo: Kaynağı olarak farklı bir veri akışı kullanarak ek hesaplamalar gerçekleştirir. Hesaplanan tablolar, çıkışın tek tek kullanım örnekleri için gerektiği gibi özelleştirilmesine olanak sağlar. Senaryo diyagramında hesaplanan tablolar iki kez gösterilmiştir:
    • Yaygın dönüştürmeleri gerçekleştirmek için dönüştürme veri akışında.
    • Anlamsal model oluşturucularına çıktı teslim etmek için son veri akışında. Hesaplanan tablolar verileri yeniden kalıcı hale getirir (veri akışı yenilemeden sonra), veri modelleyicileri son veri akışındaki hesaplanan tablolara erişebilir. Bu durumda, veri modelleyicilerine çalışma alanı görüntüleyici rolüyle erişim verilmelidir.

Not

Veri akışlarını self servisten kurumsal kullanıma hazır duruma getiren birçok tasarım tekniği, desen ve en iyi yöntem vardır. Ayrıca, lisans modu Kullanıcı başına Premium veya Premium kapasite olarak ayarlanmış bir çalışma alanında veri akışları gelişmiş özelliklerden yararlanabilir. Bağlı tablolar ve hesaplanan tablolar (varlıklar olarak da bilinir), veri akışlarının yeniden kullanılabilirliğini artırmak için gerekli olan iki gelişmiş özelliktir.

Gelişmiş işlem altyapısı

Gelişmiş işlem altyapısı, Power BI Premium ile kullanılabilen gelişmiş bir özelliktir.

Önemli

Bazen bu makale Power BI Premium'a veya kapasite aboneliklerine (P SKU'ları) başvurur. Microsoft'un şu anda satın alma seçeneklerini birleştirdiğini ve kapasite başına Power BI Premium SKU'larını kullanımdan kaldırdığını unutmayın. Yeni ve mevcut müşteriler bunun yerine Doku kapasitesi abonelikleri (F SKU'ları) satın almayı düşünmelidir.

Daha fazla bilgi için bkz . Power BI Premium lisansına gelen önemli güncelleştirmeler ve Power BI Premium hakkında SSS.

Gelişmiş işlem altyapısı, veri akışına başvuran (bağlantı) bağlı tabloların (aynı çalışma alanı içinde) performansını artırır. Gelişmiş işlem altyapısından en yüksek avantajı elde etmek için:

  • Hazırlama ve dönüştürme veri akışlarını ayırın.
  • Hazırlama ve dönüştürme veri akışlarını depolamak için aynı çalışma alanını kullanın.
  • Sorgu adımlarının başlarında sorgu katlama işlemi yapabilecek karmaşık işlemler uygulayın. Katlanabilir işlemlere öncelik vermek, en iyi yenileme performansını elde etmeye yardımcı olabilir.
  • Yenileme sürelerini ve kaynak tüketimini azaltmak için artımlı yenileme kullanın.
  • Geliştirme aşamasında testleri erken ve sık gerçekleştirin.

Veri akışı ve anlamsal model yenileme

Veri akışı, anlamsal modeller için bir veri kaynağıdır. Çoğu durumda birden çok veri yenileme zamanlaması söz konusu olur: her veri akışı için bir zamanlama ve her anlam modeli için bir zamanlama. Alternatif olarak, Power BI Premium ve gelişmiş işlem altyapısı (senaryo diyagramında gösterilmez) gerektiren anlamsal modelden veri akışına DirectQuery kullanmak mümkündür.

Azure Data Lake Storage 2. Nesil

ADLS 2. Nesil hesabı, hiyerarşik ad alanının etkinleştirildiği belirli bir Azure depolama hesabı türüdür. ADLS 2. Nesil, analitik iş yüklerini çalıştırmak için performans, yönetim ve güvenlik avantajlarına sahiptir. Power BI veri akışları varsayılan olarak, Power BI hizmeti tarafından yönetilen yerleşik bir data lake hesabı olan dahili depolamayı kullanır. İsteğe bağlı olarak, kuruluşlar kuruluşlarında bir ADLS 2. Nesil hesabına bağlanarak kendi veri göllerini getirebilir.

Kendi veri gölünüzü kullanmanın bazı avantajları şunlardır:

  • Kullanıcılar (veya işlemler), veri gölünde depolanan veri akışı verilerine doğrudan erişebilir. Bu, veri akışının Power BI'ın ötesinde yeniden kullanılması durumunda yararlıdır. Örneğin, Azure Data Factory veri akışı verilerine erişebilir.
  • Diğer araçlar veya sistemler, veri gölündeki verileri yönetebilir. Bu durumda Power BI, verileri yönetmek yerine kullanabilir (senaryo diyagramında gösterilmez).

Bağlı tabloları veya hesaplanan tabloları kullanırken, her çalışma alanının aynı ADLS 2. Nesil depolama hesabına atandığından emin olun.

Not

ADLS 2. Nesil'deki veri akışı verileri Power BI'a özgü bir kapsayıcıda depolanır. Bu kapsayıcı self servis veri hazırlama kullanım senaryosu diyagramında gösterilmiştir.

portal ayarlarını Yönetici

Yönetici portalında yönetilmesi gereken iki önemli ayar vardır:

  • Azure bağlantıları:Yönetici portalının Azure bağlantıları bölümünde ADLS 2. Nesil hesabına bağlantı ayarlamaya yönelik bir ayar bulunur. Bu ayar, Power BI yöneticisinin kendi veri gölünüzü veri akışlarına getirmesine olanak tanır. Yapılandırıldıktan sonra çalışma alanları bu data lake hesabını depolama için kullanabilir.
  • Çalışma alanı düzeyinde depolama: Power BI yöneticisi çalışma alanı düzeyinde depolama izinleri ayarlayabilir. Bu ayar etkinleştirildiğinde, çalışma alanı yöneticilerinin kiracı düzeyinde ayarlanandan farklı bir depolama hesabı kullanmasına olanak tanır. Bu ayarın etkinleştirilmesi, Azure'da kendi veri göllerini yöneten merkezi olmayan iş birimleri için yararlıdır.

Ağ geçidi kurulumu

Genellikle, özel bir kuruluş ağı veya sanal ağ içinde bulunan veri kaynaklarına bağlanmak için şirket içi veri ağ geçidi gerekir.

Veri ağ geçidi şu durumlarda gereklidir:

  • Power Query Online'da özel kuruluş verilerine bağlanan bir veri akışı yazma.
  • Özel kuruluş verilerine bağlanan bir veri akışını yenileme.

İpucu

Veri akışları için standart modda merkezi bir veri ağ geçidi gerekir. Veri akışlarıyla çalışırken kişisel modda bir ağ geçidi desteklenmez.

Sistem gözetimi

Etkinlik günlüğü, Power BI hizmeti gerçekleşen kullanıcı etkinliklerini kaydeder. Power BI yöneticileri, kullanım düzenlerini ve benimsemeyi anlamalarına yardımcı olmak üzere denetim gerçekleştirmek için toplanan etkinlik günlüğü verilerini kullanabilir. Etkinlik günlüğü idare çalışmalarını, güvenlik denetimlerini ve uyumluluk gereksinimlerini desteklemek için de değerlidir. Gelişmiş veri hazırlama senaryosunda etkinlik günlüğü verileri, veri akışlarının yönetimini ve kullanımını izlemek için yararlıdır.

Power BI uygulama kararlarında size yardımcı olacak diğer yararlı senaryolar için Power BI kullanım senaryoları makalesine bakın.