Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
ŞUNLAR İÇİN GEÇERLİDİR: Power BI Desktop
Power BI Hizmeti
Ana etmenler görseli, ilginizi çeken bir ölçümü yönlendiren faktörleri anlamanıza yardımcı olur. Verilerinizi analiz eder, önemli faktörleri sıralar ve bunları ana etmenler olarak görüntüler. Örneğin, çalışan devri, çalışan kaybı olarak da bilinir; peki çalışan devrini neyin etkilediğini öğrenmek isterseniz? Bir faktör iş sözleşmesi uzunluğu, bir diğer faktör ise işe giriş süresi olabilir.
Bu makalede Power BI'da ana etmenler görselinin nasıl kullanılacağına ilişkin adım adım bir öğretici sunulmaktadır. Görselin nasıl ayarlanacağı, sonuçlarının nasıl yorumlanacağı ve yaygın sorunların nasıl giderilir açıklanmaktadır. Verilerinizde müşteri geri bildirimleri, satışlar veya diğer ölçümler gibi belirli sonuçları hangi faktörlerin yönlendirdiğini anlamak istiyorsanız bu kılavuz, Power BI'ın yapay zeka destekli analiz araçlarını kullanarak eyleme dönüştürülebilir içgörüler elde etmenize yardımcı olur.
Ana etmenler ne zaman kullanılır?
"Eğer şu hedeflere ulaşmak istiyorsanız, ana etmenler görseli harika bir seçimdir:"
- Analiz edilen ölçümü hangi faktörlerin etkilediğine bakın.
- Bu faktörlerin göreli önemini karşılaştırın. Örneğin, kısa vadeli sözleşmeler uzun vadeli sözleşmelerden daha fazla değişim sıklığı etkiler mi?
Ana etmenler görselinin özellikleri
Sekmeler: Bir sekme seçin ve görünümler arasında geçiş yapın. Ana etmenler , seçili ölçüm değerine en çok katkıda bulunanları gösterir. En üst segmentler , seçili ölçüm değerine katkıda bulunan en üst segmentleri gösterir. Segment, değerlerin birleşiminden oluşur. Örneğin, bir segment uzun vadeli müşteri olan ve batı bölgesinde yaşayan tüketiciler olabilir.
Açılır kutu: Araştırılan metrik değeri. Bu örnekte Derecelendirme ölçümüne bakın. Seçilen değer Düşük.
Yeniden ifade: Soldaki bölmedeki görseli yorumlamanıza yardımcı olur.
Sol bölme: Sol bölmede bir görsel bulunur. Bu durumda, sol bölmede en önemli etmenlerin listesi gösterilir.
Yeniden açıklama: Sağ bölmedeki görseli yorumlamanıza yardımcı olur.
Sağ bölme: Sağ bölmede bir görsel bulunur. Bu durumda sütun grafiği, sol bölmede seçilen ana etmen Temasının tüm değerlerini görüntüler. Sol bölmeden belirli kullanılabilirlik değeri yeşil olarak gösterilir. Tema için diğer tüm değerler siyah olarak gösterilir.
Ortalama çizgi: Kullanılabilirlik (seçilen etmen) dışında Tema için tüm olası değerler için ortalama hesaplanır. Bu nedenle hesaplama, siyahtaki tüm değerler için geçerlidir. Diğer Temaların yüzde kaçının düşük derecelendirmeye sahip olduğunu belirtir. Bu durumda % 11,35'in düşük derecelendirmesi vardı (noktalı çizgiyle gösterilir).
Onay kutusu: Sağ bölmedeki görseli yalnızca bu alanın etmenleri olan değerleri gösterecek şekilde filtreler.
Kategorik bir ölçümü analiz etme
- Product Manager'ınız, müşterilerin bulut hizmetiniz hakkında olumsuz incelemeler bırakmasına neden olan faktörleri öğrenmenizi istiyor. Power BI Desktop'ta takip etmek için Müşteri Geri Bildirimi PBIX dosyasını açın.
Not
Müşteri Geri Bildirimi veri kümesi [Moro et al., 2014] S. Moro, P. Cortez ve P. Rita'yı temel alır. "Banka Telemarketing'in Başarısını Tahmin Etmek için Veri Odaklı Bir Yaklaşım." Karar Destek Sistemleri, Elsevier, 62:22-31, Haziran 2014.
Görsel oluştur altında, Görselleştirme bölmesinde Ana etmenler simgesini seçin.
Araştırmak istediğiniz ölçümü Çözümle alanına taşıyın. Hizmetin müşteri derecelendirmesinin düşük olmasına neyin neden olduğunu görmek için Müşteri Tablosu
Düşündüğünüz Rating üzerinde etkili olabilecek alanları Explain by alanına taşıyın. İstediğiniz kadar alanı taşıyabilirsiniz. Bu durumda, şununla başlayın:
- Ülke-Bölge
- Kuruluştaki Rol
- Abonelik Türü
- Şirket Boyutu
- Tema
Genişletme alanını boş bırakın. Bu alan yalnızca bir ölçü veya özetlenmiş alan analiz edilirken kullanılır.
Negatif derecelendirmelere odaklanmak için Derecelendirmeyi etkileyen unsurlar açılan kutusunda Düşük seçin.
Çözümleme, analiz edilen alanın tablo düzeyinde çalışır. Bu durumda Derecelendirme ölçümüdür. Bu ölçüm müşteri düzeyinde tanımlanır. Her müşteri yüksek puan veya düşük puan verir. Görselin bunları kullanabilmesi için tüm açıklayıcı faktörlerin müşteri düzeyinde tanımlanması gerekir.
Önceki örnekte, tüm açıklayıcı faktörlerin metrikle bire bir veya birçoktan bire ilişkisi vardır. Bu durumda, her müşteri derecelendirmesine tek bir tema atadı. Benzer şekilde, müşteriler bir ülkeden veya bölgeden gelir, bir üyelik türüne sahiptir ve kuruluşlarında bir rol sahibi olur. Açıklayıcı faktörler zaten bir müşterinin öznitelikleridir ve dönüştürme gerekmez. Görsel bunları hemen kullanabilir.
Öğreticinin ilerleyen bölümlerinde, bire çok ilişkileri olan daha karmaşık örneklere bakacaksınız. Bu gibi durumlarda, analizi çalıştırabilmeniz için önce sütunların müşteri düzeyine kadar toplanması gerekir.
Açıklayıcı faktörler olarak kullanılan ölçüler ve toplamalar analiz ölçümünün tablo düzeyinde de değerlendirilir. Bu makalenin devamında bazı örnekler gösterilmiştir.
Kategorik ana etmenleri yorumlama
Şimdi düşük derecelendirmeler için ana etmenlere göz atalım.
Düşük derecelendirme olasılığını etkileyen en önemli tek faktör
Bu örnekteki müşterinin üç rolü olabilir: tüketici, yönetici veya yayımcı. Tüketici olmak, düşük derecelendirmeye katkıda bulunan en önemli faktördür.
Daha kesin olarak, tüketicilerinizin hizmetinize olumsuz puan verme olasılığı 2,57 kat daha yüksektir. Ana etmenler grafiğinde, soldaki listede önce Organizasyondaki rol tüketici listelenir. Kuruluşta Rol tüketici olarak seçildiğinde, Power BI sağ bölmede daha fazla ayrıntı gösterir. Her rolün düşük derecelendirme olasılığı üzerindeki karşılaştırmalı etkisi gösterilir.
- Tüketicilerin %14,93'i düşük puan veriyor.
- Diğer tüm roller ortalama olarak %5,78 oranında düşük puan verir.
- Tüketicilerin düşük puan verme olasılığı diğer tüm rollere kıyasla 2,57 kat daha yüksektir. Yeşil çubuğu kırmızı noktalı çizgiye bölerek bu puanı belirleyebilirsiniz.
Düşük derecelendirme olasılığını etkileyen ikinci tek faktör
Anahtar etkileyiciler görseli, birçok farklı değişkenden faktörleri karşılaştırır ve derecelendirir. İkinci etmen, Kuruluştaki Rol ile hiçbir ilgisi yoktur. Listeden tema kullanılabilirlik olan ikinci etmen'i seçin.
İkinci en önemli faktör, müşterinin gözden geçirme temasıyla ilgilidir. Ürünün kullanılabilirliği hakkında yorum yapan müşterilerin güvenilirlik, tasarım veya hız gibi diğer temalara yorum yapan müşterilere kıyasla düşük puan verme olasılığı 2,55 kat daha yüksekti.
Görseller arasında kırmızı noktalı çizgiyle gösterilen ortalama %5,78'den %11,35'e değiştirildi. Ortalama dinamiktir çünkü diğer tüm değerlerin ortalamasını temel alır. İlk etmen için ortalama, müşteri rolünü dışlamıştı. İkinci etmen için kullanılabilirlik temasını dışlamıştı.
Yalnızca etkili değerleri kullanarak verileri filtrelemek için Yalnızca etmen olan değerleri göster onay kutusunu seçin. Bu durumda düşük puana neden olan roller bunlardır. 12 tema, Power BI'ın düşük derecelendirmeleri yönlendiren temalar olarak tanımlamış olduğu dört temaya indirgendi.
Diğer görsellerle etkileşim kurma
Tuvalde bir dilimleyici, filtre veya başka bir görsel seçtiğinizde, ana etmenler görseli verilerin yeni kısmı üzerinde analizini tekrar yürütür. Örneğin, Şirket Boyutu'nu rapora taşıyabilir ve dilimleyici olarak kullanabilirsiniz. Kurumsal müşterileriniz için temel etmenlerin genel popülasyondan farklı olup olmadığını görmek için bunu kullanın. Kurumsal şirket boyutu 50.000'den fazla çalışandır.
Analizi yeniden çalıştırmak için 50.000'i>etmenlerin değiştiğini görebilirsiniz. Büyük kurumsal müşteriler için düşük derecelendirmeler için en önemli etmen, güvenlikle ilgili bir temaya sahiptir. Büyük müşterilerinizin memnun olmadığı belirli güvenlik özellikleri olup olmadığını görmek için daha fazla araştırma yapmak isteyebilirsiniz.
Devam eden ana etki sahiplerini yorumlama
Şimdiye kadar farklı kategorik alanların düşük derecelendirmeleri nasıl etkilediğini keşfetmek için görseli kullanmayı öğrendiniz. Açıklama ölçütü alanında yaş, boy ve ücret gibi sürekli faktörlerin bulunması da mümkündür. Şimdi Kullanım Süresi Müşteri Tablosundan Açıklama ölçütü'ne taşındığında ne olduğuna bakalım. Kullanım süresi, müşterinin hizmeti ne kadar süreyle kullandığını gösterir.
Kullanım süresi arttıkça daha düşük derecelendirme alma olasılığı da artar. Bu eğilim, uzun vadeli müşterilerin negatif puan verme olasılığının daha yüksek olduğunu göstermektedir. Bu içgörü ilginçtir ve daha sonra takip etmek isteyebileceğiniz bir içgörüdür.
Görselleştirme, her kullanım süresi 13,44 ay arttığında, ortalama olarak düşük derecelendirme olasılığının 1,23 kat arttığını gösterir. Bu durumda, 13,44 ay, standart kullanım süresi sapması gösterir. Bu nedenle, aldığınız içgörü, kıdem süresinin standart sapması kadar artırılmasının, düşük bir derecelendirme alma olasılığını nasıl etkilediğine odaklanır.
Sağ bölmedeki dağılım grafiği, her kullanım süresi değeri için düşük derecelendirmelerin ortalama yüzdesini çizer. Eğimi bir eğilim çizgisiyle vurgular.
Gruplandırılmış sürekli anahtar etmenler
Bazı durumlarda, sürekli faktörlerinizin otomatik olarak kategorik faktörlere dönüştürüldüğünü fark edebilirsiniz. Değişkenler arasındaki ilişki doğrusal değilse, ilişkiyi yalnızca artan veya azalan olarak tanımlayamıyoruz (önceki örnekte yaptığımız gibi).
Etmenlerin hedefle ne kadar doğrusal olduğunu belirlemek için bağıntı testleri çalıştırıyoruz. Hedef sürekli ise Pearson bağıntısını çalıştırırız; hedef kategorikse, Point Biserial bağıntı testlerini çalıştırırız. İlişkinin yeterince doğrusal olmadığını algılarsak denetimli gruplama yürütür ve en fazla beş bölme oluştururuz. Hangi bölmelerin en anlamlı olduğunu bulmak için denetimli bir gruplama yöntemi kullanırız. Denetimli gruplama yöntemi, açıklayıcı faktörle analiz edilen hedef arasındaki ilişkiyi inceler.
Ölçüleri ve toplamları ana etmenler olarak yorumlama
Ölçüleri ve toplamaları çözümlemenizin içinde açıklayıcı faktörler olarak kullanabilirsiniz. Örneğin, müşteri destek biletlerinin sayısının aldığınız puan üzerinde ne gibi bir etkisi vardır? Alternatif olarak, açık biletin ortalama süresinin aldığınız puan üzerinde ne gibi bir etkisi olur?
Bu durumda, bir müşterinin sahip olduğu destek bileti sayısının, verdikleri puanı etkilenip etkilemediğini görmek istiyorsunuz. Şimdi Destek Biletleri tablosundan Destek Bileti Kimliğini getirebilirsiniz. Bir müşterinin birden çok destek bileti olabileceğinden, ID'yi müşteri düzeyinde birleştirirsiniz. Çözümleme müşteri düzeyinde çalıştığından toplama önemlidir, bu nedenle tüm sürücülerin bu ayrıntı düzeyinde tanımlanması gerekir.
Kimlik sayısına bakalım. Her müşteri satırında kendisiyle ilişkilendirilmiş bir destek bileti sayısı vardır. Bu durumda destek bileti sayısı arttıkça derecelendirmenin düşük olma olasılığı 4,08 kat artar. Ekran görüntüsü, müşteri düzeyinde değerlendirilen farklı Derecelendirme değerlerine göre ortalama destek bileti sayısını gösterir.
Sonuçları yorumlama: En üst segmentler
Her faktörü ayrı ayrı değerlendirmek için Ana etmenler sekmesini kullanabilirsiniz. Faktörlerin birleşiminin analiz ettiğiniz ölçümü nasıl etkilediğini görmek için Üst segmentler sekmesini de kullanabilirsiniz.
En üst segmentler başlangıçta Power BI'ın keşfettiği tüm segmentlere genel bir bakış gösterir. Aşağıdaki örnekte altı segmentin bulunduğu gösterilmektedir. Segment içindeki düşük derecelendirmelerin yüzdesi derecelendirmeyi belirler. Örneğin segment 1'de %74,3 düşük müşteri derecelendirmesi vardır. Kabarcık ne kadar yüksek olursa düşük derecelendirmelerin oranı o kadar yüksektir. Kabarcığın boyutu, segment içinde kaç müşterinin olduğunu temsil eder.
Kabarcık seçildiğinde bu segmentin ayrıntıları görüntülenir. Örneğin Segment 1'i seçerseniz, bunun yerleşik müşterileri temsil ettiğini fark edebilirsiniz. 29 aydan uzun süredir müşteridirler ve dörtten fazla destek bileti vardır. Son olarak, yayımcı değildirler, bu nedenle tüketici veya yöneticidirler.
Bu grupta müşterilerin %74,3'ünün düşük derecelendirme verdiği açıklandı. Ortalama müşteri% 11,7 düşük derecelendirme verdi, bu nedenle bu segment düşük derecelendirmelerin daha büyük bir oranına sahip. 63 yüzde puanı daha yüksek. Segment 1 ayrıca verilerin yaklaşık %2,2'sini içerdiğinden popülasyonun adreslenebilir bir bölümünü temsil eder.
Sayı ekleme
Bazen bir etmen önemli bir etkiye sahip olabilir ancak verilerin çok azını temsil edebilir. Örneğin, Temakullanılabilirlik düşük derecelendirmeler için üçüncü en büyük etmendir. Ancak kullanılabilirlikten şikayet eden yalnızca birkaç müşteri olabilir. Sayımlar, odaklanmak istediğiniz etmenleri önceliklendirmenize yardımcı olabilir.
Görseli biçimlendir bölmesinin Çözümleme kartı aracılığıyla sayıları açabilirsiniz.
Sayımlar etkinleştirildikten sonra, etmenlerin içerdiği verilerin yaklaşık yüzdesini temsil eden her bir etmen balonunun etrafında bir halka görürsünüz. Halka ne kadar çok kabarcık daire içine alırsa, o kadar fazla veri içerir. Temanın kullanılabilirlikolduğunu, verilerin küçük bir kısmını içerdiğini görebiliriz.
Baloncukları etki yerine önce sayıya göre sıralamak için görselin sol alt kısmındaki Sıralama ölçütü düğmesini de kullanabilirsiniz. Abonelik Türü Premier, sayıya göre en önemli etmendir.
Dairenin etrafında tam halka olması, etmenlerin verilerin %100'lerini içerdiği anlamına gelir. Görseli biçimlendir bölmesinin Çözümleme kartındakiSayı türü açılan listesini kullanarak, sayı türünü en yüksek etmene göre değiştirebilirsiniz. Artık en fazla veri miktarına sahip etmen tam halka ile temsil edilir ve diğer tüm sayılar buna göredir.
Sayısal bir ölçümü analiz etme
Özetlenmemiş bir sayısal alanı Analiz alanına taşıdığınızda, bu senaryoyu nasıl işleyeceğinizi seçebilirsiniz. Görseli biçimlendir bölmesine gidip Kategorik Çözümleme Türü ile Sürekli Çözümleme Türü arasında geçiş yaparak görselin davranışını değiştirebilirsiniz.
Kategorik Çözümleme Türübu makalenin önceki bölümlerinde açıklanmıştır. Örneğin, 1 ile 10 arasında değişen anket puanlarına bakarsanız "Anket Puanlarının 1 olmasını etkileyen nedir?" sorusunu sorabilirsiniz.
Sürekli Çözümleme Türü , soruyu sürekli bir soru olarak değiştirir. Önceki örneği kullanarak yeni sorumuz şudur: "Anket Puanlarını artırmaya/azaltmaya ne etkiler?"
Bu ayrım, analiz ettiğiniz alanda çok sayıda benzersiz değer olduğunda yararlıdır. Sonraki örnekte ev fiyatlarına bakacağız. "House Price'ın 156.214 olmasını etkileyen nedir?" sorusunu sormak anlamlı değildir çünkü bu belirli bir durumdur ve bir desen çıkarabilmek için yeterli veriye sahip olma ihtimalimiz yoktur.
Bunun yerine, ev fiyatlarını farklı değerler yerine bir aralık olarak ele almanızı sağlayan "Ev Fiyatının artmasına neyin etkisi" sorusunu sormak isteyebiliriz.
Sonuçları yorumlama: Önemli etmenler
Not
Bu bölümdeki örneklerde kamu malı Konut Fiyatları verileri kullanılır. Takip etmek isterseniz örnek veri kümesini indirebilirsiniz.
Bu senaryoda , "Ev Fiyatının artmasına ne etki eder" konusuna bakacağız. Year Built (evin inşa edildiği yıl), KitchenQual (mutfak kalitesi) ve YearRemodAdd (evin yeniden düzenlendiği yıl) gibi bir dizi açıklayıcı faktör ev fiyatını etkileyebilir.
Aşağıdaki örnekte, mutfak kalitesinin Mükemmel olması en önemli etmenimize bakacağız. Sonuçlar, kategorik ölçümleri birkaç önemli farkla analiz ederken gördüğümüz sonuçlara benzer:
- Sağdaki sütun grafiği yüzdeler yerine ortalamalara bakıyor. Bu nedenle, mükemmel bir mutfağı olan bir evin ortalama ev fiyatının (yeşil bar) mükemmel bir mutfak (noktalı çizgi) olmayan bir evin ortalama ev fiyatına kıyasla ne olduğunu gösterir.
- Kabarcıktaki sayı hala kırmızı noktalı çizgi ile yeşil çubuk arasındaki farktır, ancak bir olasılık (1,93x) yerine sayı (\$158,49K) olarak ifade edilir. Yani ortalama olarak, mükemmel mutfakları olan evler neredeyse \$160K mükemmel mutfakları olmayan evlerden daha pahalıdır.
Sonraki örnekte, sürekli bir faktörün (ev yeniden modellendi) ev fiyatı üzerindeki etkisine bakacağız. Kategorik ölçümler için sürekli etmenleri analiz etme şeklimiz ile karşılaştırıldığında farklılıklar şunlardır:
- Sağ bölmedeki dağılım grafiği, yeniden modellenen yılın her ayrı değeri için ortalama ev fiyatını çizer.
- Kabarcıktaki değer, evin yeniden modellendiği yıl standart sapması (bu örnekte 20 yıl) arttığında ortalama ev fiyatının ne kadar arttığını (bu örnekte 2,87 BIN ABD doları) gösterir.
Son olarak, ölçüler söz konusu olduğunda, bir evin inşa edildiği ortalama yıla bakıyoruz. Analiz aşağıdaki gibidir:
- Sağ bölmedeki dağılım grafiği, tablodaki her ayrı değer için ortalama ev fiyatını çizer.
- Kabarcıktaki değer, ortalama yıl standart sapmasıyla (bu örnekte 30 yıl) arttığında ortalama ev fiyatının ne kadar arttığını (bu örnekte \$1,35K) gösterir.
En üst segmentleri kullanarak sonuçları yorumlama
Sayısal hedefler için en üst segmentler, ortalama olarak ev fiyatlarının genel veri kümesinden daha yüksek olduğu grupları gösterir. Örneğin, aşağıda Segment 1'in, GarageCars (garajın sığabileceği araba sayısı) 2'den büyük olduğu ve RoofStyle'ın Hip olduğu evlerden oluştuğunu görebiliriz. Bu özelliklere sahip evler, \$180K olan verilerdeki genel ortalamaya kıyasla ortalama \$355K fiyata sahiptir.
Ölçüt veya özetlenmiş sütun olan bir metriği analiz etme
Ölçü veya özetlenmiş sütun için, çözümleme varsayılan olarak bu makalenin önceki bölümlerinde açıklanan Sürekli Çözümleme Türü'nü kullanır. Bu değer değiştirilemez. Ölçü/özetlenmiş sütun ile özetlenmemiş sayısal sütunu analiz etme arasındaki en büyük fark, çözümlemenin çalıştırıldığı düzeydir.
Özetlenmemiş sütunlar için çözümleme her zaman tablo düzeyinde çalışır. Ev fiyatı örneğinde, ev fiyatının artmasını/düşmesini neyin etkilediğini görmek için Ev Fiyatı ölçümünü analiz ettik. Çözümleme otomatik olarak tablo düzeyinde çalışır. Tablomuzda her ev için benzersiz bir kimlik vardır, bu nedenle analiz ev düzeyinde çalışır.
Ölçüler ve özetlenmiş sütunlar için bunları analiz etmek için gereken düzeyi hemen bilmiyoruz. Ev Fiyatı Ortalama olarak özetlenmişse, bu ortalama ev fiyatının hesaplanmış olmasını istediğimiz düzeyi göz önünde bulundurmamız gerekir. Mahalle düzeyinde ortalama ev fiyatı mı? Ya da bölgesel düzeyde?
Ölçüler ve özet sütunlar, kullanılan tarafından açıklama yapılan alanlar düzeyinde otomatik olarak analiz edilir. Açıklama ölçütü bölümünde üç alanı incelemek istediğimizi düşünün: Mutfak Kalitesi, Yapı Tipi ve Klima. Bu üç alanın her benzersiz bileşimi için Ev Fiyatı ortalaması hesaplanır. Değerlendirilen verilerin nasıl göründüğünü görmek için tablo görünümüne geçmek genellikle yararlı olur.
Bu analiz yüksek oranda özetlendiğinden regresyon modelinin verilerde öğrenebileceği desenleri bulması zor olabilir. Daha iyi sonuçlar elde etmek için analizi daha ayrıntılı bir düzeyde çalıştırmalıyız. Ev fiyatını ev düzeyinde analiz etmek isteseydik, kimlik alanını analize açıkça eklememiz gerekirdi. Bununla birlikte, ev kimliğinin bir etmen olarak değerlendirilmesini istemiyoruz. Evin kimlik numarası büyüdükçe fiyatının arttığını bilmek faydalı değildir. Genişletme alanı seçeneği burada çok kullanışlıdır. Yeni etmenler aramadan çözümleme düzeyini ayarlamak için kullanmak istediğiniz alanları eklemek için Genişlet'i kullanabilirsiniz.
Genişletme ölçütüne ID ekledikten sonra görselleştirmenin nasıl göründüğünü inceleyin. Ölçünüzün değerlendirilmesini istediğiniz düzeyi tanımladıktan sonra, etmenleri yorumlamak özetlenmemiş sayısal sütunlarla tam olarak aynıdır.
Power BI'ın verilerle ilgili fikir edinmek ve içgörüleri doğal bir şekilde ortaya çıkarabilmek için arka planda ML.NET nasıl kullandığını öğrenmek için bkz . Power BI, ML.NET kullanarak önemli etmenleri tanımlar.
Dikkat edilmesi gerekenler ve sorun giderme
Görselin sınırlamaları nelerdir?
Ana etmenler görselinin bazı sınırlamaları vardır:
- Doğrudan Sorgu desteklenmez.
- Azure Analysis Services ve SQL Server Analysis Services'e Canlı Bağlantı desteklenmez.
- Web'de yayımlama desteklenmez.
- .NET Framework 4.6 veya üzeri gereklidir.
- SharePoint Online ekleme desteklenmez.
- Veri modeli için (örneğin, veri modelinde hesaplama grupları tanımlandığında) Örtük Ölçüleri Önerilmez ayarı true olarak ayarlandıysa kategorik bir ölçümü analiz etme desteklenmez.
Öyle bir hata görüyorum ki influencerlar veya kesimler bulunamadı. Bunun nedeni nedir?
Bu hata, ile açıkla alanlarına alanlar eklediğinizde ancak hiçbir etki unsuru bulunamadığında oluşur. Aşağıdaki sorunlardan birinin geçerli olup olmadığını denetleyin.
- Analiz ettiğiniz ölçümü hem Analiz'e hem Açıklama yöntemi'ne dahil ettiniz. Açıklama'dan kaldırın.
- Açıklayıcı alanlarınız az gözlem içeren çok fazla kategoriye sahip. Bu durum görselleştirmenin hangi faktörlerin etmen olduğunu belirlemesini zorlaştırır. Yalnızca birkaç gözleme dayanarak genelleştirmek zordur. Sayısal bir alanı analiz ediyorsanız, Çözümleme kartındakiGörseli biçimlendir bölmesinde Kategorik Çözümleme'denSürekli Çözümleme'ye geçmek isteyebilirsiniz.
- Açıklayıcı faktörleriniz genelleştirmek için yeterli gözleme sahiptir, ancak görselleştirme rapor etmek için anlamlı bir bağıntı bulamadı.
Çözümlediğim ölçümün çözümlemeyi çalıştırmak için yeterli veriye sahip olmadığını belirten bir hata görüyorum. Bunun nedeni nedir?
Görselleştirme, diğer gruplara kıyasla bir grubun verilerindeki desenlere bakarak çalışır. Örneğin, yüksek derecelendirme yapan müşterilerle karşılaştırıldığında düşük derecelendirmeler veren müşterileri arar. Modelinizdeki verilerin yalnızca birkaç gözlemi varsa desenleri bulmak zordur. Görselleştirmede anlamlı etmenleri bulmak için yeterli veri yoksa, analizi çalıştırmak için daha fazla veri gerektiğini gösterir.
Seçili durum için en az 100 gözleme sahip olmanız önerilir. Bu durumda, abonelikten ayrılan müşteriler devlet konumundadır. Karşılaştırma için kullandığınız durumlar için de en az 10 gözlem gerekir. Bu durumda karşılaştırma durumu, değişim sıklığı olmayan müşterilerdir.
Sayısal bir alanı analiz ediyorsanız, Çözümleme kartındakiGörseli biçimlendir bölmesinde Kategorik Çözümleme'denSürekli Çözümleme'ye geçmek isteyebilirsiniz.
'Çözümle' özetlenmediğinde, analiz her zaman ana tablosunun satır düzeyinde çalışıyor hatasını görüyorum. Bu düzeyin 'Genişletme alanları' yoluyla değiştirilmesine izin verilmez. Bunun nedeni nedir?
Sayısal veya kategorik bir sütunu analiz ederken, çözümleme her zaman tablo düzeyinde çalışır. Örneğin, ev fiyatlarını analiz ediyorsanız ve tablonuz bir kimlik sütunu içeriyorsa, analiz otomatik olarak ev kimliği düzeyinde çalıştırılır.
Bir ölçüyü veya özetlenmiş sütunu analiz ederken, analizin hangi düzeyde çalıştırılmasını istediğinizi açıkça belirtmelisiniz. Yeni etmenler eklemeden ölçülerin ve özetlenmiş sütunların çözümleme düzeyini değiştirmek için Genişlet'i kullanabilirsiniz. Ev fiyatı ölçü olarak tanımlanmışsa, analiz düzeyini değiştirmek için Genişlet kısmına Ev Kimliği sütununu ekleyebilirsiniz.
Explain by işlevindeki bir alanın, çözümlediğim ölçümü içeren tabloyla benzersiz şekilde ilişkili olmadığını belirten bir hata görüyorum. Bunun nedeni nedir?
Çözümleme, analiz edilen alanın tablo düzeyinde çalışır. Örneğin, hizmetiniz için müşteri geri bildirimlerini analiz ederseniz, bir müşterinin yüksek derecelendirme mi yoksa düşük derecelendirme mi verdiğini belirten bir tablonuz olabilir. Analiziniz, bu durumda, müşteri tablosu düzeyinde gerçekleşir.
Ölçümünüzü içeren tablodan daha ayrıntılı bir düzeyde tanımlanmış ilişkili bir tablonuz varsa bu hatayı görürsünüz. Bir örnek aşağıda verilmiştir:
- Müşterileri hizmetinizin düşük derecelendirmelerini vermeye yönlendiren şeyleri analiz edebilirsiniz.
- Müşterinin hizmetinizi tüketdiği cihazın, yaptıkları incelemeleri etkilenip etkilemediğini görmek istiyorsunuz.
- Bir müşteri hizmeti birden çok farklı şekilde kullanabilir.
- Aşağıdaki örnekte müşteri 100000000, hizmetle etkileşime geçmek için hem tarayıcı hem de tablet kullanır.
Cihaz sütununu açıklayıcı bir faktör olarak kullanmaya çalışırsanız aşağıdaki hatayı görürsünüz:
Cihaz müşteri düzeyinde tanımlanmadığından bu hata görüntülenir. Bir müşteri hizmeti birden çok cihazda kullanabilir. Görselleştirmenin desenleri bulması için cihazın müşterinin bir özniteliği olması gerekir. İşletmeyi anlamanıza bağlı olan çeşitli çözümler vardır:
- Cihazların özetini sayma amacıyla değiştirebilirsiniz. Örneğin, cihaz sayısı müşterinin verdiği puanı etkileyebilirse sayıyı kullanın.
- Hizmeti belirli bir cihazda kullanmanın müşterinin derecelendirmesini etkilenip etkilemediğini görmek için cihaz sütununu özetleyebilirsiniz.
Bu örnekte veriler tarayıcı, mobil ve tablet için yeni sütunlar oluşturmak üzere özetlenmiştir (verilerinizi özetledikten sonra modelleme görünümünde ilişkilerinizi silip yeniden oluşturduğunuzdan emin olun). Şimdi bu belirli cihazları Explain by uygulamasında kullanabilirsiniz. Tüm cihazların etmen olduğu ortaya çıkar ve tarayıcı müşteri puanı üzerinde en büyük etkiye sahiptir.
Daha kesin olarak, hizmeti kullanmak için tarayıcıyı kullanmayan müşterilerin düşük puan verme olasılığı, kullanan müşterilere göre 3,79 kat daha yüksektir. Listenin alt kısmında bunun tersi mobil cihazlar için geçerlidir. Mobil uygulamayı kullanan müşterilerin düşük puan verme olasılığı, kullanmayan müşterilere göre daha yüksektir.
Ölçülerin analizime dahil edilmediğini belirten bir uyarı görüyorum. Bunun nedeni nedir?
Çözümleme, analiz edilen alanın tablo düzeyinde çalışır. Müşteri kaybını analiz ederseniz, bir müşterinin kaybedilip kaybedilmediğini belirten bir tablonuz olabilir. Bu durumda, analiziniz müşteri tablosu düzeyinde çalışır.
Ölçüler ve toplamalar varsayılan olarak tablo düzeyinde analiz edilir. Ortalama aylık harcama için bir ölçü olsaydı, bu ölçü müşteri tablosu düzeyinde analiz edilirdi.
Müşteri tablosunun benzersiz bir tanımlayıcısı yoksa, ölçüyü değerlendiremezsiniz ve analiz tarafından göz ardı edilir. Bu durumu önlemek için, ölçümünüzün bulunduğu tablonun benzersiz bir tanımlayıcısı olduğundan emin olun. Bu durumda, bu müşteri tablosudur ve benzersiz tanımlayıcı müşteri kimliğidir. Power Query kullanarak dizin sütunu eklemek de kolaydır.
Çözümlediğim ölçümün 10'dan fazla benzersiz değere sahip olduğunu ve bu miktarın analizimin kalitesini etkileyebileceğini belirten bir uyarı görüyorum. Bunun nedeni nedir?
Yapay zeka görselleştirmesi kategorik alanları ve sayısal alanları analiz edebilir. Kategorik alanlar için Değişim Sıklığı Evet veya Hayır, Müşteri Memnuniyeti ise Yüksek, Orta veya Düşük olabilir. Analiz için kategorilerin sayısını artırmak, kategori başına daha az gözlem olduğu anlamına gelir. Bu durum görselleştirmenin verilerdeki desenleri bulmasını zorlaştırır.
Sayısal alanları analiz ederken, sayısal alanları metin gibi ele alma seçeneğiniz vardır; bu durumda, kategorik veriler için yaptığınız çözümlemenin aynısını çalıştırırsınız (Kategorik Çözümleme). Çok sayıda farklı değeriniz varsa, çözümlemeyi Sürekli Çözümleme'ye geçirmenizi öneririz. Bu, sayıların farklı değerler olarak ele almak yerine arttığı veya azaldığını gösteren desenler çıkarabildiğimiz anlamına gelir. Kategorik Çözümleme'denSürekli Çözümleme'ye geçiş yapmak için Analiz kartının Görseli biçimlendir bölmesinden geçiş yapabilirsiniz.
Daha güçlü etmenler bulmak için benzer değerleri tek bir ünitede gruplandırmanızı öneririz. Örneğin, fiyat ölçümüne sahipseniz, benzer fiyatları Yüksek, Orta ve Düşük kategorilerinde gruplandırarak ve tek tek fiyat noktalarını kullanarak daha iyi sonuçlar elde edebilirsiniz.
Verilerimde önemli etmenler olması gerektiği gibi görünen faktörler var, ancak bunlar değil. Bu nasıl olur?
Aşağıdaki örnekte, tüketici olan müşteriler düşük derecelendirmelere yol açar ve derecelendirmelerin %14,93'ü düşüktür. Yönetici rolü de 13,42%düşük derecelendirme oranına sahiptir, ancak etmen olarak kabul edilmez.
Bu belirlemenin nedeni, görselleştirmenin etmenleri bulduğunda veri noktalarının sayısını da dikkate almasıdır. Aşağıdaki örnekte 29.000'den fazla tüketici ve 10 kat daha az yönetici (yaklaşık 2.900) vardır. Sadece 390 tanesi düşük derecelendirme yaptı. Görselin, yönetici derecelendirmelerinde bir desen bulup bulmadığını veya bunun sadece tesadüfi bir bulgu olup olmadığını belirlemek için yeterli veri yok.
Ana etmenler için veri noktası sınırları nelerdir?
Analizi 10.000 veri noktası örneği üzerinde çalıştırıyoruz. Bir taraftaki kabarcıklar bulunan tüm influencerları gösterir. Diğer taraftaki sütun grafikler ve dağılım grafikleri, bu temel görseller için örnekleme stratejilerine uyar.
Kategorik analiz için ana etmenleri nasıl hesaplarsınız?
Arka planda yapay zeka görselleştirmesi, ana etmenleri hesaplamak üzere lojistik regresyon çalıştırmak için ML.NET kullanır. Lojistik regresyon, farklı grupları birbiriyle karşılaştıran istatistiksel bir modeldir.
Düşük derecelendirmeleri neyin yönlendirdiğini görmek istiyorsanız lojistik regresyon, düşük puan veren müşterilerin yüksek puan veren müşterilerden nasıl farklı olduğunu gösterir. Yüksek, nötr ve düşük puanlar gibi birden çok kategoriniz varsa, düşük derecelendirme yapan müşterilerin düşük derecelendirme vermeyen müşterilerden nasıl farklı olduğunu göreceksiniz. Bu durumda düşük puan veren müşterilerin yüksek derecelendirme veya nötr derecelendirme yapan müşterilerden farkı nedir?
Lojistik regresyon, verilerdeki desenleri arar ve düşük derecelendirme yapan müşterilerin yüksek derecelendirme yapan müşterilerden nasıl farklı olabileceğini arar. Örneğin, daha fazla destek bileti olan müşterilerin, daha az veya hiç destek bileti olmayan müşterilere kıyasla daha yüksek bir oranda düşük puan verdiğini fark edebilir.
Lojistik regresyon kaç veri noktası olduğunu da dikkate alır. Örneğin, yönetici rolü oynayan müşteriler orantılı olarak daha fazla negatif puan veriyorsa ancak yalnızca birkaç yönetici varsa, bu faktör etkili olarak kabul edilmez. Bu belirleme, bir deseni çıkarsamak için yeterli veri noktası olmadığından yapılır. Bir faktörün etmen olarak kabul edilip edilmediğini belirlemek için Wald testi olarak bilinen istatistiksel test kullanılır. Görsel, eşiği belirlemek için 0,05 p değerini kullanır.
Sayısal analiz için ana etmenleri nasıl hesaplarsınız?
Arka planda yapay zeka görselleştirmesi, ana etmenleri hesaplamak için doğrusal regresyon çalıştırmak için ML.NET kullanır. Doğrusal regresyon, analiz ettiğiniz alanın sonucunun açıklayıcı faktörlerinize göre nasıl değiştiğini gösteren istatistiksel bir modeldir.
Örneğin, ev fiyatlarını analiz ediyorsak doğrusal regresyon, mükemmel bir mutfağın ev fiyatı üzerindeki etkisine bakar. Mükemmel mutfakları olan evlerde genellikle mükemmel mutfakları olmayan evlerle karşılaştırıldığında daha düşük veya daha yüksek ev fiyatları var mı?
Doğrusal regresyon, veri noktalarının sayısını da dikkate alır. Örneğin, tenis kortları olan evlerin fiyatları daha yüksekse ancak tenis kortu olan birkaç evimiz varsa, bu faktör etkili olarak kabul edilmez. Bu belirleme, bir deseni çıkarsamak için yeterli veri noktası olmadığından yapılır. Bir faktörün etmen olarak kabul edilip edilmediğini belirlemek için Wald testi olarak bilinen istatistiksel test kullanılır. Görsel, eşiği belirlemek için 0,05 p değerini kullanır.
Segmentleri nasıl hesaplarsınız?
Arka planda yapay zeka görselleştirmesi ilginç alt grupları bulmak için bir karar ağacı çalıştırmak için ML.NET kullanır. Karar ağacının amacı, ilgilendiğiniz ölçümde görece yüksek bir veri noktaları alt grubuna ulaşmaktır. Düşük derecelendirmeye sahip müşteriler veya yüksek fiyatlara sahip evler olabilir.
Karar ağacı her açıklayıcı faktörü alır ve hangi faktörün en iyi bölmeyi sağladığını muhakeme etmeye çalışır. Örneğin, verileri yalnızca büyük kurumsal müşterileri içerecek şekilde filtrelerseniz, bu durum yüksek derecelendirme ve düşük derecelendirme yapan müşterileri ayırır mı? Ya da verileri yalnızca güvenlikle ilgili yorum yapan müşterileri içerecek şekilde filtrelemek daha iyi olabilir mi?
Karar ağacı bir bölme işlemi yaptıktan sonra veri alt grubunu alır ve bu veriler için bir sonraki en iyi bölmeyi belirler. Bu durumda alt grup, güvenlikle ilgili yorum yapan müşterilerdir. Her bölmeden sonra karar ağacı, bu grubun bir desen çıkarabilecek kadar temsili olması için yeterli veri noktası olup olmadığını da değerlendirir. Değilse, gerçek bir segment değil, verilerdeki bir anomalidir. P değeri 0,05 olan bölme koşulunun istatistiksel önemini denetlemek için başka bir istatistiksel test uygulanır.
Karar ağacının çalışması bittikten sonra, güvenlik yorumları ve büyük kuruluş gibi tüm bölümleri alır ve Power BI için filtreler oluşturur. Bu filtre bileşimi görselde bir segment olarak paketlenir.
Neden belirli faktörler Explain by alanına daha fazla geçerken etkileyici olur veya olmaktan vazgeçer?
Görselleştirme tüm açıklayıcı faktörleri birlikte değerlendirir. Bir faktör kendi başına bir etmen olabilir, ancak diğer faktörlerle birlikte değerlendirildiğinde olmayabilir. Açıklayıcı faktörler olarak yatak odaları ve ev boyutu ile bir ev fiyatının yüksek olmasına neyin neden olduğunu analiz etmek istediğinizi varsayalım:
- Tek başına, daha fazla yatak odası ev fiyatlarının yüksek olması için bir sürücü olabilir.
- Analize ev boyutu dahil etmek, artık ev boyutu sabit kalırken yatak odalarına ne olduğunu inceleyebilmek anlamına gelir.
- Ev boyutu 1.500 metre kare olarak sabitlenmişse, yatak odası sayısındaki sürekli artışın ev fiyatını önemli ölçüde artırması olası değildir.
- Yatak odaları, ev büyüklüğü dikkate alınmadan önceki bir faktör kadar önemli olmayabilir.
Raporunuzu bir Power BI iş arkadaşınızla paylaşmak için her ikisinde de ayrı Fabric veya Power BI Pro lisansları olması veya raporun Premium kapasiteye kaydedilmesi gerekir. Bkz. raporları paylaşma.