Identifikácia odchýlok pomocou vizuálov služby Power BI

Dokončené

Odchýlka je typ anomálie v údajoch – niečo, čo ste nečakali alebo čo vás prekvapilo na základe historických priemerov alebo výsledkov. Na izolovanie údajových bodov, ktoré sa výrazne líšia od ostatných údajových bodov, je vhodné identifikovať rozdiely a potom podniknúť kroky na preskúmanie dôvodov rozdielov. Výsledky tejto analýzy môžu mať obrovský vplyv na rozhodovanie v podnikaní.

Predstavte si, že analyzujete údaje pre distribučný sklad. Všimnete si, že počet objednávok konkrétnej kategórie produktu sa prudko zvýšil nad priemer. Najprv zistite, o ktorú kategóriu produktov ide. Potom si položte niekoľko otázok týkajúcich sa odchýlok:

  • Vyskytli sa v ten deň nadpriemerné zásielky?

  • Vyskytla sa táto anomália v konkrétnom sklade?

  • Spôsobila nárast v objednávkach v rámci konkrétnej kategórie iba jedna udalosť?

  • Vyskytli sa v poslednom mesiaci, štvrťroku, roku alebo predchádzajúcom roku nejaké ďalšie podobné udalosti?

Power BI vám umožňuje identifikovať odchýlky v údajoch, ale najprv musíte určiť logiku toho, čo predstavuje odchýlku. Pri tom, čo je podľa vás odchýlka, môžete použiť spúšťacie body, ako napríklad výpočty.

Proces identifikácie odchýlok zahŕňa segmentáciu údajov do dvoch skupín: jedna skupina obsahuje údaje s odchýlkou, druhá skupina údaje bez nej. Aj vypočítané stĺpce by ste mohli použiť na identifikáciu odchýlok, ale výsledky by sa nezmenili, kým by ste údaje neobnovili. Lepší spôsob, ako identifikovať odchýlky, je použiť vizualizáciu alebo vzorec DAX, pretože tieto metódy zabezpečia dynamické výsledky.

Po identifikácii odchýlok v údajoch môžete potom tieto odchýlky zvýrazniť pomocou rýchlych filtrov alebo filtrov. Okrem toho môžete do vizuálov pridať legendu, aby sa odchýlky dali identifikovať medzi ostatnými údajmi. Potom môžete urobiť podrobnejšiu analýzu údajov odchýlok.

Použitie vizuálu na identifikáciu odchýlok

Najlepším vizuálom na identifikáciu odchýlok je bodový graf, ktorý zobrazuje vzťah medzi dvomi numerickými hodnotami. Bodový graf zobrazuje vzory vo veľkých množinách údajov, preto je ideálny na zobrazenie odchýlok.

Keď pridáte bodový graf do zostavy Power BI, polia, ktoré vás zaujímajú, zadáte do sekcií Os XOs Y. V tomto prípade sa pole Dodané objednávky nachádza na osi X a pole Množstvo objednávok na osi Y.

Snímka obrazovky znázorňujúca pridanie polí na vyplnenie bodového grafu.

Vizuál sa aktualizuje a zobrazí údaje podľa vybratých polí a vy budete môcť jasne rozpoznať odchýlky v týchto údajoch – ide o izolované položky, ktoré sa nachádzajú mimo skupiny údajov.

Snímka obrazovky s bodovým grafom s odchýlkou.

Teraz, keď viete identifikovať odchýlky v údajoch, môžete preskúmať dôvody ich existencie a vykonať nápravné kroky.

Použitie jazyka DAX na identifikáciu odchýlok

DAX môžete použiť na vytvorenie mierky, ktorá identifikuje odchýlky v údajoch, ako napríklad v nasledujúcom vzorci:

Outliers =
CALCULATE (
    [Order Qty],
    FILTER (
        VALUES ( Product[Product Name] ),
        COUNTROWS ( FILTER ( Sales, [Order Qty] >= [Min Qty] ) ) > 0
    )
)

Množstvo objednávky je mierka v tabuľke Sales (Predaj) a Minimálne množstvo (Qty) odkazuje na najnižšie množstvo objednávok v tabuľke Sales (Predaj)

Po vytvorení novej mierky odchýlok môžete produkty zoskupiť do kategórií pomocou funkcie zoskupenia, ako ste už urobili predtým pri vytváraní histogramu. Potom je potrebné pridať vizuál bodového grafu, ako ste to urobili v predchádzajúcej časti, pretože ide o najlepšiu možnosť vizualizácie na zobrazenie odchýlok. Po pridaní bodového grafu ho vyplníte poľami, ktoré sú priradené k vášmu vzorcu DAX a mierke odchýlok.

Snímka obrazovky znázorňujúca výber logických polí odchýlok na použitie v bodovom grafe.

V bodovom grafe budete môcť identifikovať odchýlky v údajoch. Potom môžete preskúmať dôvody ich existencie a vykonať nápravné kroky.

Snímka obrazovky s bodovým grafom na vyplnenie odchýlok.