Zdieľať cez


Kurz: Vytvorenie modelu strojového učenia v službe Power BI

Dôležitý

Vytváranie modelov strojového učenia v službe Power BI Automated (AutoML) pre toky údajov v1 sa prestalo a už nie je k dispozícii. Zákazníkom sa odporúča migrovať vaše riešenie do funkcie automatizovaného strojového učenia v službe Microsoft Fabric. Ďalšie informácie nájdete oznámení o odchode do dôchodku.

V tomto kurze použijete automatizované strojového učenia na vytvorenie a použitie modelu binárnych predpovedí v službe Power BI. Vytvoríte tok údajov služby Power BI a použijete entity, ktoré definujete v toku údajov, na trénovanie a overovanie modelu strojového učenia priamo v službe Power BI. Potom tento model použijete na skóre nových údajov a generovanie predpovedí.

Najprv vytvoríte model strojového učenia binárnych predpovedí na predpovedanie nákupného zámeru online nakupujúcich na základe množiny ich atribútov online relácie. Pre toto cvičenie používate benchmarkový sémantický model strojového učenia. Po vytrénovaní modelu Služba Power BI automaticky vygeneruje zostavu overenia, ktorá vysvetľuje výsledky modelu. Potom môžete skontrolovať zostavu overenia a použiť model na svoje údaje a bodovanie.

Tento kurz sa skladá z nasledujúcich krokov:

  • Vytvorte tok údajov so vstupnými údajmi.
  • Vytvorte a trénujte model strojového učenia.
  • Skontrolujte zostavu overenia modelu.
  • Použiť model na entitu toku údajov.
  • Použite bodovaný výstup z modelu v zostave Power BI.

Vytvorenie toku údajov so vstupnými údajmi

Vytvorte tok údajov so vstupnými údajmi pomocou nasledujúcich krokov.

Získanie údajov

Prvým krokom pri vytváraní toku údajov je príprava zdrojov údajov. V tomto prípade používate sémantický model strojového učenia z množiny online relácií, z ktorých niektoré vyvrcholili nákupom. Sémantický model obsahuje množinu atribútov o týchto reláciách, ktoré používate na trénovaie modelu.

Sémantický model si môžete stiahnuť z webovej lokality UC Irvine alebo stiahnutím online_shoppers_intention.csv. Neskôr sa v tomto kurze pripojíte k sémantickému modelu zadaním jeho URL adresy.

Vytvorenie tabuliek

Ak chcete vytvoriť entity vo svojom toku údajov, prihláste sa do služby Power BI a prejdite do pracovného priestoru.

  1. Ak nemáte pracovný priestor, vytvorte si ho tak, že na navigačnej table Služby Power BI vyberiete Pracovné priestory a potom vyberiete položky Vytvoriť pracovný priestor. Na paneli Vytvorenie pracovného priestoru zadajte názov pracovného priestoru a vyberte položky Uložiť.

    Snímka obrazovky s postupom vytvorenia pracovného priestoru.

  2. V hornej časti nového pracovného priestoru vyberte Nová položka a potom v časti Získať údajevyberte položky Tok údajov Gen2.

    Snímka obrazovky s postupom vytvorenia toku údajov.

  3. V dialógovom okne, ktoré sa otvorí, zadajte názov toku údajov a potom vyberte položky Vytvoriť.

  4. V editore Power Query vyberte položky Importovať zo súboru Text/CSV.

    Snímka obrazovky znázorňujúca možnosť importu z textového/CSV súboru.

  5. Na stránke Pripojiť k zdroju údajov prilepte nasledujúce prepojenie na súbor online_shoppers_intention.csv do poľa Cesta k súboru alebo URL adresa a potom vyberte Ďalej.

    https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

    Snímka obrazovky zobrazujúca prilepenie cesty k súboru.

  6. Editor Power Query zobrazuje ukážku údajov zo súboru CSV. Ak chcete vykonať zmeny v údajoch pred ich načítaním, vyberte položku Transformovať údaje.

    Snímka obrazovky znázorňujúca výber položky Transformovať údaje na obrazovke Údaje v ukážke súboru.

  7. Power Query automaticky odvodí typy údajov stĺpcov. Typy údajov môžete zmeniť výberom ikony typu atribútu v hornej časti hlavičiek stĺpcov. Zmeňte typ stĺpca Revenue na True/False.

    Dotaz môžete premenovať na popisnejší názov tak, že zmeníte hodnotu v poli Názov na pravej table. Zmeňte názov dotazu na Online návštevníci.

    Snímka obrazovky znázorňujúca zmenu názvu dotazu a typu údajov stĺpca Výnosy.

  8. Vyberte položky Uložiť & zavrieť.

Vytvorenie a trénovanie modelu strojového učenia

Pridanie modelu strojového učenia:

  1. Vyberte ikonu Použiť model strojového učenia v zozname akcie pre tabuľku, ktorá obsahuje tréningové údaje a informácie o označení, a potom vyberte položku Pridať model strojového učenia.

    Snímka obrazovky zobrazujúca pridanie modelu strojového učenia.

  2. Prvým krokom pri vytváraní modelu strojového učenia je identifikácia historických údajov vrátane poľa výsledku, ktoré chcete predpovedať. Model sa vytvorí učením z týchto údajov. V tomto prípade chcete predpovedať, či návštevníci urobia nákup. Výsledok, ktorý chcete predpovedať, je v poli Revenue (Výnos). Ako hodnotu stĺpca Outcome vyberte položku Revenue (Výnos) a potom vyberte položky Ďalej.

    Snímka obrazovky zobrazujúca výber poľa historických údajov.

  3. V ďalšom kroku vyberte typ modelu strojového učenia, ktorý chcete vytvoriť. Power BI analyzuje hodnoty v poli výsledku, ktoré ste identifikovali, a navrhuje typy modelov strojového učenia, ktoré môže vytvoriť na predpovedanie tohto poľa.

    V tomto prípade, keďže chcete predpovedať binárny výsledok toho, či sa návštevník chystá uskutočniť nákup, power BI odporúča binárnu predpoveď. Keďže chcete predpovedať návštevníkov, ktorí sa chystajú uskutočniť nákup, vyberte možnosť true v časti Vyberte cieľový výsledok. Pre výsledky v automaticky generovanej zostave, ktorá sumarizuje výsledky overenia modelu, môžete tiež zadať rôzne označenia. Potom vyberte Ďalšie.

    Snímka obrazovky zobrazujúca obrazovku Binárna predpoveď.

  4. Power BI vykoná predbežnú kontrolu vzorky vašich údajov a navrhne vstupy, ktoré by mohli produkovať presnejšie predpovede. Ak Power BI stĺpec neodporúča, vysvetľuje, prečo sa nenachádza vedľa stĺpca. Výbery môžete zmeniť tak, aby obsahovali len polia, ktoré má model preskúmať, výberom alebo zrušením začiarknutia políčok vedľa názvov stĺpcov. Výberom položky Ďalej vstupy prijmete.

    Snímka obrazovky zobrazujúca výbery stĺpcov.

  5. V poslednom kroku pomenujte model Predpoveď zámeru nákupua vyberte čas, ktorý chcete vynaložiť na trénovanie. Môžete skrátiť čas trénovania, aby ste mohli zobraziť rýchle výsledky, alebo zvýšiť čas na získanie najlepšieho modelu. Potom vyberte položku Uložiť a trénovať začnite s trénovaním modelu.

    Snímka obrazovky zobrazujúca pomenovanie modelu a výber času trénovania.

Ak sa zobrazí chyba podobná Poverenia sa nenašli pre zdroj údajov, musíte aktualizovať svoje poverenia, aby služba Power BI mohla vyhodnotiť skóre údajov. Ak chcete aktualizovať svoje poverenia, vyberte Ďalšie možnosti ... na paneli hlavičky a potom vyberte položky Nastavenia>Nastavenia.

Snímka obrazovky zobrazujúca výber položky Nastavenia.

V časti Toky údajovvyberte svoj tok údajov,rozbaľte poverenia zdroja údajov a potom vyberte položky Upraviť poverenia.

Snímka obrazovky zobrazujúca úpravu poverení toku údajov.

Sledovanie stavu tréningu

Proces trénovania sa začína vzorkovaním a normalizáciou historických údajov a rozdelením sémantického modelu do dvoch nových entít: Predpoveď zámeru nákupu Trénovacie údaje a Predpoveď zámeru nákupu – Testovacie údaje.

V závislosti od veľkosti sémantického modelu môže proces trénovania trvať od niekoľkých minút až po čas trénovania, ktorý ste vybrali. Môžete potvrdiť, že model je trénovaný a overený prostredníctvom stavu toku údajov. Stav sa zobrazí ako priebeh obnovenia údajov v sémantických modeloch + tokoch údajov karte pracovného priestoru.

Snímka obrazovky zobrazujúca model v rámci trénovania.

Model si môžete pozrieť na karte Modely strojového učenia karte toku údajov. Stav udáva, či bol model zaradený do frontu na trénovaie, je trénovaný alebo je trénovaný. Po dokončení trénovania modelu tok údajov zobrazí aktualizovaný Naposledy trénovaný čas a stav Trénované.

Snímka obrazovky zobrazujúca stav Trénované a Naposledy trénovaný čas.

Kontrola zostavy overenia modelu

Ak chcete skontrolovať zostavu overenia modelu, na karte modely strojového učenia vyberte ikonu Zobraziť zostavu trénovania v časti Akcie. Táto zostava popisuje pravdepodobnú výkonnosť vášho modelu strojového učenia.

Na strane zostavy Výkon modelu vyberte položky Zobraziť hlavné prediktory a zobrazte hlavné prediktory pre svoj model. Výberom niektorého z prediktorov môžete zistiť priradenie distribúcie výsledkov k tomuto prediktoru.

Snímka obrazovky zobrazujúca stránku výkonu modelu.

Rýchly filter prahovej hodnoty pravdepodobnosti na strane výkonu modelu môžete použiť na preskúmanie vplyvu presnosti modelu a úplnosti v modeli.

Snímka obrazovky zobrazujúca rýchly filter Prahová hodnota pravdepodobnosti.

Ostatné strany zostavy popisujú štatistické metriky výkonu pre model.

Zostava obsahuje aj stránku Training Details (Podrobnosti trénovania), ktorá popisuje spustenie iterácií , spôsob extrahovania funkcií zo vstupov a hyperparametre pre model Final použitý.

Použitie modelu na entitu toku údajov

Výberom tlačidla Použiť model v hornej časti zostavy vyvolajte tento model. V dialógovom okne použiť môžete zadať cieľovú entitu, ktorá obsahuje zdrojové údaje, na ktoré sa má model použiť. Potom vyberte položku Uložiť a použiť.

Snímka obrazovky zobrazujúca použitie modelu.

Použitím modelu sa vytvoria dve nové tabuľky s príponami obohatené <model_name> a obohatené <model_name> vysvetlenia. V tomto prípade sa model použije na Online návštevníci tabuľke vytvorí:

  • Online návštevníci – obohatená Predpoveď zámeru nákupu, ktorá obsahuje predpovedaný výstup z modelu.
  • Online návštevníci – obohatená Predpoveď zámeru nákupu – vysvetlenia, ktorá obsahuje najvýznamnejších vplyvov špecifických pre danú predpoveď.

Pri použití modelu binárnych predpovedí sa pridajú štyri stĺpce: Outcome, PredictionScore, PredictionExplanationa ExplanationIndex, ktoré majú predponu Predpoveď zámeru nákupu.

Snímka obrazovky zobrazujúca štyri nové stĺpce.

Po dokončení obnovenia toku údajov môžete vybrať tabuľku Online návštevníci – obohatená Predpoveď zámeru nákupu tabuľku na zobrazenie výsledkov.

Snímka obrazovky zobrazujúca zobrazenie výsledkov v tabuľke Online návštevníci obohatenej Predpoveď zámeru nákupu.

Môžete tiež vyvolať akýkoľvek automatizovaný model strojového učenia v pracovnom priestore priamo z editora Power Query v toku údajov. Ak chcete získať prístup k automatizovaným modelom strojového učenia, vyberte položku Upraviť pre tabuľku, ktorú chcete obohatiť prehľadmi zo svojho automatizovaného modelu strojového učenia.

Snímka obrazovky zobrazujúca výber položky Upraviť pre tabuľku.

V Editore Power Query vyberte na páse s nástrojmi položku prehľady AI.

Snímka obrazovky zobrazujúca výber prehľadov UI.

Na obrazovke prehľadov prehľadov služby AI vyberte na navigačnej table priečinok modely strojového učenia služby Power BI. V zozname sa zobrazujú všetky modely strojového učenia, ku ktorým máte prístup ako funkcie služby Power Query. Vstupné parametre pre model strojového učenia sa automaticky primapujú ako parametre zodpovedajúcej funkcie Power Query. Automatické mapovanie parametrov sa uskutoční iba v prípade, ak sú názvy a typy údajov parametra rovnaké.

Model strojového učenia môžete vyvolať výberom ktoréhokoľvek stĺpca vybratého modelu ako vstupu v rozbaľovacom zozname. Môžete tiež zadať konštantnú hodnotu, ktorá sa má použiť ako vstup, a to tak, že prepnete ikonu stĺpca vedľa vstupnej čiary.

Snímka obrazovky zobrazujúca prehliadač funkcií Power Query.

Výberom položky Použiť zobrazíte ukážku výstupu modelu strojového učenia vo forme nových stĺpcov v tabuľke. Vyvolanie modelu sa zobrazí aj v časti Použité kroky pre dotaz.

Snímka obrazovky zobrazujúca zobrazenie ukážky výsledkov v Editore Power Query.

Po uložení toku údajov sa model automaticky vyvolá pri obnovení toku údajov v prípade akýchkoľvek nových alebo aktualizovaných riadkov v tabuľke entít.

Použitie bodovaného výstupu z modelu v zostave Power BI

Ak chcete použiť bodovaný výstup z modelu strojového učenia, môžete sa pripojiť k svojmu toku údajov z aplikácie Power BI Desktop pomocou konektora Toky údajov konektor. Teraz môžete použiť tabuľku Online návštevníci – obohatená Predpoveď zámeru nákupu tabuľku na zahrnutie predpovedí z vášho modelu v zostavách Power BI.

Obmedzenia

Pri používaní brán s automatizovaným strojovým učením sa vyskytli známe problémy. Ak potrebujete použiť bránu, najlepšie je vytvoriť tok údajov, ktorý najskôr importuje potrebné údaje prostredníctvom brány. Potom vytvorte ďalší tok údajov, ktorý odkazuje na prvý tok údajov a vytvorí alebo použije tieto modely.

Ak vaša AI práca s tokmi údajov zlyhá, pri používaní umelej inteligencie s tokmi údajov možno budete musieť povoliť Rýchlu kombináciu. Po importovaní tabuľky a pred tým, ako začnete pridávať funkcie AI, vyberte položku Možnosti na páse s nástrojmi Domov a v okne, ktoré sa zobrazí, začiarknite políčko vedľa položky Povoliť kombinovanie údajov z viacerých zdrojov a povoľte túto funkciu výberom položky OK výber uložte. Potom môžete do toku údajov pridať funkcie AI.

V tomto kurze ste vytvorili a použili model binárnych predpovedí v službe Power BI vykonaním týchto krokov:

  • Vytvorenie toku údajov so vstupnými údajmi.
  • Vytvorenie a trénovanie modelu strojového učenia.
  • Skontrolujte zostavu overenia modelu.
  • Použiť model na entitu toku údajov.
  • Naučte sa používať bodovaný výstup z modelu v zostave Power BI.

Ďalšie informácie o automatizácii strojového učenia v službe Power BI nájdete v téme Automatizované strojové učenie v službe Power BI.