Transformacija i mapiranje podataka

Kada izaberete izvor podataka želite da koristite, bićete odvedeni u uređivač Power Query . Uređivač upita je moćna alatka za transformaciju podataka. Da biste saznali više, idite na Power Query korisnički interfejs.

Evo nekih razloga zbog kojih ćete možda želeti da transformišete podatke:

  • Možda vas ne zanimaju sva imena aktivnosti koja su evidentirana i zato želite da filtrirate određena imena aktivnosti koja su važna za proces koji pokušavate da iskopate.

  • Možda ćete želeti da imena aktivnosti preimenujete tako da budu opisnija i razumljivija. To često nije slučaj sa imenima u bazi podataka.

  • Možda će vas zanimati samo određeni opseg datuma, a ne celokupna istorija podataka.

  • Možda ćete želeti da kombinujete više ID kolona sa ID-om predmeta. Ovo se često radi kada ID koji želite da koristite za rudarenje procesa ne postoji ili je kombinacija više ID-ova u aplikaciji. Na primer, kada klijent zapuši karte za podršku, tiket za podršku može biti dodeljen korisnička služba agenti. Ako želite da analizirate kako svaki agent rukuje svakom kartom, kombinovali biste ID agenta i ID tiketa u ID predmeta.

Imena aktivnosti filtera

  1. Izaberite karit pored kolone sa imenom aktivnosti da biste doneli meni za sortiranje i filtriranje.

  2. Ako postoji poruka koja kaže da je lista možda nepotpuna , izaberite stavku Učitaj više.

  3. Izaberite samo imena aktivnosti koja želite da analizirate. Opozovite izbor imena koje želite da izuzmete.

    Snimak ekrana imena aktivnosti filtriranja.

  4. Druga mogućnost je da koristite meni filtera za tekst za naprednije filtriranje. Za više informacija o filtriranju po vrednosti idite na opciju " Filtriranje po vrednostima" u koloni.

Preimenovanje aktivnosti

  1. Uverite se da je izabrana kolona "Ime aktivnosti".
  2. Iznad trake sa alatkama izaberite karticu "Transformacija ".
  3. Na traci sa alatkama izaberite stavku Zameni vrednosti.
  4. U okviru Vrednosti koje treba pronaći upišite ime aktivnosti onako kako se pojavljuje izvor podataka koji želite da zamenite.
  5. U okviru Zameni sa upišite ime aktivnosti koje želite da prikažete u mapi procesa.
  6. Ponovite ovaj proces za sve vrednosti koje želite da zamenite.

Smanjivanje broja ukupnih zapisa

Jedna od strategija za smanjenje ukupnog broja zapisa je korišćenje samo najnovijih zapisa. Da biste to uradili, potrebno je da prvo sortirate podatke po vremenu.

  1. Otvorite meni za sortiranje i filtriranje tako što ćete izabrati kazalj pored kolone startTimestamp .

    Snimak ekrana smanjenja broja ukupnih zapisa.

  2. Da bi se najsvežiji zapisi prvi pojavili, izaberite stavku Sortiraj po opadajućem redosledu.

  3. Kliknite na dugme "U redu", a zatim na traci sa alatkama izaberite stavku Zadrži redove.

  4. Unesite 150000 pod brojem redova.

  5. Kliknite na dugme "U redu" da biste filtrirali prvih 150.000 redova.

Kombinovanje više ID-a

Možete da koristite taster Ctrl + da biste izabrali više kolona koje želite da kombinujete.

  1. Na traci sa alatkama kartice "Transformacija" izaberite stavku Objedini kolone.
  2. (Opcionalno) Izaberite znak za razdvajanje sa padajuće liste. Druga mogućnost je da izaberete nijednu .
  3. Promenite ime (ili zanemarujte podrazumevano ime koje se generiše), tako da ga možete izabrati prilikom mapiranja na ID predmeta.

Mapiranje podataka

Mapiranje govori o mogućnosti rudarenja procesa koja kolona je mapirana na koju vrstu atributa (na primer, ID predmeta, ime aktivnosti ili oznaka tipa datoteke).

  1. Kliknite na dugme "Dalje" da biste se kretali do ekrana za mapiranje .
  2. Koristite padajuće menije pored kolona da biste izabrali tip njihovog atributa. Za više informacija sledite opis tipova atributa.
  3. Kada se podaci unose iz Azure Data Lake Gen2 pomoću CSV formata datoteke, možete da koristite padajuće menije u koloni "Tip podataka " da biste promenili tipove podataka za uvoz. Za kolone koje imaju numeričke vrednosti, uzmite u obzir njihovu analitičku upotrebu da li je atribut neprekidna vrednost (npr. iznos fakture postavljen na "Broj ") ili kategorična vrednost (na primer, šifra materijala postavljena na "Tekst ").
  4. ID predmeta, aktivnost i vreme početka su obavezni atributi da biste nastavili sa analizom.
  5. Da biste započeli analizu procesa, izaberite sačuvaj i analiziraj.