Бөлісу құралы:


Деректерді түрлендіру және салыстыру

Пайдаланғыңыз келетін деректер көзі таңдағаннан кейін Power Query Өңдегішке өтесіз. Сұраныс өңдегіші деректеріңізді түрлендірудің қуатты құралы болып табылады. Қосымша ақпарат алу үшін Power Query пайдаланушы интерфейсіне өтіңіз.

Міне, деректерді түрлендіруді қалауыңыздың кейбір себептері:

  • Жүйеге енгізілген барлық әрекет атаулары сізді қызықтырмауы мүмкін, сондықтан сіз өндіруге әрекеттеніп жатқан процесс үшін маңызды арнайы әрекет атауларын сүзгіңіз келеді.

  • Сипаттамалық және түсінікті болу үшін кейбір әрекет атауларының атын өзгерткіңіз келуі мүмкін. Бұл дерекқордағы атаулармен жиі болмайды.

  • Сізді деректердің бүкіл тарихы емес, белгілі бір күндер ауқымы ғана қызықтыруы мүмкін.

  • Іс идентификаторынан бірнеше ID бағандарын біріктіргіңіз келуі мүмкін. Бұл көбінесе процесті өндіру үшін пайдаланғыңыз келетін идентификатор болмаған кезде немесе қолданбадағы бірнеше идентификаторлардың тіркесімі болғанда жасалады. Мысалы, тұтынушы қолдау билеттерін жіберген кезде, қолдау билеті бірнеше Тұтынушыға қызмет көрсету агенттеріне тағайындалуы мүмкін. Әрбір агенттің әрбір билетті қалай өңдейтінін талдағыңыз келсе, агент идентификаторы мен билет идентификаторын іс идентификаторына біріктіресіз.

Әрекет атауларын сүзіңіз

  1. Сұрыптау және сүзгі мәзірін шығару үшін әрекет атауы бағанының жанындағы каретканы таңдаңыз.

  2. Егер Тізім толық емес болуы мүмкін деген хабар болса, Қосымша жүктеу опциясын таңдаңыз.

  3. Талдағыңыз келетін әрекет атауларын ғана таңдаңыз. Шығарғыңыз келетін кез келген атаудан құсбелгіні алып тастаңыз.

    Сүзгі әрекеті атауларының скриншоты.

  4. Немесе кеңейтілген сүзгілеу үшін Мәтін сүзгісі мәзірін пайдалануға болады. Мән бойынша сүзу туралы қосымша ақпарат алу үшін Бағандағы мәндер бойынша сүзу бөліміне өтіңіз.

Әрекеттердің атын өзгерту

  1. Әрекет атауы бағанының таңдалғанына көз жеткізіңіз.
  2. Құралдар тақтасының үстінде Transform қойындысын таңдаңыз.
  3. Құралдар тақтасында Мәндерді ауыстыру таңдаңыз.
  4. Табылатын мәндер астында әрекет атауын ауыстырғыңыз келетін деректер көзі файлында көрсетілгендей теріңіз.
  5. Ауыстыру астында процесс картасында көрсеткіңіз келетін әрекет атауын теріңіз.
  6. Ауыстыру керек барлық мәндер үшін осы процесті қайталаңыз.

Жалпы жазбалар санын азайтыңыз

Жазбалардың жалпы санын азайтудың бір стратегиясы тек соңғы жазбаларды пайдалану болып табылады. Ол үшін алдымен деректерді уақыт бойынша сұрыптау керек.

  1. Сұрыптау және сүзгі мәзірін startTimestamp бағанының жанындағы каретканы таңдау арқылы ашыңыз.

    Жалпы жазбалар санын азайтудың скриншоты.

  2. Ең соңғы жазбалар алдымен көрсетілуі үшін Кему бойынша сұрыптау таңдаңыз.

  3. Жарайды, содан кейін құралдар тақтасында Жолдарды сақтау опциясын таңдаңыз.

  4. 150000 астына Жолдар санын енгізіңіз.

  5. Жоғарғы 150 000 жолды сүзу үшін Жарайды тәрменін таңдаңыз.

Бірнеше идентификаторларды біріктіріңіз

Сіз біріктіргіңіз келетін бірнеше бағандарды таңдау үшін Ctrl + басу пайдалана аласыз.

  1. Трансформация қойындысының құралдар тақтасында Бағандарды біріктіру таңдаңыз.
  2. (Қосымша) Ашылмалы тізімнен бөлгішті таңдаңыз. Немесе ешқайсысын таңдауға болады.
  3. Атауды өзгертіңіз (немесе жасалған әдепкі атауды жазып алыңыз), сондықтан оны іс идентификаторымен салыстыру кезінде таңдауға болады.

Деректерді салыстыру

Салыстыру процесті анықтау мүмкіндігіне қай атрибут түріне қай баған салыстырылғанын айтады (мысалы, іс идентификаторы, әрекет атауы немесе уақыт белгісі).

  1. Карталау экранына өту үшін Келесі таңдаңыз.
  2. Төлсипат түрін таңдау үшін тиісті бағандардың жанындағы ашылмалы мәзірлерді пайдаланыңыз. Қосымша ақпарат алу үшін атрибут түрлерінің сипаттамасын орындаңыз.
  3. Деректер CSV файл пішімін пайдаланып Azure Data Lake Gen2 ішінен алынған кезде импорттау үшін деректер түрлерін өзгерту үшін Дерек түрі бағанындағы ашылмалы мәзірлерді пайдалануға болады. Сандық мәндері бар бағандар үшін төлсипат үздіксіз мән (мысалы, шот-фактура сомасы Нөмірге орнатылған) немесе категориялық мән (мысалы, материал коды Мәтін).
  4. Іс идентификаторы, әрекет және Бастау уақыт белгісі талдауды жалғастыру үшін міндетті төлсипаттар болып табылады.
  5. Процессіңізді талдауды бастау үшін Сақтау және талдау таңдаңыз.