Latihan: Menganalisis data

Selesai

Sekarang mari kita masukkan beberapa prinsip dan teknik analisis data yang telah Anda pelajari. Di lab ini, Anda akan menggunakan Excel Online untuk menganalisis dan memvisualisasikan data.

Di lab ini, Anda menganalisis penjualan limun Rosie, dan membuat visualisasi untuk membantu Anda mendapatkan wawasan dari data.

Sebelum memulai

Catatan

Jika Anda telah menyelesaikan modul sebelumnya di jalur pembelajaran ini, Anda dapat melewati bagian Sebelum memulai.

Jika Anda belum memiliki akun Microsoft (misalnya hotmail.com, . live.comatau outlook.com akun), daftar untuk akun tersebut di https://signup.live.com.

Upload buku kerja untuk OneDrive

  1. Di browser web Anda, navigasikan ke https://onedrive.live.com, dan masuk menggunakan kredensial akun Microsoft Anda. Anda akan melihat file dan folder di OneDrive Anda, seperti ini:

    Screenshot of One Drive My Files folder.

  2. Pada menu + Baru , pilih Folder untuk membuat folder baru. Anda dapat memberi nama ini apa pun yang Anda suka, misalnya DAT101. Saat folder baru Anda muncul, pilih folder tersebut untuk membukanya.

  3. Di folder kosong baru Anda, pada menu ⤒ Upload, klik File. Kemudian ketika diminta, dalam kotak Nama file, masukkan alamat berikut (Anda dapat menyalin dan menempelkannya dari sini!):

    https://github.com/MicrosoftLearning/mslearn-data-concepts/raw/main/labfiles/Lemonade.xlsx
    

    Kemudian klik Buka untuk mengunggah file Excel yang berisi data limun Rosie, seperti yang ditunjukkan di sini:

    Screenshot of uploading a file to One Drive.

    Setelah beberapa detik, file Lemonade.xlsx akan muncul di folder Anda seperti ini:

    Screenshot of Lemonade x l s x file in One Drive.

Buka buku kerja di Excel Online

  1. Klik file Lemonade.xlsx di folder OneDrive Anda untuk membukanya di Excel Online. Saat dibuka, akan terlihat seperti ini:

    Screenshot of Lemonade workbook in Excel.

  2. Tanggal dalam kolom A mungkin terlalu lebar untuk ditampilkan, sehingga sel mungkin berisi ####### seperti yang diperlihatkan sebelumnya. Untuk melihat tanggal, klik dua kali garis antara header kolom A dan B. Tanggal sekarang ditampilkan dalam format untuk lokal yang terkait dengan akun Microsoft Anda. Misalnya, dalam gambar berikut, tanggal ditampilkan dalam format Inggris (hh/BB/tttt).

    Screenshot of column A widened to show dates.

Latihan 1: Menganalisis data dengan PivotTable

PivotTable adalah cara terbaik untuk mengpotong dan membagi data, meringkas pengukuran numerik dengan satu atau beberapa dimensi. Dalam latihan ini, Anda akan menggunakan PivotTable untuk melihat data lemonade, yang diagregasi dengan berbagai cara.

Membuat PivotTable

  1. Jika Anda belum melakukannya, di browser web Anda, navigasikan ke https://onedrive.live.com, dan masuk menggunakan kredensial akun Microsoft Anda. Lalu buka buku kerja Lemonade.xlsx di folder tempat Anda mengunggahnya di bagian Sebelum Memulai. Buku kerja Anda akan terlihat seperti ini:

    Screenshot of Lemonade workbook in Excel Online.

  2. Pilih sel apa pun dalam tabel data, dan pada tab Sisipkan dari pita, klik PivotTable, dan buat PivotTable dari tabel data Anda di lembar kerja baru. Excel menambahkan lembar kerja baru dengan PivotTable yang terlihat seperti ini:

    Screenshot of an empty Pivot Table in Excel Online.

  3. Di panel Bidang PivotTable, pilih Bulan. Excel secara otomatis menambahkan Bulan ke area Baris PivotTable dan menampilkan nama bulan dalam urutan kronologis.

  4. Di panel Bidang PivotTable, pilih Penjualan. Excel secara otomatis menambahkan Jumlah Penjualan ke area Nilai PivotTable dan menampilkan jumlah total (jumlah) penjualan limun untuk setiap bulan, seperti ini:

    Screenshot of a Pivot Table showing sales summed by month.

    Anda sekarang dapat melihat penjualan diagregasi menurut bulan - jadi misalnya, ada 1.056 penjualan pada bulan Juni.

Tambahkan dimensi kedua

  1. Di panel Bidang PivotTable, pilih Hari. Excel secara otomatis menambahkan Hari ke area Baris PivotTable dan menampilkan jumlah total (jumlah) penjualan limun untuk setiap hari kerja dalam setiap bulan, seperti ini:

    Screenshot of a Pivot Table showing sales grouped by month and day.

    Sekarang Anda dapat melihat penjualan bulanan yang dikumpulkan berdasarkan hari kerja. Misalnya, 57 penjualan pada bulan Januari dilakukan pada hari Sabtu. Anda juga dapat memperluas/menciutkan bulan untuk memeriksa/menelusuri tingkat hierarki.

  2. Di panel Bidang PivotTable, seret Hari dari area Baris ke area Kolom. Excel sekarang menunjukkan total penjualan untuk setiap bulan pada baris, dipecah menurut hari kerja dalam kolom; seperti ini:

    Screenshot of a Pivot Table showing sales grouped by month on rows and day on columns.

    Anda masih dapat melihat penjualan bulanan yang dipecah berdasarkan hari kerja, tetapi Anda juga dapat melihat (di baris bawah) total untuk setiap hari kerja sepanjang tahun. Misalnya, total 1.324 penjualan dilakukan pada hari Senin.

Mengubah agregasi

  1. Di panel Bidang PivotTable, di area Nilai, klik panah turun bawah di samping Jumlah Penjualan, lalu klik Bidang Nilai Pengaturan.

  2. Dalam kotak dialog bidang nilai Pengaturan, pilih Rata-rata seperti yang diperlihatkan di sini:

    Screenshot of setting field value settings to summarize value by average.

    Tabel data sekarang memperlihatkan jumlah rata-rata penjualan untuk setiap bulan dan hari kerja, seperti yang diperlihatkan di sini:

    Screenshot of a Pivot Table showing average sales grouped by month on rows and day on columns.

    Anda sekarang dapat melihat jumlah rata-rata penjualan untuk setiap hari kerja menurut bulan. Misalnya, jumlah rata-rata penjualan pada hari Rabu pada bulan Februari adalah 19,75.

Tantangan: Analisis PivotTable

  1. Ubah bidang dalam PivotTable untuk menemukan informasi berikut:
    • Jumlah total pendapatan untuk Agustus.
    • Suhu pada Sabtu terpanas di Juli.
    • Jumlah flyer terendah yang didistribusikan dalam sehari selama November.

Latihan 2: Memvisualisasikan data dengan bagan

Seringkali lebih mudah untuk mengidentifikasi tren dan hubungan dalam data dengan membuat visualisasi data seperti bagan.

Melihat tren penjualan untuk tahun ini

  1. Ubah PivotTable yang Anda buat di latihan sebelumnya sehingga memperlihatkan Tanggal di area Baris dan jumlah Penjualan dan jumlah Suhu (dalam urutan tersebut) di area Nilai, seperti ini:

    Screenshot of a Pivot Table showing sales and temperature totals by date.

    Pastikan tabel Anda terlihat seperti tabel yang diperlihatkan, sebelum Anda melanjutkan (perhatikan bahwa tanggal mungkin diformat secara berbeda untuk lokasi Anda).

  2. Dengan menggunakan instruksi berikut, pilih sel yang berisi nilai tanggal, penjualan harian, dan suhu saja, tetapi bukan sel header Tanggal, Jumlah Penjualan, dan Jumlah Suhu atau sel footer Total Keseluruhan:

    • Klik sel A4, yang harus berisi nilai tanggal untuk 1 Januari 2017.
    • Kemudian tekan SHIFT + CTRL + (SHIFT + + di Mac OSX) untuk memperluas pilihan untuk menyertakan nilai penjualan dan suhu.
    • Kemudian tekan SHIFT + CTRL + (SHIFT + + di Mac OSX) untuk memilih baris di bawah pilihan saat ini.
    • Terakhir tekan SHIFT + untuk membatalkan pilihan total keseluruhan.
  3. Pada tab Beranda pita, klik tombol Salin (🗐) untuk menyalin sel yang dipilih ke clipboard.

  4. Di bawah lembar kerja, klik tombol Lembar Baru (+) untuk menambahkan lembar kerja baru ke buku kerja.

  5. Di lembar baru, pilih sel A2, lalu pada tab Beranda klik tombol Tempel (📋) untuk menempelkan sel yang disalin ke lembar kerja baru. Anda mungkin perlu memperluas kolom A untuk melihat tanggal.

  6. Di sel A1 ke C1, tambahkan header kolom Tanggal, Penjualan, dan Suhu. Lembar kerja baru Anda akan terlihat seperti ini:

    Screenshot of a new worksheet showing sales and temperature totals by date.

  7. Pilih data Tanggal dan Penjualan, termasuk header (tetapi bukan data suhu). Lalu pada tab Sisipkan pita, di daftar drop-down Garis, klik format bagan garis pertama. Excel menyisipkan bagan garis seperti ini:

    Screenshot of a line chart showing sales by date.

    Perhatikan bahwa grafik garis menunjukkan fluktuasi harian dalam penjualan, tetapi tren umum tampaknya menunjukkan bahwa penjualan lebih tinggi selama bulan-bulan musim panas dan lebih rendah di awal dan akhir tahun.

  8. Hapus bagan, lalu pilih semua data dan header, termasuk Suhu dan sisipkan bagan garis baru. Ini menyisipkan bagan seperti ini:

    Screenshot of a line chart showing sales and temperature by date.

    Kali ini, bagan mencakup seri terpisah untuk Penjualan dan Suhu. Kedua seri menunjukkan pola yang sama; tampaknya penjualan dan suhu keduanya meningkat selama bulan-bulan musim panas.

  9. Pilih bagan dan klik dua kali judul bagan. Lalu di panel Bagan pada tab Format, perluas Judul Bagan dan ubah judul bagan menjadi Penjualan dan Suhu:

    Screenshot of editing the chart title in Excel Online.

  10. Tutup panel Bagan.

Melihat pendapatan menurut hari kerja

  1. Kembali ke lembar kerja yang berisi PivotTable, dan ubah untuk memperlihatkan Hari pada baris dengan rata-rataPendapatan. Hasil Anda akan terlihat seperti ini meskipun hari-hari Anda dalam seminggu mungkin tidak dipesan:

    Screenshot of a Pivot Table showing average revenue by day.

  2. Salin nilai pendapatan hari dan rata-rata (tetapi bukan header atau total) ke clipboard, lalu tambahkan lembar kerja baru, tempelkan data yang disalin dalam sel A2, dan tambahkan header Hari dan AverageRevenue seperti ini:

    Screenshot of a new worksheet showing average revenue by day.

  3. Pilih header kolom B dan pada tab Pita beranda, gunakan $ menu untuk memformat data pendapatan sebagai $ English (Amerika Serikat), seperti ini:

    Screenshot of a worksheet showing average revenue by day formatted as U S currency.

  4. Pilih semua data, termasuk header Hari dan AverageRevenue, dan pada tab Sisipkan dari pita, di daftar turun bawah Kolom, pilih format bagan kolom pertama. Bagan seperti ini dibuat:

    Screenshot of a column chart showing average revenue by day.

    Sekilas, bagan ini tampaknya menunjukkan beberapa variasi signifikan antara pendapatan rata-rata hari yang berbeda dalam seminggu; dengan pendapatan pada hari Kamis jauh lebih tinggi daripada pada hari Minggu. Namun, lihat lebih dekat skala pada sumbu vertikal (Y) - Perbedaannya kurang dari 30 sen.

  5. Pilih bagan kolom, dan pada tab Bagan dari pita, di daftar turun bawah Pai pilih format bagan Pai 2D. Bagan berubah menjadi bagan pai seperti ini:

    Screenshot of a pie chart showing average revenue by day.

    Perhatikan bahwa segmen pai berukuran lebih atau kurang sama untuk setiap hari.

  6. Pilih bagan pai dan pada tab Bagan, di daftar drop-down Label Data, pilih Di Dalam Akhir. Ini menampilkan jumlah data aktual dalam bagan, seperti ini:

    Screenshot of a pie chart showing average revenue by day with data labels.

    Sekarang lebih jelas bahwa ada sedikit variasi yang jelas dalam pendapatan rata-rata untuk hari yang berbeda dalam seminggu.

Melihat penjualan menurut selebaran

  1. Kembali ke lembar kerja yang berisi PivotTable, dan ubah untuk memperlihatkan Tanggal pada baris dengan jumlah Flyer dan jumlah Penjualan, seperti ini:

    Screenshot of a Pivot Table showing flyers and sales totals by date.

  2. Salin nilai tanggal, selebaran, dan penjualan (tetapi bukan header atau total) ke lembar kerja baru dan tambahkan header Tanggal, Selebaran, dan Penjualan seperti ini:

    Screenshot of a new worksheet showing total flyers and sales by date.

  3. Pilih data dan header Flyer dan Sales (tetapi bukan tanggal). Kemudian pada tab Sisipkan, di daftar drop-down Sebar, pilih format plot sebar pertama. Ini membuat bagan plot sebar seperti ini:

    Screenshot of a scatter plot showing total flyers by sales.

    Catatan

    Bagan menunjukkan jumlah flyer yang didistribusikan setiap hari pada sumbu horizontal (X), dan jumlah penjualan setiap hari pada sumbu vertikal (Y). Plot membentuk garis diagonal kira-kira (dengan beberapa varian), menunjukkan tren umum di mana jumlah penjualan cenderung meningkat sejalan dengan jumlah selebaran yang didistribusikan.

Lihat penjualan berdasarkan curah hujan

  1. Kembali ke lembar kerja yang berisi PivotTable, dan ubah untuk memperlihatkan Tanggal pada baris dengan jumlah Curah Hujan dan jumlah Penjualan sebagai nilai, seperti ini:

    Screenshot of a Pivot Table showing rainfall and sales totals by date.

  2. Salin nilai tanggal, curah hujan, dan penjualan (tetapi bukan header atau total) ke lembar kerja baru dan tambahkan header Tanggal, Curah Hujan, dan Penjualan seperti ini:

    Screenshot of a new worksheet showing total rainfall and sales by date.

  3. Pilih data dan header Rainfall dan Penjualan (tetapi bukan tanggal). Kemudian pada tab Sisipkan, di daftar drop-down Sebar, pilih format plot sebar pertama. Ini membuat bagan plot sebar seperti ini:

    Screenshot of a scatter plot showing total rainfall by sales.

    Plot ini tampaknya menunjukkan beberapa jenis hubungan antara curah hujan dan penjualan, dengan penjualan turun saat curah hujan meningkat. Namun, garis yang dibentuk oleh plot melengkung. Ini sering berarti ada hubungan non-linier, mungkin logaritmik.

  4. Hapus bagan sehingga Anda bisa melihat kolom D dan E kosong setelah curah hujan harian dan data penjualan.

  5. Di D1, tambahkan header kolom LogRainfall, lalu pilih sel D2 dan masukkan rumus berikut dalam kotak fx di atas lembar kerja untuk menghitung log dasar 10 dari nilai curah hujan:

    =log(B2)
    
  6. Salin rumus ke sel lain di kolom LogRainfall. Cara termampu untuk melakukan ini adalah dengan memilih sel yang berisi rumus dan klik dua kali pada kotak kecil "handel" () di kanan bawah sel yang dipilih.

  7. Di E1, tambahkan header kolom LogSales, lalu pilih sel E2 dan masukkan rumus berikut dalam kotak fx di atas lembar kerja untuk menghitung log dasar 10 dari nilai penjualan:

    =log(C2)
    
  8. Salin rumus ke sel lain di kolom LogSales.

  9. Pilih data dan header LogRainfall dan LogSales. Kemudian pada tab Sisipkan, di daftar drop-down Sebar, pilih format plot sebar pertama. Ini membuat bagan plot sebar seperti ini:

    Screenshot of a scatter plot showing log rainfall by log sales.

    Perhatikan bahwa plot ini menunjukkan hubungan linier antara log curah hujan dan log penjualan. Ini berpotensi berguna saat kita mengeksplorasi hubungan dalam data, karena lebih mudah untuk menghitung persamaan linier yang berkaitan dengan curah hujan dengan penjualan daripada menentukan persamaan logaritma untuk melakukan hal yang sama.

Tantangan: Memvisualisasikan data

  1. Buat bagan kolom yang memperlihatkan jumlah flyer yang didistribusikan pada setiap hari dalam seminggu, dan perhatikan hari-hari di mana jumlah flyer tertinggi dan terendah didistribusikan.
  2. Buat plot sebar yang menunjukkan suhu harian dan curah hujan dan periksa hubungan yang jelas antara bidang-bidang ini.