Bagikan melalui


Kerangka kerja pengujian Power Query SDK bagian 2 - Menguji data

Referensi multi-bagian ini mencakup penyiapan dan menjalankan rangkaian pengujian standar untuk pengembang konektor Power Query. Referensi dimaksudkan untuk diikuti secara berurutan untuk memastikan bahwa lingkungan Anda disiapkan untuk menguji konektor ekstensi Anda.

Di bagian ini, Anda:

  • Pelajari tentang himpunan data yang digunakan dalam rangkaian standar pengujian
  • Mengunduh salinan data pengujian
  • Unggah data ke database pilihan Anda untuk konektor yang ingin Anda uji

Bagian ini mencakup data pengujian yang digunakan oleh rangkaian pengujian untuk memverifikasi konektor Anda.

Gambaran umum himpunan data

Data pengujian yang digunakan untuk kerangka kerja adalah versi data rekaman perjalanan hijau NewYork City Taxi & Limousine Commission (TLC) yang dimodifikasi.

Data perjalanan hijau Februari 2023 dikonversi menjadi file CSV "NycTaxiGreen" dan 10.000 baris diambil sampelnya. Demikian pula, file CSV "TaxiZoneLookup" berisi 265 baris dari tabel pencarian zona taksi. Format data CSV dipilih karena penerapannya yang besar untuk hampir semua sumber data lainnya, sehingga lebih mudah untuk diimpor.

Definisi untuk setiap bidang mungkin sedikit berbeda dari informasi yang ditemukan dalam himpunan data hijau Taksi dan Limosin NYC - Azure Open Datasets dan data_dictionary_trip_records_green.pdf (nyc.gov).

Himpunan data untuk pengujian kami dibagi menjadi dua file csv: NycTaxiGreen dan TaxiZoneLookup.

Mendapatkan data pengujian

Data pengujian ditempatkan di repositori git Data Koneksi ors. Data pengujian disediakan dalam bentuk CSV bersama dengan definisi skema untuk tabel NycTaxiGreen dan TaxiZoneLookup . Data ini harus dimuat ke sumber data Anda sebagai tabel terpisah dan Anda perlu memastikan bahwa skema sesuai dengan jenis data yang ditentukan di sumber data Anda.

Catatan

Saat mengunggah ke sumber data, semua nilai desimal harus memiliki skala 2. Artinya, jumlah digit setelah titik desimal harus 2. Semua nilai tanda waktu harus diunggah ke datasouce dalam MM/DD/YYYY HH24:MI:SS format.

Anda juga dapat meninjau detail mengenai data pengujian.

Sumber:

Deskripsi tabel NycTaxiGreen

Tabel berikut ini menyediakan informasi lebih lanjut tentang setiap bidang dalam tabel "NycTaxiGreen":

Nama Tipe Deskripsi
RecordID Bilangan bulat Urutan ID rekaman asli. CSV dimulai dengan di luar urutan karena pengambilan sampel acak. Bidang ini dapat digunakan sebagai kunci utama tabel.
VendorID Bilangan bulat Kode yang menunjukkan penyedia.
lpep_pickup_datetime Tanda Waktu Informasi zona waktu tidak disertakan. Jika sumber data memerlukannya, UTC harus digunakan.
lpep_dropoff_datetime Tanda Waktu Informasi zona waktu tidak disertakan. Jika sumber data memerlukannya, UTC harus digunakan.
store_and_fwd_flag Boolean Bidang benar/salah. Beberapa sumber data mungkin mengimpor bidang ini sebagai karakter atau string jika jenis bidang tidak ditentukan. Untuk tujuan pengujian, bidang ini harus ditentukan sebagai Boolean.
RatecodeID Bilangan bulat Kode tarif berlaku di akhir perjalanan.
PULocationID Bilangan bulat Zona Taksi TLC ketika taksimeter terlibat.
DOLocationID Bilangan bulat Zona Taksi TLC ketika taksimeter dilepaskan.
passenger_count Bilangan bulat Jumlah penumpang dalam kendaraan.
trip_distance Laju Jarak perjalanan yang berlalu dalam mil.
fare_amount Laju Tarif waktu dan jarak. Dua tempat desimal .
extra Laju Biaya yang salah. Dua tempat desimal .
mta_tax Laju Penambahan pajak MTA. Dua tempat desimal .
tip_amount Laju Jumlah tip. Dua tempat desimal .
tolls_amount Laju Jumlah total tol yang dibayarkan dalam perjalanan. Dua tempat desimal .
improvement_surcharge Laju Biaya tambahan perbaikan. Dua tempat desimal .
total_amount Laju Total harga yang dibebankan kepada pelanggan. Tidak menyertakan tips. Dua tempat desimal .
payment_type Bilangan bulat Kode numerik untuk bagaimana penumpang dibayar.
trip_type Bilangan bulat Kode numerik untuk apakah taksi dipuji atau dikirim.
congestion_surcharge Laju Biaya tambahan untuk kemacetan. Dua tempat desimal .

Deskripsi tabel TaxiZoneLookup

Tabel berikut ini menyediakan informasi lebih lanjut tentang setiap bidang dalam tabel "TaxiZoneLookup":

Nama Tipe Deskripsi
LocationId Bilangan bulat ID lokasi untuk lokasi mana pun. Ini memetakan ke PULocationID dan DOLocationID dalam tabel "NycTaxiGreen". Bidang ini dapat digunakan sebagai kunci utama tabel.
Borough String Borough untuk lokasi.
Zone String Nama Zona untuk lokasi.
service_zone String Nama Zona Layanan untuk lokasi.

Kesimpulan

Bagian ini menjelaskan data pengujian yang digunakan dalam rangkaian pengujian standar dan skemanya. Database Anda sekarang harus diisi dengan tabel berdasarkan file CSV yang ditentukan dengan skema yang benar.

Di bagian berikutnya, Anda mendapatkan pemahaman tentang berbagai bagian dari rangkaian pengujian yang membantu Anda memvalidasi penyiapan himpunan data dan konektor ekstensi Anda.

Langkah berikutnya

Kerangka kerja pengujian PowerQuery SDK bagian 3 - Rangkaian pengujian