Transformasi Pengambilan Sampel Persentase

Berlaku untuk: Integration Runtime SSIS SQL Server di Azure Data Factory

Transformasi Pengambilan Sampel Persentase membuat himpunan data sampel dengan memilih persentase baris input transformasi. Himpunan data sampel adalah pilihan baris acak dari input transformasi, untuk membuat perwakilan sampel yang dihasilkan dari input.

Catatan

Selain persentase yang ditentukan, transformasi Pengambilan Sampel Persentase menggunakan algoritma untuk menentukan apakah baris harus disertakan dalam output sampel. Ini berarti bahwa jumlah baris dalam output sampel mungkin tidak benar-benar mencerminkan persentase yang ditentukan. Misalnya, menentukan 10 persen untuk himpunan data input yang memiliki 25.000 baris mungkin tidak menghasilkan sampel dengan 2.500 baris; sampel mungkin memiliki beberapa atau beberapa baris lebih sedikit.

Transformasi Persentase Pengambilan Sampel sangat berguna untuk penambangan data. Dengan menggunakan transformasi ini, Anda dapat membagi himpunan data secara acak menjadi dua himpunan data: satu untuk melatih model penggalian data, dan satu untuk menguji model.

Transformasi Percentage Sampling juga berguna untuk membuat himpunan data sampel untuk pengembangan paket. Dengan menerapkan transformasi Pengambilan Sampel Persentase ke aliran data, Anda dapat secara seragam mengurangi ukuran himpunan data sambil mempertahankan karakteristik datanya. Paket pengujian kemudian dapat berjalan lebih cepat karena menggunakan himpunan data kecil, tetapi representatif.

KonfigurasiKan Transformasi Pengambilan Sampel Persentase

Anda dapat menentukan seed pengambilan sampel untuk memodifikasi perilaku generator angka acak yang digunakan transformasi untuk memilih baris. Jika seed pengambilan sampel yang sama digunakan, transformasi selalu membuat output sampel yang sama. Jika tidak ada seed yang ditentukan, transformasi menggunakan jumlah centang sistem operasi untuk membuat angka acak. Oleh karena itu, Anda dapat memilih untuk menggunakan benih standar ketika Anda ingin memverifikasi hasil transformasi selama pengembangan dan pengujian paket, lalu mengubah untuk menggunakan benih acak saat paket dipindahkan ke produksi.

Transformasi ini mirip dengan transformasi Pengambilan Sampel Baris, yang membuat himpunan data sampel dengan memilih jumlah baris input yang ditentukan. Untuk informasi selengkapnya, lihat Transformasi Pengambilan Sampel Baris.

Transformasi Pengambilan Sampel Persentase mencakup properti kustom SamplingValue . Properti ini dapat diperbarui oleh ekspresi properti saat paket dimuat. Untuk informasi selengkapnya, lihat Ekspresi Integration Services (SSIS),Gunakan Ekspresi Properti dalam Paket, dan Properti Kustom Transformasi.

Transformasi memiliki satu input dan dua output. Ini tidak mendukung output kesalahan.

Anda dapat mengatur properti melalui SSIS Designer atau secara terprogram.

Kotak dialog Editor Lanjutan mencerminkan properti yang dapat diatur secara terprogram. Untuk informasi selengkapnya tentang properti yang bisa Anda atur dalam kotak dialog Editor Lanjutan atau secara terprogram, klik salah satu topik berikut ini:

Untuk informasi selengkapnya tentang cara mengatur properti, lihat Mengatur Properti Komponen Aliran Data.

Persentase Editor Transformasi Pengambilan Sampel

Gunakan kotak dialog Editor Transformasi Pengambilan Sampel Persentase untuk membagi bagian input menjadi sampel menggunakan persentase baris tertentu. Transformasi ini membagi input menjadi dua output terpisah.

Opsi

Persentase baris
Tentukan persentase baris dalam input untuk digunakan sebagai sampel.

Nilai properti ini dapat ditentukan dengan menggunakan ekspresi properti.

Contoh nama output
Berikan nama unik untuk output yang akan menyertakan baris sampel. Nama yang disediakan akan ditampilkan dalam Perancang SSIS.

Nama output yang tidak dipilih
Berikan nama unik untuk output yang akan berisi baris yang dikecualikan dari pengambilan sampel. Nama yang disediakan akan ditampilkan dalam Perancang SSIS.

Gunakan nilai awal acak berikut
Tentukan seed pengambilan sampel untuk generator angka acak yang digunakan transformasi untuk membuat sampel. Ini hanya direkomendasikan untuk pengembangan dan pengujian. Transformasi menggunakan jumlah centang Microsoft Windows jika nilai awal acak tidak ditentukan.