Mengonfigurasi Azure Synapse Analytics dalam aktivitas salin
Artikel ini menguraikan cara menggunakan aktivitas salin di alur data untuk menyalin data dari dan ke Azure Synapse Analytics.
Konfigurasi yang didukung
Untuk konfigurasi setiap tab di bawah aktivitas salin, buka bagian berikut.
Umum
Lihat panduan Pengaturan umum untuk mengonfigurasi tab Pengaturan umum.
Sumber
Properti berikut ini didukung untuk Azure Synapse Analytics di bawah tab Sumber aktivitas salin.
Properti berikut diperlukan:
Jenis penyimpanan data: Pilih Eksternal.
Koneksi ion: Pilih koneksi Azure Synapse Analytics dari daftar koneksi. Jika koneksi tidak ada, buat koneksi Azure Synapse Analytics baru dengan memilih Baru.
jenis Koneksi ion: Pilih Azure Synapse Analytics.
Gunakan kueri: Anda bisa memilih Tabel, Kueri, atau Prosedur tersimpan untuk membaca data sumber Anda. Daftar berikut menjelaskan konfigurasi setiap pengaturan:
Tabel: Membaca data dari tabel yang Anda tentukan di Tabel jika Anda memilih tombol ini. Pilih tabel Anda dari daftar drop-down atau pilih Edit untuk memasukkan skema dan nama tabel secara manual.
Kueri: Tentukan kueri SQL kustom untuk membaca data. Contohnya
select * from MyTable
. Atau pilih ikon pensil untuk diedit di editor kode.Prosedur tersimpan: Gunakan prosedur tersimpan yang membaca data dari tabel sumber. Pernyataan SQL terakhir harus merupakan pernyataan SELECT dalam prosedur tersimpan.
- Nama prosedur tersimpan: Pilih prosedur tersimpan atau tentukan nama prosedur tersimpan secara manual saat pilih Edit.
- Parameter prosedur tersimpan: Pilih Impor parameter untuk mengimpor parameter dalam prosedur tersimpan yang Anda tentukan, atau tambahkan parameter untuk prosedur tersimpan dengan memilih + Baru. Nilai yang diizinkan adalah pasangan nama atau nilai. Nama dan casing parameter harus sesuai dengan nama dan casing parameter prosedur yang disimpan.
Di bawah Tingkat Lanjut, Anda bisa menentukan bidang berikut ini:
Batas waktu kueri (menit): Tentukan batas waktu untuk eksekusi perintah kueri, defaultnya adalah 120 menit. Jika parameter diatur untuk properti ini, nilai yang diizinkan adalah rentang waktu, seperti "02:00:00" (120 menit).
Tingkat isolasi: Menentukan perilaku penguncian transaksi untuk sumber SQL. Nilai yang diizinkan adalah: None, Read committed, Read uncommitted, Repeatable read, Serializable, atau Snapshot. Jika tidak ditentukan, tingkat isolasi Tidak ada yang digunakan. Lihat IsolationLevel Enum untuk detail selengkapnya.
Opsi partisi: Tentukan opsi partisi data yang digunakan untuk memuat data dari Azure Synapse Analytics. Nilai yang diizinkan adalah: Tidak ada (default), Partisi fisik tabel, dan Rentang dinamis. Saat opsi partisi diaktifkan (yaitu, bukan Tidak Ada), tingkat paralelisme untuk memuat data secara bersamaan dari Azure Synapse Analytics dikendalikan oleh pengaturan salinan paralel pada aktivitas salin.
Tidak Ada: Pilih pengaturan ini untuk tidak menggunakan partisi.
Partisi fisik tabel: Pilih pengaturan ini jika Anda ingin menggunakan partisi fisik. Kolom dan mekanisme partisi secara otomatis ditentukan berdasarkan definisi tabel fisik Anda.
Rentang dinamis: Pilih pengaturan ini jika Anda ingin menggunakan partisi rentang dinamis. Saat menggunakan kueri dengan diaktifkan paralel, parameter partisi rentang(
?DfDynamicRangePartitionCondition
) diperlukan. Kueri sampel:SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition
.- Nama kolom partisi: Tentukan nama kolom sumber dalam tipe bilangan bulat atau tanggal/tanggalwaktu (
int
, ,date
smalldatetime
bigint
datetime
smallint
,datetime2
, ataudatetimeoffset
) yang digunakan oleh pemartisian rentang untuk salinan paralel. Jika tidak ditentukan, indeks atau kunci utama tabel terdeteksi secara otomatis dan digunakan sebagai kolom partisi. - Batas atas partisi: Tentukan nilai maksimum kolom partisi untuk pemisahan rentang partisi. Nilai ini digunakan untuk menentukan langkah partisi, bukan untuk memfilter baris dalam tabel. Semua baris dalam tabel atau hasil kueri dipartisi dan disalin.
- Batas bawah partisi: Tentukan nilai minimum kolom partisi untuk pemisahan rentang partisi. Nilai ini digunakan untuk menentukan langkah partisi, bukan untuk memfilter baris dalam tabel. Semua baris dalam tabel atau hasil kueri dipartisi dan disalin.
- Nama kolom partisi: Tentukan nama kolom sumber dalam tipe bilangan bulat atau tanggal/tanggalwaktu (
Kolom tambahan: Tambahkan kolom data tambahan untuk menyimpan jalur relatif file sumber atau nilai statis. Ekspresi didukung untuk yang terakhir. Untuk informasi selengkapnya, buka Menambahkan kolom tambahan selama penyalinan.
Tujuan
Properti berikut ini didukung untuk Azure Synapse Analytics di bawah tab Tujuan dari aktivitas salin.
Properti berikut diperlukan:
- Jenis penyimpanan data: Pilih Eksternal.
- Koneksi ion: Pilih koneksi Azure Synapse Analytics dari daftar koneksi. Jika koneksi tidak ada, buat koneksi Azure Synapse Analytics baru dengan memilih Baru.
- jenis Koneksi ion: Pilih Azure Synapse Analytics.
- Opsi tabel: Anda dapat memilih Gunakan tabel buat otomatis yang sudah ada. Daftar berikut menjelaskan konfigurasi setiap pengaturan:
- Gunakan yang sudah ada: Pilih tabel di database Anda dari daftar drop-down. Atau centang Edit untuk memasukkan skema dan nama tabel Anda secara manual.
- Buat tabel otomatis: Tabel secara otomatis membuat tabel (jika tidak ada) dalam skema sumber.
Di bawah Tingkat Lanjut, Anda bisa menentukan bidang berikut ini:
Salin metode Pilih metode yang ingin Anda gunakan untuk menyalin data. Anda dapat memilih perintah Salin, PolyBase, Sisipan massal, atau Upsert. Daftar berikut menjelaskan konfigurasi setiap pengaturan:
Perintah Salin: Gunakan pernyataan COPY untuk memuat data dari penyimpanan Azure ke Azure Synapse Analytics atau Kumpulan SQL.
- Izinkan perintah salin: Wajib dipilih saat Anda memilih perintah Salin.
- Nilai default: Tentukan nilai default untuk setiap kolom target di Azure Synapse Analytics. Nilai default dalam properti menimpa batasan DEFAULT yang diatur di gudang data, dan kolom identitas tidak dapat memiliki nilai default.
- Opsi tambahan: Opsi tambahan yang akan diteruskan ke pernyataan COPY Azure Synapse Analytics langsung dalam klausa "Dengan" dalam pernyataan COPY. Kutip nilai sesuai kebutuhan untuk menyelaraskan dengan persyaratan pernyataan COPY.
PolyBase: PolyBase adalah mekanisme throughput tinggi. Gunakan untuk memuat data dalam jumlah besar ke Azure Synapse Analytics atau Kumpulan SQL.
- Izinkan PolyBase: Wajib dipilih saat Anda memilih PolyBase.
- Jenis tolak: Tentukan apakah opsi rejectValue adalah nilai harfiah atau persentase. Nilai yang diizinkan adalah Nilai (default) dan Persentase.
- Nilai tolak: Tentukan jumlah atau persentase baris yang dapat ditolak sebelum kueri gagal. Pelajari selengkapnya tentang opsi penolakan PolyBase di bagian Argumen CREATE EXTERNAL TABLE (Transact-SQL). Nilai yang diizinkan adalah 0 (default), 1, 2, dll.
- Tolak nilai sampel: Menentukan jumlah baris yang akan diambil sebelum PolyBase menghitung ulang persentase baris yang ditolak. Nilai yang diizinkan adalah 1, 2, dll. Jika Anda memilih Persentase sebagai jenis penolakan, properti ini diperlukan.
- Gunakan jenis default: Tentukan cara menangani nilai yang hilang dalam file teks yang dibatasi saat PolyBase mengambil data dari file teks. Pelajari selengkapnya tentang properti ini dari bagian Argumen di BUAT FORMAT FILE EKSTERNAL (Transact-SQL). Nilai yang diizinkan dipilih (default) atau tidak dipilih.
Penyisipan massal: Gunakan Sisipkan massal untuk menyisipkan data ke tujuan secara massal.
- Menyisipkan kunci tabel secara massal: Gunakan ini untuk meningkatkan performa salin selama operasi penyisipan massal pada tabel tanpa indeks dari beberapa klien. Pelajari lebih lanjut dari BULK INSERT (Transact-SQL).
Upsert: Tentukan grup pengaturan untuk perilaku tulis saat Anda ingin meningkatkan data ke tujuan Anda.
Kolom kunci: Pilih kolom mana yang digunakan untuk menentukan apakah baris dari sumber cocok dengan baris dari tujuan.
Menyisipkan kunci tabel secara massal: Gunakan ini untuk meningkatkan performa salin selama operasi penyisipan massal pada tabel tanpa indeks dari beberapa klien. Pelajari lebih lanjut dari BULK INSERT (Transact-SQL).
Skrip pra-salin: Tentukan skrip untuk Aktivitas Salin yang akan dijalankan sebelum menulis data ke dalam tabel tujuan di setiap eksekusi. Anda dapat menggunakan properti ini untuk membersihkan data yang telah dimuat sebelumnya.
Tulis batas waktu batch: Tentukan waktu tunggu untuk operasi penyisipan batch selesai sebelum waktu habis. Nilai yang diizinkan adalah rentang waktu. Nilai defaultnya adalah "00:30:00" (30 menit).
Menulis ukuran batch: Tentukan jumlah baris yang akan disisipkan ke dalam tabel SQL per batch. Nilai yang diizinkan adalah bilangan bulat (jumlah baris). Secara default, layanan secara dinamis menentukan ukuran batch yang sesuai berdasarkan ukuran baris.
Koneksi bersamaan maks: Tentukan batas atas koneksi bersamaan yang dibuat ke penyimpanan data selama aktivitas berjalan. Menentukan nilai hanya saat Anda ingin membatasi koneksi bersamaan.
Nonaktifkan analitik metrik performa: Pengaturan ini digunakan untuk mengumpulkan metrik, seperti DTU, DWU, RU, dan sebagainya, untuk pengoptimalan dan rekomendasi performa salin. Jika Anda khawatir dengan perilaku ini, pilih kotak centang ini. Ini tidak dipilih secara default.
Salin langsung dengan menggunakan perintah COPY
Perintah COPY Azure Synapse Analytics secara langsung mendukung Azure Blob Storage dan Azure Data Lake Storage Gen2 sebagai penyimpanan data sumber. Jika data sumber Anda memenuhi kriteria yang dijelaskan di bagian ini, gunakan perintah COPY untuk menyalin langsung dari penyimpanan data sumber ke Azure Synapse Analytics.
Data dan format sumber berisi jenis dan metode autentikasi berikut:
Jenis penyimpanan data sumber yang didukung Format yang didukung Jenis autentikasi sumber yang didukung Azure Blob Storage Teks berbatas
ParquetAutentikasi anonim
Autentikasi kunci akun
Autentikasi tanda tangan akses bersamaAzure Data Lake Storage Gen2 Teks berbatas
ParquetAutentikasi kunci akun
Autentikasi tanda tangan akses bersamaPengaturan Format berikut dapat diatur:
- Untuk Parquet: Jenis kompresi dapat berupa None, snappy, atau gzip.
- Untuk DelimitedText:
- Pemisah baris: Saat menyalin teks yang dibatasi ke Azure Synapse Analytics melalui perintah COPY langsung, tentukan pemisah baris secara eksplisit (\r; \n; atau \r\n). Hanya ketika pemisah baris dari file sumber adalah \r\n, nilai default (\r, \n, atau \r\n) berfungsi. Jika tidak, aktifkan penahapan untuk skenario Anda.
- Nilai null dibiarkan sebagai default atau diatur ke string kosong ("").
- Pengodean dibiarkan sebagai default atau diatur ke UTF-8 atau UTF-16.
- Lewati jumlah baris dibiarkan sebagai default atau diatur ke 0.
- Jenis kompresi bisa tidak ada atau gzip.
Jika sumber Anda adalah folder, Anda harus memilih kotak centang Secara rekursif.
Waktu mulai (UTC) dan Waktu akhir (UTC) di Filter menurut terakhir diubah, Awalan, Aktifkan penemuan partisi, dan Kolom tambahan tidak ditentukan.
Untuk mempelajari cara menyerap data ke Azure Synapse Analytics Anda menggunakan perintah COPY, lihat artikel ini.
Jika penyimpanan dan format data sumber Anda awalnya tidak didukung oleh perintah COPY, gunakan salinan bertahap dengan menggunakan fitur perintah COPY sebagai gantinya. Ini secara otomatis mengonversi data menjadi format yang kompatibel dengan perintah COPY, lalu memanggil perintah COPY untuk memuat data ke Azure Synapse Analytics.
Pemetaan
Untuk konfigurasi tab Pemetaan, jika Anda tidak menerapkan Azure Synapse Analytics dengan buat tabel otomatis sebagai tujuan Anda, buka Pemetaan.
Jika Anda menerapkan Azure Synapse Analytics dengan tabel buat otomatis sebagai tujuan Anda, kecuali konfigurasi di Pemetaan, Anda dapat mengedit jenis untuk kolom tujuan Anda. Setelah memilih Impor skema, Anda dapat menentukan jenis kolom di tujuan Anda.
Misalnya, jenis untuk kolom ID di sumber adalah int, dan Anda dapat mengubahnya menjadi jenis float saat memetakan ke kolom tujuan.
Pengaturan
Untuk konfigurasi tab Pengaturan, buka Mengonfigurasi pengaturan Anda yang lain di bawah tab pengaturan.
Penyalinan paralel dari Azure Synapse Analytics
Konektor Azure Synapse Analytics dalam aktivitas salin menyediakan pemartisian data bawaan untuk menyalin data secara paralel. Anda dapat menemukan opsi pemartisian data pada tab Sumber aktivitas salin.
Saat Anda mengaktifkan penyalinan terpartisi, aktivitas salin menjalankan kueri paralel terhadap sumber Azure Synapse Analytics Anda untuk memuat data menurut partisi. Tingkat paralel dikontrol oleh Tingkat paralelisme salin di tab pengaturan aktivitas salin. Misalnya, jika Anda mengatur Tingkat paralelisme salin ke empat, layanan secara bersamaan menghasilkan dan menjalankan empat kueri berdasarkan opsi dan pengaturan partisi yang Ditentukan, dan setiap kueri mengambil sebagian data dari Azure Synapse Analytics Anda.
Sebaiknya Anda mengaktifkan penyalinan paralel dengan pemartisian data terutama ketika memuat data dalam jumlah besar dari Azure Synapse Analytics. Berikut ini adalah konfigurasi yang disarankan untuk skenario yang berbeda. Saat menyalin data ke penyimpanan data berbasis file, disarankan untuk menulis ke folder sebagai beberapa file (hanya tentukan nama folder), dalam hal ini performanya lebih baik daripada menulis ke satu file.
Skenario | Pengaturan yang disarankan |
---|---|
Pemuatan penuh dari tabel besar, dengan partisi fisik. | Opsi partisi: Partisi fisik tabel. Selama eksekusi, layanan secara otomatis mendeteksi partisi fisik, dan menyalin data berdasarkan partisi. Untuk memeriksa apakah tabel Anda memiliki partisi fisik atau tidak, Anda dapat merujuk ke kueri ini. |
Pemuatan penuh dari tabel besar, tanpa partisi fisik, sedangkan dengan bilangan bulat atau kolom tanggalwaktu untuk pemartisian data. | Opsi partisi: Partisi rentang dinamis. Kolom partisi (opsional): Menentukan kolom yang digunakan untuk mempartisi data. Jika tidak ditentukan, indeks atau kolom kunci primer digunakan. Batas atas partisi dan batas bawah partisi (opsional): Menentukan apakah Anda ingin menentukan langkah partisi. Ini bukan untuk memfilter baris dalam tabel, semua baris dalam tabel akan dipartisi dan disalin. Jika tidak ditentukan, aktivitas salin otomatis mendeteksi nilai. Misalnya, jika kolom partisi "ID" Anda memiliki rentang nilai dari 1 hingga 100, dan Anda menetapkan batas bawah sebagai 20 dan batas atas sebagai 80, dengan salinan paralel sebagai 4, layanan mengambil data dengan 4 partisi - ID dalam rentang <=20, [21, 50], [51, 80], dan >=81, masing-masing. |
Memuat sejumlah besar data dengan menggunakan kueri kustom, tanpa partisi fisik, sedangkan dengan kolom bilangan bulat atau tanggal/tanggalwaktu untuk pemartisian data. | Opsi partisi: Partisi rentang dinamis. Kueri: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause> .Kolom partisi: Menentukan kolom yang digunakan untuk mempartisi data. Batas atas partisi dan batas bawah partisi (opsional): Menentukan apakah Anda ingin menentukan langkah partisi. Ini bukan untuk memfilter baris dalam tabel, semua baris dalam hasil kueri akan dipartisi dan disalin. Jika tidak ditentukan, aktivitas salin secara otomatis mendeteksi nilai. Misalnya, jika kolom partisi "ID" Anda memiliki rentang nilai dari 1 hingga 100, dan Anda menetapkan batas bawah sebagai 20 dan batas atas sebagai 80, dengan salinan paralel sebagai 4, layanan mengambil data dengan 4 partisi- ID dalam rentang <=20, [21, 50], [51, 80], dan >=81, secara berurutan. Berikut adalah sampel kueri lainnya untuk skenario yang berbeda: • Kueri seluruh tabel: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition • Kueri dari tabel dengan pemilihan kolom dan filter where-clause tambahan: SELECT <column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause> • Kueri dengan subkueri: SELECT <column_list> FROM (<your_sub_query>) AS T WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause> • Kueri dengan partisi dalam subkueri: SELECT <column_list> FROM (SELECT <your_sub_query_column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition) AS T |
Praktik terbaik untuk memuat data dengan opsi partisi:
- Pilih kolom yang khas sebagai kolom partisi (seperti kunci primer atau kunci unik) untuk menghindari penyimpangan data.
- Jika tabel memiliki partisi bawaan, gunakan opsi partisi Partisi fisik tabel untuk mendapatkan performa yang lebih baik.
- Azure Synapse Analytics dapat menjalankan maksimal 32 kueri sekalipun, mengatur Tingkat paralelisme salinan terlalu besar dapat menyebabkan masalah pembatasan Synapse.
Sampel kueri untuk memeriksa partisi fisik
SELECT DISTINCT s.name AS SchemaName, t.name AS TableName, c.name AS ColumnName, CASE WHEN c.name IS NULL THEN 'no' ELSE 'yes' END AS HasPartition
FROM sys.tables AS t
LEFT JOIN sys.objects AS o ON t.object_id = o.object_id
LEFT JOIN sys.schemas AS s ON o.schema_id = s.schema_id
LEFT JOIN sys.indexes AS i ON t.object_id = i.object_id
LEFT JOIN sys.index_columns AS ic ON ic.partition_ordinal > 0 AND ic.index_id = i.index_id AND ic.object_id = t.object_id
LEFT JOIN sys.columns AS c ON c.object_id = ic.object_id AND c.column_id = ic.column_id
LEFT JOIN sys.types AS y ON c.system_type_id = y.system_type_id
WHERE s.name='[your schema]' AND t.name = '[your table name]'
Jika tabel memiliki partisi fisik, Anda akan melihat "HasPartition" sebagai "ya".
Ringkasan tabel
Tabel berikut berisi informasi selengkapnya tentang aktivitas salin di Azure Synapse Analytics.
Sumber
Nama | Deskripsi | Nilai | Wajib | Properti skrip JSON |
---|---|---|---|---|
Jenis penyimpanan data | Jenis penyimpanan data Anda. | Eksternal | Ya | / |
Koneksi | Koneksi Anda ke penyimpanan data sumber. | < koneksi Anda > | Ya | koneksi |
Tipe sambungan | Jenis koneksi sumber Anda. | Azure Synapse Analytics | Ya | / |
Menggunakan kueri | Cara membaca data. | •Meja •Query • Prosedur tersimpan |
Ya | • typeProperties (di bawah typeProperties ->source )-Skema -Meja • sqlReaderQuery • sqlReaderStoredProcedureName storedProcedureParameters -Nama -Nilai |
Batas waktu kueri | Batas waktu untuk eksekusi perintah kueri, defaultnya adalah 120 menit. | timespan | No | queryTimeout |
Tingkat isolasi | Perilaku penguncian transaksi untuk sumber SQL. | •Tidak • Baca berkomitmen • Baca tidak dikomit • Bacaan yang dapat diulang • Dapat diserialisasikan •Snapshot |
No | isolationLevel: • ReadCommitted • ReadUncommitted • RepeatableRead • Dapat diserialisasikan •Snapshot |
Opsi partisi | Opsi pemartisian data yang digunakan untuk memuat data dari Azure SQL Database. | •Tidak • Partisi fisik tabel • Rentang dinamis - Nama kolom partisi - Batas atas partisi - Partisi terikat lebih rendah |
No | partitionOption: • PhysicalPartitionsOfTable • DynamicRange partisi Pengaturan: - partitionColumnName - partitionUpperBound - partitionLowerBound |
Kolom tambahan | Tambahkan kolom data tambahan untuk menyimpan jalur relatif file sumber atau nilai statis. Ekspresi didukung untuk yang terakhir. | •Nama •Nilai |
No | additionalColumns: •Nama •Nilai |
Tujuan
Nama | Deskripsi | Nilai | Wajib | Properti skrip JSON |
---|---|---|---|---|
Jenis penyimpanan data | Jenis penyimpanan data Anda. | Eksternal | Ya | / |
Koneksi | Koneksi Anda ke penyimpanan data tujuan. | < koneksi Anda > | Ya | koneksi |
Tipe sambungan | Jenis koneksi tujuan Anda. | Azure Synapse Analytics | Ya | / |
Opsi tabel | Opsi tabel data tujuan Anda. | • Gunakan yang ada • Buat tabel secara otomatis |
Ya | • typeProperties (di bawah typeProperties ->sink )-Skema -Meja • tableOption: - buat otomatis typeProperties (di bawah typeProperties ->sink )-Skema -Meja |
Metode salin | Metode yang digunakan untuk menyalin data. | • Perintah salin • PolyBase • Sisipan massal • Upsert |
No | / |
Saat memilih perintah Salin | Gunakan pernyataan COPY untuk memuat data dari penyimpanan Azure ke Azure Synapse Analytics atau Kumpulan SQL. | / | Tidak. Terapkan saat menggunakan SALIN. |
allowCopyCommand: true copyCommandSettings |
Nilai default | Tentukan nilai default untuk setiap kolom target di Azure Synapse Analytics. Nilai default dalam properti menimpa batasan DEFAULT yang diatur di gudang data, dan kolom identitas tidak dapat memiliki nilai default. | < nilai default > | No | defaultValues: - columnName - defaultValue |
Opsi tambahan | Opsi tambahan yang akan diteruskan ke pernyataan COPY Azure Synapse Analytics secara langsung dalam klausa "With" dalam pernyataan COPY. Kutip nilai sesuai kebutuhan untuk menyelaraskan dengan persyaratan pernyataan COPY. | < opsi tambahan > | No | additionalOptions: - <nama> properti : <nilai> |
Saat memilih PolyBase | PolyBase adalah mekanisme throughput tinggi. Gunakan untuk memuat data dalam jumlah besar ke Azure Synapse Analytics atau Kumpulan SQL. | / | Tidak. Terapkan saat menggunakan PolyBase. |
allowPolyBase: true polyBaseSettings |
Jenis penolakan | Jenis nilai penolakan. | •Nilai •Persentase |
No | rejectType: -Nilai -Persentase |
Tolak nilai | Jumlah atau persentase baris yang dapat ditolak sebelum kueri gagal. | 0 (default), 1, 2, dll. | No | rejectValue |
Tolak nilai sampel | Menentukan jumlah baris yang akan diambil sebelum PolyBase menghitung ulang persentase baris yang ditolak. | 1, 2, dll. | Ya saat Anda menentukan Persentase sebagai jenis penolakan Anda | rejectSampleValue |
Gunakan jenis default | Tentukan cara menangani nilai yang hilang dalam file teks yang dibatasi saat PolyBase mengambil data dari file teks. Pelajari selengkapnya tentang properti ini dari bagian Argumen di CREATE EXTERNAL FILE FORMAT (Transact-SQL) | dipilih (default) atau tidak dipilih. | No | useTypeDefault: true (default) atau false |
Saat memilih Sisipkan massal | Sisipkan data ke tujuan secara massal. | / | No | writeBehavior: Sisipkan |
Menyisipkan kunci tabel secara massal | Gunakan ini untuk meningkatkan performa salin selama operasi penyisipan massal pada tabel tanpa indeks dari beberapa klien. Pelajari lebih lanjut dari BULK INSERT (Transact-SQL). | dipilih atau tidak dipilih (default) | No | sqlWriterUseTableLock: true atau false (default) |
Saat memilih Upsert | Tentukan grup pengaturan untuk perilaku tulis saat Anda ingin meningkatkan data ke tujuan Anda. | / | No | writeBehavior: Upsert |
Kolom kunci | Menunjukkan kolom mana yang digunakan untuk menentukan apakah baris dari sumber cocok dengan baris dari tujuan. | < nama kolom> | No | upsert Pengaturan: - kunci: < nama kolom > - interimSchemaName |
Menyisipkan kunci tabel secara massal | Gunakan ini untuk meningkatkan performa salin selama operasi penyisipan massal pada tabel tanpa indeks dari beberapa klien. Pelajari lebih lanjut dari BULK INSERT (Transact-SQL). | dipilih atau tidak dipilih (default) | No | sqlWriterUseTableLock: true atau false (default) |
Skrip pra-salin | Skrip untuk Aktivitas Salin dijalankan sebelum menulis data ke dalam tabel tujuan di setiap eksekusi. Anda dapat menggunakan properti ini untuk membersihkan data yang telah dimuat sebelumnya. | < Skrip pra-salin > (String) |
No | preCopyScript |
Menulis batas waktu batch | Waktu tunggu untuk operasi insert batch selesai sebelum waktu habis. Nilai yang diperbolehkan adalah rentang waktu. Nilai defaultnya adalah "00:30:00" (30 menit). | timespan | No | writeBatchTimeout |
Menulis ukuran batch | Jumlah baris yang akan disisipkan ke dalam tabel SQL per batch. Secara default, layanan secara dinamis menentukan ukuran batch yang sesuai berdasarkan ukuran baris. | < jumlah baris > (bilangan bulat) |
No | writeBatchSize |
Koneksi bersamaan maks | Batas atas koneksi bersamaan yang ditetapkan ke penyimpanan data selama eksekusi aktivitas. Menentukan nilai hanya saat Anda ingin membatasi koneksi bersamaan. | < batas atas koneksi bersamaan > (bilangan bulat) |
No | maxConcurrentConnections |
Menonaktifkan analitik metrik performa | Pengaturan ini digunakan untuk mengumpulkan metrik, seperti DTU, DWU, RU, dan sebagainya, untuk pengoptimalan dan rekomendasi performa salin. Jika Anda khawatir dengan perilaku ini, pilih kotak centang ini. | pilih atau batal pilih (default) | No | disableMetricsCollection: true atau false (default) |