Kumpulan data

Berlaku untuk:SQL Server

Pengumpul Data adalah komponen SQL Server yang mengumpulkan kumpulan data yang berbeda. Pengumpulan data berjalan terus-menerus atau pada jadwal yang ditentukan pengguna. Pengumpul data menyimpan data yang dikumpulkan dalam database relasional yang dikenal sebagai gudang data manajemen.

Apa itu pengumpul data?

Pengumpul data adalah komponen inti dari platform pengumpulan data untuk SQL Server dan alat yang disediakan oleh SQL Server. Pengumpul data menyediakan satu titik pusat untuk pengumpulan data di seluruh server dan aplikasi database Anda. Titik pengumpulan ini dapat memperoleh data dari berbagai sumber dan tidak terbatas pada data performa, tidak seperti SQL Trace.

Pengumpul data memungkinkan Anda menyesuaikan cakupan pengumpulan data agar sesuai dengan lingkungan pengujian dan produksi Anda. Pengumpul data juga menggunakan gudang data, database relasional yang memungkinkan Anda mengelola data yang Anda kumpulkan dengan mengatur periode retensi yang berbeda untuk data Anda.

Pengumpul data mendukung penyetelan dinamis untuk pengumpulan data dan dapat diperluas melalui API-nya. Untuk informasi selengkapnya, lihat Pemrograman Pengumpul Data.

Ilustrasi berikut menunjukkan bagaimana pengumpul data cocok dalam strategi keseluruhan untuk pengumpulan data dan manajemen data di SQL Server.

Diagram of the data collector's role in data management.

Konsep

Pengumpul data terintegrasi dengan SQL Server Agent dan Integration Services, dan menggunakan keduanya secara ekstensif. Sebelum bekerja dengan pengumpul data, Anda harus memahami konsep tertentu yang terkait dengan masing-masing komponen SQL Server ini.

SQL Server Agent digunakan untuk menjadwalkan dan menjalankan pekerjaan pengumpulan. Anda harus memahami konsep berikut:

  • Tugas
  • Langkah pekerjaan
  • Jadwal pekerjaan
  • Subsistem
  • Akun proksi

Untuk informasi selengkapnya, lihat Tugas Administrasi Otomatis (SQL Server Agent).

Integration Services (SSIS) digunakan untuk menjalankan paket yang mengumpulkan data dari penyedia data individual. Anda harus terbiasa dengan alat dan konsep SSIS berikut:

  • Paket SSIS
  • Konfigurasi paket SSIS

Untuk informasi selengkapnya, lihat Paket Integration Services (SSIS).

Terminologi

Persyaratan Deskripsi
Target Instans Mesin Database dalam edisi SQL Server yang mendukung Pengumpulan Data. Untuk informasi selengkapnya tentang edisi yang didukung, lihat bagian "Pengelolaan " Edisi dan fitur yang didukung SQL Server 2022.

Akar target mendefinisikan subtree dalam hierarki target. Kumpulan target adalah grup target yang dihasilkan dari penerapan filter ke subtree yang ditentukan oleh akar target. Akar target dapat berupa database, instans SQL Server, atau instans komputer.
Jenis target Jenis target, yang memiliki karakteristik dan perilaku tertentu. Misalnya, target instans SQL Server memiliki karakteristik yang berbeda dari target database SQL Server.
Penyedia data Sumber data yang diketahui, khusus untuk jenis target, yang menyediakan data ke jenis pengumpul.
Jenis kolektor Pembungkus logis di sekitar paket SSIS yang menyediakan mekanisme aktual untuk mengumpulkan data dan mengunggahnya ke gudang data manajemen.
Item koleksi Instans jenis kolektor. Item koleksi dibuat dengan sekumpulan properti input tertentu dan frekuensi koleksi.
Kumpulan koleksi Sekelompok item koleksi. Kumpulan koleksi adalah unit pengumpulan data yang dapat berinteraksi dengan pengguna melalui antarmuka pengguna.
Mode pengumpulan Cara data dikumpulkan dan disimpan. Mode koleksi dapat di-cache atau tidak di-cache. Mode cache mendukung koleksi berkelanjutan, sedangkan mode non-cache ditujukan untuk koleksi sesuai permintaan atau rekam jepret koleksi.
Gudang data manajemen Database relasional yang digunakan untuk menyimpan data yang dikumpulkan.

Ilustrasi berikut menunjukkan dependensi dan hubungan antara komponen pengumpul data.

Diagram of data collector functional dependencies.

Seperti yang ditunjukkan dalam ilustrasi, penyedia data berada di luar pengumpul data dan menurut definisi memiliki hubungan implisit dengan target. Penyedia data khusus untuk target tertentu (misalnya, layanan SQL Server seperti mesin relasional) dan menyediakan data seperti tampilan sistem di SQL Server, penghitung Monitor Performa, dan penyedia WMI, yang dapat dikonsumsi oleh pengumpul data.

Jenis kolektor khusus untuk jenis target, berdasarkan asosiasi logis penyedia data ke jenis target. Jenis pengumpul menentukan bagaimana data dikumpulkan dari penyedia data tertentu (dengan menggunakan parameter skema) dan menentukan skema penyimpanan data. Skema penyedia data dan skema penyimpanan diperlukan untuk menyimpan data yang dikumpulkan. Jenis kolektor juga menyediakan lokasi gudang data manajemen, yang dapat berada di komputer yang menjalankan pengumpulan data atau di komputer yang berbeda.

Item koleksi, yang ditunjukkan dalam ilustrasi, adalah instans jenis kolektor tertentu, yang diparameterkan dengan parameter input, seperti skema XML untuk jenis kolektor. Semua item koleksi harus beroperasi pada akar target yang sama atau pada akar target kosong. Ini memungkinkan pengumpul data untuk menggabungkan jenis kolektor dari sistem operasi atau dari akar target tertentu, tetapi tidak dari akar target yang berbeda.

Item koleksi memiliki frekuensi koleksi yang ditentukan yang menentukan seberapa sering rekam jepret nilai diambil. Meskipun merupakan blok penyusun untuk kumpulan koleksi, item koleksi tidak dapat ada sendiri.

Kumpulan koleksi ditentukan dan disebarkan pada instans server dan dapat dijalankan secara independen satu sama lain. Setiap kumpulan koleksi dapat diterapkan ke target yang cocok dengan jenis target dari semua jenis kolektor yang merupakan bagian dari kumpulan koleksi. Kumpulan koleksi dijalankan oleh pekerjaan atau pekerjaan SQL Server Agent, dan data diunggah ke gudang data manajemen pada jadwal yang telah ditentukan sebelumnya.

Semua data yang dikumpulkan oleh instans yang berbeda dalam kumpulan koleksi diunggah ke gudang data manajemen pada jadwal yang sama. Jadwal ini didefinisikan sebagai jadwal Agen SQL Server bersama dan dapat digunakan oleh lebih dari satu kumpulan koleksi. Kumpulan koleksi diaktifkan atau dinonaktifkan sebagai entitas tunggal; item koleksi tidak dapat diaktifkan atau dimatikan satu per satu.

Saat membuat atau memperbarui kumpulan koleksi, Anda dapat mengonfigurasi mode pengumpulan untuk mengumpulkan data, dan mengunggahnya ke gudang data manajemen. Jenis koleksi menentukan jenis penjadwalan: di-cache atau tidak di-cache. Jika koleksi di-cache, pengumpulan data dan unggah tugas masing-masing berjalan dalam pekerjaan terpisah. Koleksi berjalan sesuai jadwal yang dimulai ketika SQL Server Agent dimulai dan berjalan pada frekuensi yang ditentukan dalam item koleksi. Unggahan berjalan sesuai dengan jadwal yang ditentukan oleh pengguna.

Di bawah pengumpulan yang tidak di-cache, pengumpulan data, dan unggah keduanya berjalan pada satu pekerjaan, tetapi dalam dua langkah. Langkah 1 adalah koleksi, dan langkah 2 diunggah. Tidak ada jadwal yang diperlukan untuk pengumpulan sesuai permintaan.

Setelah kumpulan koleksi diaktifkan, pengumpulan data dapat dimulai, baik sesuai dengan jadwal atau sesuai permintaan. Ketika pengumpulan data dimulai, Agen SQL Server menelurkan proses untuk pengumpul data, yang pada gilirannya memuat paket Layanan Integrasi untuk kumpulan koleksi. Item koleksi, yang mewakili jenis koleksi, mengumpulkan data dari penyedia data yang sesuai pada target yang ditentukan. Ketika siklus pengumpulan berakhir, data ini diunggah ke gudang data manajemen.