Bagikan melalui


Agregasi dan Desain Agregasi

Berlaku untuk: SQL Server Analysis Services Azure Analysis Services Fabric/Power BI Premium

Objek AggregationDesign menentukan sekumpulan definisi agregasi yang dapat dibagikan di beberapa partisi.

Objek Aggregation mewakili ringkasan data grup pengukuran pada granularitas dimensi tertentu.

Objek sederhana Aggregation terdiri dari: informasi dan dimensi dasar. Informasi dasar mencakup nama agregasi, ID, anotasi, dan deskripsi. Dimensi adalah kumpulan AggregationDimension objek yang berisi daftar atribut granularitas untuk dimensi.

Agregasi adalah ringkasan data yang telah dihitung sebelumnya dari sel daun. Agregasi meningkatkan waktu respons kueri dengan menyiapkan jawaban sebelum pertanyaan diajukan. Misalnya, ketika tabel fakta gudang data berisi ratusan ribu baris, kueri yang meminta total penjualan mingguan untuk baris produk tertentu dapat memakan waktu lama untuk menjawab jika semua baris dalam tabel fakta harus dipindai dan dijumlahkan pada waktu kueri untuk menghitung jawabannya. Namun, respons dapat segera dilakukan jika data ringkasan untuk menjawab kueri ini telah dihitung sebelumnya. Prakalkulasi data ringkasan ini terjadi selama pemrosesan dan merupakan fondasi untuk waktu respons teknologi OLAP yang cepat.

Kubus adalah cara teknologi OLAP mengatur data ringkasan ke dalam struktur multidemia. Dimensi dan hierarki atributnya mencerminkan kueri yang dapat diminta dari kubus. Agregasi disimpan dalam struktur multidmensional dalam sel pada koordinat yang ditentukan oleh dimensi. Misalnya, pertanyaan "Berapa penjualan produk X pada tahun 1998 untuk wilayah Barat Laut?" melibatkan tiga dimensi (Produk, Waktu, dan Geografi) dan satu ukuran (Penjualan). Nilai sel dalam kubus pada koordinat yang ditentukan (produk X, 1998, Barat Laut) adalah jawabannya, satu nilai numerik.

Pertanyaan lain dapat mengembalikan beberapa nilai. Misalnya, "Berapa banyak penjualan produk perangkat keras menurut kuartal menurut wilayah untuk tahun 1998?" Kueri tersebut mengembalikan set sel dari koordinat yang memenuhi kondisi yang ditentukan. Jumlah sel yang dikembalikan oleh kueri bergantung pada jumlah item di tingkat Perangkat Keras dimensi Produk, empat kuartal pada tahun 1998, dan jumlah wilayah dalam dimensi Geografi. Jika semua data ringkasan telah dihitung sebelumnya ke dalam agregasi, waktu respons kueri hanya akan bergantung pada waktu yang diperlukan untuk mengekstrak sel yang ditentukan. Tidak diperlukan perhitungan atau pembacaan data dari tabel fakta.

Meskipun prakalkulasi semua agregasi yang mungkin dalam kubus mungkin memberikan waktu respons tercepat yang mungkin untuk semua kueri, SQL Server Analysis Services dapat dengan mudah menghitung beberapa nilai agregasi dari agregasi lain yang telah dihitung sebelumnya. Selain itu, menghitung semua agregasi yang mungkin memerlukan waktu pemrosesan dan penyimpanan yang signifikan. Oleh karena itu, ada tradeoff antara persyaratan penyimpanan dan persentase kemungkinan agregasi yang dihitung sebelumnya. Jika tidak ada agregasi yang dihitung sebelumnya (0%), jumlah waktu pemrosesan dan ruang penyimpanan yang diperlukan untuk kubus diminimalkan, tetapi waktu respons kueri mungkin lambat karena data yang diperlukan untuk menjawab setiap kueri harus diambil dari sel daun lalu diagregasi pada waktu kueri untuk menjawab setiap kueri. Misalnya, mengembalikan satu angka yang menjawab pertanyaan yang diajukan sebelumnya ("Apa penjualan produk X pada tahun 1998 untuk wilayah Barat Laut") mungkin memerlukan pembacaan ribuan baris data, mengekstrak nilai kolom yang digunakan untuk memberikan ukuran Penjualan dari setiap baris, lalu menghitung jumlah. Selain itu, lamanya waktu yang diperlukan untuk mengambil data tersebut akan sangat tergantung pada mode penyimpanan yang dipilih untuk data-MOLAP, HOLAP, atau ROLAP.

Merancang Agregasi

Microsoft SQL Server SQL Server Analysis Services menggabungkan algoritma canggih untuk memilih agregasi untuk prakalkulasi sehingga agregasi lain dapat dengan cepat dihitung dari nilai yang telah dihitung sebelumnya. Misalnya, jika agregasi dihitung sebelumnya untuk tingkat Bulan hierarki Waktu, perhitungan untuk tingkat Kuartal hanya memerlukan ringkasan tiga angka, yang dapat dengan cepat dihitung sesuai permintaan. Teknik ini menghemat waktu pemrosesan dan mengurangi persyaratan penyimpanan, dengan efek minimal pada waktu respons kueri.

Panduan Desain Agregasi menyediakan opsi bagi Anda untuk menentukan batasan penyimpanan dan persentase pada algoritma untuk mencapai tradeoff yang memuaskan antara waktu respons kueri dan persyaratan penyimpanan. Namun, algoritma Wizard Desain Agregasi mengasumsikan bahwa semua kueri yang mungkin sama kemungkinannya. Wizard Pengoptimalan Usage-Based memungkinkan Anda menyesuaikan desain agregasi untuk grup pengukuran dengan menganalisis kueri yang telah dikirimkan oleh aplikasi klien. Dengan menggunakan wizard untuk menyetel agregasi kubus, Anda dapat meningkatkan respons terhadap kueri yang sering dan mengurangi responsivitas terhadap kueri yang jarang terjadi tanpa memengaruhi penyimpanan yang diperlukan secara signifikan untuk kubus.

Agregasi dirancang dengan menggunakan wizard tetapi tidak benar-benar dihitung sampai partisi yang agregasinya dirancang diproses. Setelah agregasi dibuat, jika struktur kubus pernah berubah, atau jika data ditambahkan ke atau diubah dalam tabel sumber kubus, biasanya perlu untuk meninjau agregasi kubus dan memproses kubus lagi.

Lihat juga

Mode dan Pemrosesan Penyimpanan Partisi