Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Solusi modern menangani beragam data, seperti transaksi, peristiwa, dokumen, telemetri, aset biner, dan fakta analitis. Satu penyimpanan data jarang memenuhi semua pola akses secara efisien. Sebagian besar sistem produksi mengadopsi persistensi poliglot, yang berarti Anda memilih beberapa model penyimpanan. Artikel ini memusatkan definisi kanonis dari model penyimpanan data utama yang tersedia di Azure dan menyediakan tabel komparatif untuk mempercepat pemilihan model sebelum Anda memilih layanan tertentu.
Gunakan langkah-langkah berikut untuk memilih model data Anda:
Identifikasi pola akses beban kerja, seperti pembacaan titik, agregasi, teks lengkap, kesamaan, pemindaian jendela waktu, dan pengiriman objek.
Petakan pola ke model penyimpanan di bagian berikut.
Buat daftar singkat layanan Azure yang mengimplementasikan model tersebut.
Terapkan kriteria evaluasi, seperti konsistensi, latensi, skala, tata kelola, dan biaya.
Gabungkan model hanya di mana pola akses atau siklus hidup berbeda dengan jelas.
Cara menggunakan panduan ini
Setiap bagian model mencakup definisi ringkas, beban kerja umum, karakteristik data, skenario contoh, dan tautan ke layanan Azure yang representatif. Setiap bagian juga menyertakan tabel untuk membantu Anda memilih layanan Azure yang tepat untuk kasus penggunaan Anda. Dalam beberapa kasus, Anda dapat menggunakan artikel lain untuk membuat pilihan yang lebih tepat tentang opsi layanan Azure. Masing-masing bagian model merujuk pada artikel tersebut.
Dua tabel komparatif meringkas sifat model nonrelasional untuk membantu Anda mengevaluasi opsi dengan cepat tanpa mengulangi konten di seluruh bagian.
Gambaran umum klasifikasi
| Kategori | Tujuan utama | Contoh layanan Azure yang khas |
|---|---|---|
| Relasional (OLTP) | Operasi transaksional yang konsisten | Azure SQL Database, Azure Database for PostgreSQL, atau Azure Database for MySQL |
| Nonrelasi, seperti dokumen, nilai kunci, keluarga kolom, dan grafik | Skema fleksibel atau beban kerja yang berpusat pada hubungan | API Azure Cosmos DB, Azure Managed Redis, Managed Cassandra, atau HBase |
| Rangkaian waktu | Metrik dan peristiwa bertanda waktu dengan tingkat input tinggi | Azure Data Explorer |
| Objek dan file | Penyimpanan file biner atau semi-terstruktur besar | Azure Blob Storage atau Azure Data Lake Storage |
| Pencarian dan pengindeksan | Teks lengkap dan relevansi multi-bidang, pengindeksan sekunder | Pencarian Azure AI |
| Vector | Kesamaan semantik atau perkiraan tetangga terdekat (ANN) | Azure AI Search atau varian Azure Cosmos DB |
| Analitik, pemrosesan analitik online (OLAP), pemrosesan paralel besar-besaran (MPP) | Agregasi historis skala besar atau kecerdasan bisnis (BI) | Microsoft Fabric, Azure Synapse Analytics, Azure Data Explorer, Azure Analysis Services, atau Azure Databricks |
Nota
Satu layanan mungkin menyediakan beberapa model, juga dikenal sebagai multimodel. Pilih model yang paling sesuai alih-alih menggabungkan model dengan cara yang mempersulit operasi.
Penyimpanan data relasional
Sistem manajemen database relasional mengatur data ke dalam tabel yang dinormalisasi menggunakan "schema-on-write". Mereka memberlakukan integritas dan mendukung transaksi atomisitas, konsistensi, isolasi, dan durabilitas (ACID) serta kueri SQL yang kompleks dan kaya fitur.
Kekuatan: Konsistensi transaksional multibaris, gabungan kompleks, batasan relasional yang kuat, dan alat yang matang untuk pelaporan, administrasi, dan tata kelola.
Pertimbangan: Skala horizontal umumnya memerlukan pemecahan data atau partisi, dan normalisasi dapat meningkatkan biaya gabungan untuk tampilan denormalisasi yang berat pada pembacaan.
Beban kerja: Manajemen pesanan, pelacakan inventori, rekaman buku besar keuangan, penagihan, dan pelaporan operasional.
Pilih layanan Azure untuk penyimpanan data relasional
SQL Database adalah database relasional terkelola untuk aplikasi cloud modern yang menggunakan mesin SQL Server.
Azure SQL Managed Instance adalah lingkungan SQL Server yang nyaris lengkap di cloud yang ideal untuk migrasi langsung.
SQL Database (Hyperscale) adalah tingkat SQL yang sangat dapat diskalakan yang dirancang untuk beban kerja besar-besaran dengan penskalaan otomatis yang cepat dan pencadangan yang cepat.
Azure Database for PostgreSQL adalah layanan PostgreSQL terkelola yang mendukung ekstensi sumber terbuka dan opsi penyebaran fleksibel.
Azure Database for MySQL adalah database MySQL terkelola untuk aplikasi web dan beban kerja sumber terbuka.
SQL Database in Fabric adalah database transaksional yang ramah pengembang, berdasarkan SQL Database, yang dapat Anda gunakan untuk dengan mudah membuat database operasional di Fabric.
Gunakan tabel berikut untuk membantu menentukan layanan Azure mana yang memenuhi persyaratan kasus penggunaan Anda.
| Pelayanan | Paling cocok untuk | Fitur utama | Contoh kasus penggunaan |
|---|---|---|---|
| SQL Database | Aplikasi cloud-native | Terkelola, kumpulan elastis, Hyperscale, ketersediaan tinggi terintegrasi, keamanan tingkat lanjut | Membangun aplikasi software as a service (SaaS) modern dengan menggunakan back end SQL yang dapat diskalakan |
| Instans Terkelola SQL | Aplikasi perusahaan lama | Kompatibilitas SQL Server penuh, dukungan lift-and-shift, jaringan virtual, audit tingkat lanjut | Memigrasikan aplikasi SQL Server lokal dengan menggunakan perubahan kode minimal |
| SQL Database (Hyperscale) | Distribusi global | Skalabilitas baca multi-wilayah, replikasi geografis, penskalaan otomatis yang cepat | Menyajikan aplikasi yang terdistribusi secara global dan memerlukan throughput baca yang tinggi. |
| Azure Database for PostgreSQL | Beban kerja analitik sumber terbuka | PostGIS, Hyperscale, Server Fleksibel, ekstensi sumber terbuka | Mengembangkan aplikasi analitik geospasial dengan menggunakan PostgreSQL dan PostGIS |
| Basis Data Azure untuk MySQL | Aplikasi web ringan | Server Fleksibel, kompatibilitas sumber terbuka, hemat biaya | Menghosting situs e-niaga berbasis WordPress |
| SQL Database in Fabric | Beban kerja pemrosesan transaksi online (OLTP) dalam ekosistem Fabric | Dibangun di atas mesin SQL Database, dapat diskalakan, dan diintegrasikan ke dalam Fabric | Membangun aplikasi AI pada model data relasional operasional yang mencakup kemampuan pencarian vektor asli |
Penyimpanan data nonrelasional
Database nonrelasional, juga disebut database NoSQL, mengoptimalkan skema fleksibel, skala horizontal, dan pola akses atau agregasi tertentu. Mereka biasanya melonggarkan beberapa aspek perilaku relasional, seperti kekakuan skema dan cakupan transaksi, untuk skalabilitas atau kelincahan.
Penyimpanan data berbasis dokumen
Gunakan penyimpanan data dokumen untuk menyimpan dokumen semi terstruktur, seringkali dalam format JSON, di mana setiap dokumen menyertakan bidang dan data bernama. Data dapat berupa nilai sederhana atau elemen kompleks, seperti daftar dan koleksi anak. Fleksibilitas skema per dokumen memungkinkan evolusi bertahap.
Kekuatan: Pemetaan objek aplikasi alami, agregat denormalisasi, pengindeksan multi-bidang
Pertimbangan: Pertumbuhan ukuran dokumen, cakupan transaksi selektif, kebutuhan akan desain bentuk data yang cermat untuk kueri skala tinggi
Beban kerja: Katalog produk, manajemen konten, penyimpanan profil
Pilih layanan Azure untuk penyimpanan data dokumen
Azure Cosmos DB for NoSQL adalah database NoSQL multi-wilayah tanpa skema yang memiliki baca dan tulis latensi rendah.
Azure Cosmos DB for MongoDB adalah database terdistribusi secara global yang memiliki kompatibilitas protokol kawat MongoDB dan penskalaan otomatis.
Azure Cosmos DB dalam Fabric adalah database NoSQL tanpa skema yang memiliki baca dan tulis latensi rendah, manajemen yang disederhanakan, dan analitik Fabric bawaan.
Gunakan tabel berikut untuk membantu menentukan layanan Azure mana yang memenuhi persyaratan kasus penggunaan Anda.
| Pelayanan | Paling cocok untuk | Fitur utama | Contoh kasus penggunaan |
|---|---|---|---|
| Azure Cosmos DB untuk NoSQL | Model dokumen JSON kustom yang mendukung kueri seperti SQL | Bahasa kueri yang komprehensif, penulisan multi-wilayah, waktu hidup (TTL), umpan perubahan | Membangun platform SaaS multipenyewa yang mendukung skema fleksibel |
| Azure Cosmos DB untuk MongoDB | Aplikasi yang menggunakan driver MongoDB atau API yang ber sentris JSON | Distribusi global, skala otomatis, protokol kawat MongoDB asli | Memigrasikan aplikasi Node.js dari MongoDB ke Azure |
| Azure Cosmos DB dalam Fabric | Analitik real time melalui data NoSQL | Ekstrak, transformasi, dan pemuatan otomatis (ETL) ke OneLake melalui integrasi Fabric | Aplikasi transaksi yang menyertakan dasbor analitik real-time |
Penyimpanan data keluarga kolom
Database keluarga kolom, juga dikenal sebagai database kolom lebar, menyimpan data jarang ke dalam baris dan mengatur kolom dinamis ke dalam keluarga kolom untuk mendukung akses bersama. Orientasi kolom meningkatkan pemindaian melalui kumpulan kolom yang dipilih.
Kekuatan: Rendemen tulis tinggi, pengambilan data yang luas atau jarang, skema dinamis dalam kelompok data
Pertimbangan: Kunci baris depan dan desain keluarga kolom, dukungan indeks sekunder bervariasi, fleksibilitas kueri lebih rendah dari relasional
Beban kerja: Telemetri Internet of Things (IoT), personalisasi, pengolahan awal analitik, data besar bergaya deret waktu saat Anda tidak menggunakan database deret waktu khusus
Pilih layanan Azure untuk penyimpanan data keluarga kolom
Azure Managed Instance for Apache Cassandra adalah layanan terkelola untuk kluster Apache Cassandra sumber terbuka.
Apache HBase di Azure HDInsight adalah penyimpanan NoSQL yang dapat diskalakan untuk beban kerja big data yang dibangun di Apache HBase dan ekosistem Hadoop.
Azure Data Explorer (Kusto) adalah mesin analitik untuk data telemetri, log, dan rangkaian waktu yang menggunakan Kusto Query Language (KQL).
Gunakan tabel berikut untuk membantu menentukan layanan Azure mana yang memenuhi persyaratan kasus penggunaan Anda.
| Pelayanan | Paling cocok untuk | Fitur utama | Contoh kasus penggunaan |
|---|---|---|---|
| Azure Managed Instance for Apache Cassandra | Beban kerja Cassandra baru dan yang dimigrasikan | Apache Cassandra terkelola dan asli | Pengumpulan telemetri perangkat IoT yang mendukung kompatibilitas Cassandra |
| Apache HBase di HDInsight | Ekosistem Hadoop, pemrosesan analitik batch | Integrasi Hadoop Distributed File System (HDFS), pemrosesan batch skala besar | Pemrosesan data sensor secara batch di pabrik produksi |
| Azure Data Explorer (Kusto) | Telemetri penyerapan tinggi, analitik rangkaian waktu | KQL, kueri ad-hoc cepat, fungsi jendela waktu | Analitik real time untuk log dan metrik aplikasi |
Penyimpanan data kunci-nilai
Penyimpanan data kunci-nilai mengaitkan setiap nilai data dengan kunci unik. Sebagian besar penyimpanan kunci-nilai hanya mendukung operasi kueri, sisipkan, dan hapus sederhana. Untuk memodifikasi nilai, baik itu sebagian atau sepenuhnya, aplikasi harus menimpa data yang ada untuk keseluruhan nilainya. Di sebagian besar implementasi, membaca atau menulis satu nilai adalah operasi atom.
Kekuatan: Kesederhanaan, latensi rendah, skalabilitas linier
Pertimbangan: Ekspresi kueri terbatas, desain ulang yang diperlukan untuk pencarian berbasis nilai, biaya timpa nilai besar
Beban kerja: Cache, sesi, pengaturan fitur, profil pengguna, pencarian rekomendasi
Pilih layanan Azure untuk penyimpanan data bernilai kunci
Azure Managed Redis adalah penyimpanan data dalam memori terkelola berdasarkan versi Redis Enterprise terbaru yang menyediakan latensi rendah dan throughput tinggi.
Azure Cosmos DB for Table adalah penyimpanan kunci-nilai yang dioptimalkan untuk akses cepat ke data NoSQL terstruktur.
Azure Cosmos DB for NoSQL adalah penyimpanan data dokumen yang dioptimalkan untuk akses cepat ke data NoSQL terstruktur dan memberikan skalabilitas horizontal.
Gunakan tabel berikut untuk membantu menentukan layanan Azure mana yang memenuhi persyaratan kasus penggunaan Anda.
| Pelayanan | Paling cocok untuk | Fitur utama | Contoh kasus penggunaan |
|---|---|---|---|
| Azure Managed Redis | Penembolokan berkecepatan tinggi, status sesi, penerbit-pelanggan | Penyimpanan dalam memori, latensi submillisecond, protokol Redis | Caching halaman produk untuk situs e-commerce |
| Azure Cosmos DB untuk Tabel | Memigrasikan beban kerja Azure Table Storage yang sudah ada | Kompatibilitas Table Storage API | Menyimpan preferensi dan pengaturan pengguna di aplikasi seluler |
| Azure Cosmos DB untuk NoSQL | Penembolokan berkecepatan tinggi dengan skala besar dan ketersediaan tinggi | Tanpa skema, multi-wilayah, skala otomatis | Penembolokan, status sesi, lapisan penyajian |
Penyimpanan data grafik
Database grafik menyimpan informasi sebagai simpul dan tepi. Tepi menentukan hubungan, dan simpul dan tepi dapat memiliki properti yang mirip dengan kolom tabel. Anda dapat menganalisis koneksi antar entitas, seperti karyawan dan departemen.
Kekuatan: Pola kueri yang memprioritaskan hubungan, pencarian melalui kedalaman variabel yang efisien
Pertimbangan: Overhead jika hubungan dangkal, memerlukan pemodelan yang hati-hati untuk kinerja, tidak ideal untuk pemindaian analitik dalam jumlah besar
Beban kerja: Jejaring sosial, cincin penipuan, grafik pengetahuan, dependensi rantai pasokan
Pilih layanan Azure untuk penyimpanan data grafik
Gunakan ekstensi grafik SQL Server untuk menyimpan data grafik. Ekstensi grafik memperluas kemampuan SQL Server, SQL Database, dan SQL Managed Instance untuk memungkinkan pemodelan dan kueri hubungan kompleks dengan menggunakan struktur grafik langsung dalam database relasional.
Penyimpanan data rangkaian waktu
Penyimpanan data rangkaian waktu mengelola sekumpulan nilai yang diatur menurut waktu. Mereka mendukung fitur seperti kueri dan agregasi berbasis waktu dan dioptimalkan untuk menyerap dan menganalisis data dalam volume besar hampir secara real time.
Kekuatan: Kompresi, performa kueri berjendela, penanganan pemasukan yang tidak berurutan
Pertimbangan: manajemen kardinalitas tag, biaya retensi, strategi penurunan sampel
Beban kerja: Metrik sensor IoT, telemetri aplikasi, pemantauan, data industri
Pilih layanan Azure untuk penyimpanan data rangkaian waktu
Gunakan Azure Data Explorer untuk menyimpan data rangkaian waktu. Azure Data Explorer adalah platform analitik big data terkelola, berkinerja tinggi, yang memudahkan untuk menganalisis data dalam volume tinggi hampir secara real time.
Penyimpanan data objek
Simpan objek biner besar atau semi terstruktur dan sertakan metadata yang jarang berubah atau tetap tidak dapat diubah.
Kekuatan: Skala virtual tanpa batas, biaya berjenjang, durabilitas, kemampuan baca paralel
Pertimbangan: Operasi seluruh objek, kueri metadata terbatas, perilaku daftar akhir
Beban kerja: Aset media, cadangan, zona mentah data lake, arsip log
Pilih layanan Azure untuk penyimpanan data objek
Data Lake Storage adalah penyimpanan objek big data yang dioptimalkan yang menggabungkan namespace hierarkis dan kompatibilitas HDFS untuk analitik tingkat lanjut dan pemrosesan data skala besar.
Blob Storage adalah penyimpanan objek yang dapat diskalakan untuk data yang tidak terstruktur seperti gambar, dokumen, dan cadangan yang mencakup akses berjenjang untuk pengoptimalan biaya.
Gunakan tabel berikut untuk membantu menentukan layanan Azure mana yang memenuhi persyaratan kasus penggunaan Anda.
| Pelayanan | Paling cocok untuk | Fitur utama | Contoh kasus penggunaan |
|---|---|---|---|
| Data Lake Storage | Analitik big data dan data hierarkis | HDFS, namespace hierarkis, dioptimalkan untuk analitik | Menyimpan dan mengkueri petabyte data terstruktur dan tidak terstruktur dengan menggunakan Azure Synapse Analytics atau Azure Databricks |
| Penyimpanan Blob | Penyimpanan objek tujuan umum | Namespace datar, REST API sederhana, dan penyimpanan berjenjang yang mencakup panas, dingin, dan arsip | Menghosting gambar, dokumen, cadangan, dan konten situs web statis |
Mencari dan mengindeks penyimpanan data
Database mesin pencari memungkinkan aplikasi untuk mencari informasi di penyimpanan data eksternal. Database mesin pencari dapat mengindeks data dalam volume besar dan menyediakan akses mendekati real-time ke indeks ini.
Kekuatan: Kueri teks lengkap, penilaian, analisis linguistik, pencocokan fuzzy
Pertimbangan: Konsistensi akhir indeks, alur penyerapan atau pengindeksan terpisah, biaya pembaruan indeks besar
Beban kerja: Pencarian situs atau produk, pencarian log, pemfilteran metadata, penemuan multi-atribut
Pilih layanan Azure untuk penyimpanan data pencarian
Untuk informasi selengkapnya, lihat Memilih penyimpanan data pencarian di Azure.
Penyimpanan data pencarian berbasis vektor
Data pencarian vektor menyimpan dan mengambil representasi data vektor dimensi tinggi, yang sering dihasilkan oleh model pembelajaran mesin.
Kekuatan: Pencarian semantik, algoritma ANN
Pertimbangan: Kompleksitas pengindeksan, overhead penyimpanan, latensi versus akurasi, tantangan integrasi
Beban kerja: Pencarian dokumen semantik, mesin rekomendasi, pengambilan gambar dan video, penipuan, dan deteksi anomali
Pilih layanan Azure untuk penyimpanan data pencarian vektor
Untuk informasi selengkapnya, lihat Memilih layanan Azure untuk pencarian vektor.
Penyimpanan data analitik
Pustaka data analitik menyimpan big data dan mempertahankannya secara berkesinambungan sepanjang siklus hidup alur analitik.
Kekuatan: Komputasi dan penyimpanan yang dapat diskalakan, dukungan untuk SQL dan Spark, integrasi dengan alat BI, seri waktu, dan analisis telemetri
Pertimbangan: Biaya dan kompleksitas orkestrasi, latensi kueri untuk beban kerja ad-hoc, tata kelola di beberapa domain data
Beban kerja: Pelaporan perusahaan, analitik big data, agregasi telemetri, dasbor operasional, alur ilmu data
Pilih layanan Azure untuk penyimpanan data analitik
Untuk informasi selengkapnya, lihat Memilih penyimpanan data analitik di Azure.
Karakteristik perbandingan (model nonrelasional inti)
| Aspek | Dokumen | Keluarga kolom | Nilai kunci | Graph |
|---|---|---|---|---|
| Normalisasi | Denormalisasi | Denormalisasi | Denormalisasi | Hubungan yang dinormalisasi |
| Pendekatan skema | Skema saat pembacaan data | Keluarga kolom yang ditentukan, skema kolom saat dibaca | Skema saat pembacaan data | Skema saat pembacaan data |
| Konsistensi (standar) | Dapat disesuaikan untuk setiap item | Untuk setiap baris atau keluarga | Untuk setiap kunci | Untuk setiap semantik tepi atau traversal |
| Cakupan atomisitas | Dokumen | Baris atau keluarga, tergantung pada implementasi tabel | Kunci tunggal | Transaksi grafik (bervariasi) |
| Penguncian dan konkurensi | Optimis (ETag) | Pesimis atau optimis, tergantung pada implementasi | Optimis (utama) | Optimis (pola) |
| Pola akses | Agregat (entitas) | Agregat jarang luas | Pencarian titik menurut kunci | Penelusuran hubungan |
| Pengindeksan | Primer dan sekunder | Primer dan sekunder terbatas | Kunci Utama | Primer dan terkadang sekunder |
| Bentuk data | Hierarkis fleksibel | Tabel jarang lebar | Nilai buram | Simpul dan tepi |
| Kesesuaian Renggang/Lebar | Ya/Ya | Ya/Ya | Ya/Tidak | Tidak/Tidak |
| Ukuran data umum | Kecil–sedang | Sedang–besar | Kecil | Kecil |
| Dimensi skala | Jumlah partisi | Lebar ukuran partisi dan keluarga kolom | Ruang kunci | Jumlah simpul atau tepi |
Karakteristik komparatif (model nonrelasi khusus)
| Aspek | Rangkaian waktu | Objek (blob) | Pencarian/Pengindeksan |
|---|---|---|---|
| Normalisasi | Dinormalisasi | Denormalisasi | Denormalisasi |
| Schema | Skema saat membaca (penanda) | Nilai tidak transparan dan metadata | Skema saat menulis (pemetaan indeks) |
| Cakupan atomisitas | N/A (tambahkan) | Objek | Untuk setiap dokumen atau operasi indeks |
| Pola akses | Pemindaian bagi waktu, agregasi berbasis jendela | Operasi pada seluruh objek | Kueri dan filter teks |
| Pengindeksan | Waktu dan tambahan opsional | Kunci (jalur) saja | Faset terbalik dan opsional |
| Bentuk data | Tabular (tanda waktu, tag, nilai) | Biner atau blob dengan metadata | Teks yang ditokenisasi dan bidang terstruktur |
| Tulis profil | Penambahan laju tinggi | Pembaruan massal atau jarang | Indeks sekumpulan atau aliran |
| Membaca profil | Rentang teragregasi | Unduhan keseluruhan atau parsial | Set hasil berperingkat |
| Pendorong pertumbuhan | Laju peristiwa dikalikan dengan retensi | Jumlah dan ukuran objek | Volume dokumen terindeks |
| Toleransi konsistensi | Penyelesaian untuk data tertunda | Baca-setelah-tulis untuk setiap objek | Untuk penyelesaian dokumen baru |
Pilih di antara model (heuristik)
| Perlu | Lebih suka |
|---|---|
| Transaksi multi-entitas yang ketat | Relasional |
| Bentuk agregat yang berkembang, API yang berpusat pada JSON | Dokumen |
| Pencarian kunci atau cache dengan latensi sangat rendah | Nilai kunci |
| Telemetri lebar, jarang, berat tulis | Famili Kolom atau Rangkaian Waktu |
| Penelusuran mendalam hubungan | Graph |
| Pemindaian analitik besar-besaran terhadap data historis | Analitik atau OLAP |
| Biner besar yang tidak terstruktur atau zona danau | Objek |
| Relevansi dan pemfilteran teks lengkap | Pencarian dan pengindeksan |
| Metrik tanda waktu penyerapan tinggi dengan kueri jendela | Rangkaian waktu |
| Kesamaan cepat (semantik atau vektor) | Pencarian vektor |
Menggabungkan model dan menghindari perangkap
Gunakan lebih dari satu model saat skenario berikut berlaku:
- Pola akses berbeda, seperti pencarian titik versus pemindaian analitik lebar versus relevansi teks lengkap.
- Siklus hidup dan retensi berbeda, seperti data mentah yang bersifat tidak berubah versus terstruktur yang dikurasi.
- Persyaratan latensi dan throughput sering kali bertentangan.
Hindari fragmentasi dini:
- Gunakan satu layanan saat masih memenuhi tujuan performa, skala, dan tata kelola.
- Pusatkan logika klasifikasi bersama, dan hindari alur transformasi duplikat di seluruh penyimpanan kecuali diperlukan.
Perhatikan antipattern umum berikut:
- Beberapa layanan mikro berbagi satu database, yang menciptakan kopling.
- Tim menambahkan model lain tanpa kematangan operasional, seperti pemantauan dan pencadangan.
- Indeks pencarian menjadi penyimpanan data utama, yang menyebabkan penyalahgunaan.
Kapan harus mengevaluasi kembali pilihan model Anda
| Tanda | Kemungkinan tindakan |
|---|---|
| Meningkatkan penggabungan ad-hoc pada sistem penyimpanan dokumen | Memperkenalkan model baca relasional |
| CPU tinggi pada indeks pencarian karena agregasi analitis | Pindahkan ke mesin pengolah analitik |
| Dokumen denormalisasi besar menimbulkan kontensi pembaruan parsial | Bentuk ulang agregat atau memisahkan |
| Kueri rentang waktu lambat di penyimpanan berbasis kolom | Mengadopsi database seri waktu yang dibuat khusus |
| Latensi pencarian titik naik dengan kedalaman traversal grafik | Menambahkan tampilan materialisasi turunan |
Langkah selanjutnya
- Metodologi Aman dalam Kerangka Kerja Adopsi Cloud untuk Azure
- Keamanan data kerangka kerja Zero Trust
Sumber daya terkait
Gunakan artikel berikut untuk memilih penyimpanan data khusus:
- Memilih teknologi penyimpanan big data di Azure
- Memilih penyimpanan data pencarian di Azure
- Pilih layanan Azure untuk pencarian vektor
Pelajari tentang arsitektur referensi yang menggunakan layanan Azure dalam artikel ini:
- Arsitektur aplikasi web dasar dengan ketersediaan tinggi dan zona redundansi menggunakan SQL Database sebagai penyimpanan data relasionalnya.
- Penyebaran layanan mikro dengan Azure Container Apps dan arsitektur Dapr menggunakan SQL Database, Azure Cosmos DB, dan Azure Cache for Redis sebagai penyimpanan data.
- Mengotomatiskan klasifikasi dokumen dalam arsitektur Azure menggunakan Azure Cosmos DB sebagai penyimpanan datanya.