Akun penyimpanan blob blok premium
Akun penyimpanan blob blok premium membuat data tersedia melalui perangkat keras berperforma tinggi. Data disimpan pada solid-state drive (SSD) yang dioptimalkan untuk latensi rendah. SSD menyediakan throughput yang lebih tinggi dibanding hard drive tradisional. Transfer file jauh lebih cepat karena data disimpan pada chip memori yang dapat diakses secara instan. Semua bagian dari drive dapat diakses sekaligus. Sebaliknya, performa hard disk drive (HDD) bergantung pada kedekatan data dengan kepala baca/tulis.
Beban kerja berperforma tinggi
Akun penyimpanan blob blok premium ideal untuk beban kerja yang memerlukan waktu respons yang cepat dan konsisten dan/atau memiliki jumlah operasi input output per detik (IOP) yang tinggi. Beban kerja ini meliputi:
Beban kerja interaktif. Aplikasi yang sangat interaktif dan real time harus menulis data dengan cepat. Aplikasi e-niaga dan pemetaan sering kali memerlukan pembaruan instan dan umpan balik pengguna. Misalnya, dalam aplikasi e-niaga, item yang kurang sering dilihat kemungkinan tidak di-cache. Namun, mereka harus langsung ditampilkan kepada pelanggan sesuai permintaan. Pengeditan interaktif atau aplikasi game online multi-pemain mempertahankan pengalaman berkualitas dengan menyediakan pembaruan real time.
Analitik IoT/streaming. Dalam skenario IoT, banyak operasi tulis lebih kecil yang mungkin didorong ke awan setiap detik. Sejumlah besar data mungkin diambil, diagregasi untuk tujuan analisis, lalu dihapus segera. Tingginya kemampuan menelan penyimpanan blob blok premium membuatnya efisien untuk jenis beban kerja ini.
Kecerdasan buatan/pembelajaran mesin (AI/ML). AI/ML menangani konsumsi dan pemrosesan berbagai jenis data seperti visual, ucapan, dan teks. Jenis beban kerja komputasi berperforma tinggi ini berkaitan dengan sejumlah besar data yang membutuhkan respons cepat dan waktu menelan yang efisien untuk analisis data.
Efektivitas biaya
Akun penyimpanan blob blok premium memiliki biaya penyimpanan yang lebih tinggi tetapi dengan biaya transaksi yang lebih rendah dibandingkan dengan akun v2 umum standar. Jika aplikasi dan beban kerja Anda menjalankan sejumlah besar transaksi, penyimpanan blob blok premium dapat hemat biaya, terutama jika beban kerja menulis-berat.
Dalam kebanyakan kasus, beban kerja yang menjalankan lebih dari 35 hingga 40 transaksi per detik per terabyte (TPS/TB) adalah kandidat yang baik untuk jenis akun ini. Misalnya, jika beban kerja Anda menjalankan 500 juta operasi baca dan 100 juta operasi tulis dalam sebulan, maka Anda dapat menghitung TPS/TB sebagai berikut:
Transaksi tulis per detik = 100,000,000 / (30 x 24 x 60 x 60) = 39 (dibulatkan ke bilangan bulat terdekat)
Transaksi baca per detik = 500,000,000 / (30 x 24 x 60 x 60) = 193 (dibulatkan ke bilangan bulat terdekat)
Total transaksi per detik = 193 + 39 = 232
Dengan asumsi akun Anda memiliki data rata-rata 5TB, maka TPS/TB akan menjadi 230 / 5 = 46.
Catatan
Harga berbeda per operasi dan per wilayah. Gunakan kalkulator harga Azure untuk membandingkan harga antara tingkatan performa standar dan premium.
Tabel berikut menunjukkan efektivitas biaya akun penyimpanan blob blok premium. Angka dalam tabel ini didasarkan pada akun penyimpanan blob blok premium dengan dukungan Azure Data Lake Storage (juga disebut sebagai tingkat premium untuk Azure Data Lake Storage). Setiap kolom menunjukkan jumlah transaksi dalam sebulan. Setiap baris menunjukkan persentase transaksi yang membaca transaksi. Setiap sel dalam tabel menunjukkan persentase pengurangan biaya yang terkait dengan persentase transaksi baca dan jumlah transaksi yang dieksekusi.
Misalnya, dengan asumsi bahwa akun Anda berada di wilayah US Timur 2, jumlah transaksi dengan akun Anda melebihi 90 juta, dan 70% dari transaksi tersebut adalah transaksi baca, akun penyimpanan blob blok premium lebih hemat biaya.
Catatan
Jika Anda lebih suka mengevaluasi efektivitas biaya berdasarkan jumlah transaksi per detik untuk setiap TB data, Anda dapat menggunakan judul kolom yang muncul di bagian bawah tabel.
Skenario Premium
Bagian ini berisi contoh nyata tentang bagaimana beberapa mitra Azure Storage kami menggunakan penyimpanan blob blok premium. Beberapa di antaranya juga memungkinkan Azure Data Lake Storage yang memperkenalkan struktur file hierarkis yang dapat lebih meningkatkan performa transaksi dalam skenario tertentu.
Tip
Jika Anda memiliki kasus penggunaan analitik, kami sangat menyarankan Anda menggunakan Azure Data Lake Storage bersama dengan akun penyimpanan blob blok premium.
Bagian ini berisi contoh-contoh berikut:
- Akun penyimpanan blob blok premium
Hidrasi data cepat
Penyimpanan blob blok premium dapat membantu Anda menghidrasi atau memunculkan lingkungan Anda dengan cepat. Dalam industri seperti perbankan, persyaratan peraturan tertentu mungkin mengharuskan perusahaan untuk secara teratur meruntuhkan lingkungan mereka, lalu membangunnya lagi dari awal. Data yang digunakan untuk menghidrasi lingkungan mereka harus dimuat dengan cepat.
Beberapa mitra kami menyimpan salinan instans MongoDB mereka setiap minggu ke akun penyimpanan blob blok premium. Sistem ini kemudian diruntuhkan. Untuk membuat sistem kembali online dengan cepat, salinan terbaru dari instans MangoDB dibaca dan dimuat. Untuk tujuan audit, salinan sebelumnya disimpan dalam penyimpanan cloud untuk jangka waktu tertentu.
Aplikasi pengeditan interaktif
Jika beberapa pengguna mengedit konten yang sama dalam suatu aplikasi, kecepatan pembaruan penting untuk melancarkan pengalaman pengguna.
Beberapa mitra kami mengembangkan perangkat lunak pengeditan video. Setiap pembaruan yang dibuat pengguna ke video segera terlihat oleh pengguna lain. Pengguna dapat fokus pada tugas mereka daripada menunggu pembaruan konten muncul. Latensi rendah yang terkait dengan penyimpanan blob blok premium membantu menciptakan pengalaman yang mulus dan kolaboratif ini.
Perangkat lunak visualisasi data
Pengguna bisa jauh lebih produktif dengan perangkat lunak visualisasi data jika waktu perenderan cepat.
Kami telah melihat perusahaan di industri pemetaan menggunakan editor pemetaan untuk mendeteksi masalah dengan peta. Editor ini menggunakan data yang dihasilkan dari data Global Positioning System (GPS) pelanggan. Untuk membuat peta tumpang tindih, perangkat lunak pengeditan merender bagian kecil dari peta dengan melakukan pencarian kunci dengan cepat.
Dalam satu kasus, sebelum menggunakan penyimpanan blob blok premium, mitra menggunakan kluster HBase yang didukung oleh penyimpanan v2 tujuan umum standar. Namun, dibutuhkan biaya besar untuk membuat kluster besar tetap berjalan sepanjang waktu. Mitra ini memutuskan untuk menjauh dari arsitektur ini, dan sebagai gantinya menggunakan penyimpanan blob blok premium untuk pencarian kunci dengan cepat. Untuk membuat tumpang tindih, mitra menggunakan REST API untuk merender petak peta yang sesuai dengan koordinat GPS. Akun penyimpanan blob blok premium memberi mereka solusi hemat biaya, dengan latensi yang jauh lebih mudah untuk diprediksi.
Bisnis e-niaga
Selain mendukung toko yang menghadapi pelanggan, bisnis e-niaga juga dapat menyediakan solusi pergudangan data dan analitik kepada tim internal. Kami telah melihat mitra menggunakan akun penyimpanan blob blok premium untuk mendukung persyaratan latensi rendah oleh solusi pergudangan dan analitik data ini. Dalam satu kasus, tim katalog memelihara aplikasi pergudangan data untuk data yang berkaitan dengan penawaran, harga, metode pengiriman, pemasok, inventaris, dan logistik. Informasi yang dikuerikan, dipindai, diekstraksi, dan ditambang untuk beberapa kasus penggunaan. Tim menjalankan analitik pada data ini untuk memberikan wawasan dan informasi yang relevan kepada berbagai tim merchandising.
Analitik interaktif
Di hampir setiap industri, terdapat kebutuhan bagi perusahaan untuk mengkuerikan dan menganalisis data mereka secara interaktif.
Ilmuwan data, analis, dan pengembang dapat memperoleh wawasan sensitif waktu lebih cepat dengan menjalankan kueri pada data yang disimpan dalam akun penyimpanan blob blok premium. Eksekutif dapat memuat dasbor mereka jauh lebih cepat ketika data yang muncul di dasbor tersebut berasal dari akun penyimpanan blob blok premium, bukan akun v2 umum standar.
Dalam satu skenario, analis perlu menganalisis data telemetri dari jutaan perangkat dengan cepat untuk lebih memahami bagaimana produk mereka digunakan, dan untuk membuat keputusan rilis produk. Menyimpan data dalam database SQL membutuhkan biaya yang besar. Untuk mengurangi biaya, dan untuk meningkatkan area permukaan yang dapat dikueri, mereka menggunakan akun penyimpanan blob blok premium dengan dukungan Azure Data Lake Storage dan melakukan komputasi di Presto dan Spark untuk menghasilkan wawasan dari tabel hive. Dengan cara ini, bahkan data yang jarang diakses memiliki semua kekuatan komputasi yang sama dengan data yang sering diakses.
Untuk menutup kesenjangan antara performa subdetik SQL dan operasi keluaran input Presto per detik (IOP) ke penyimpanan eksternal, konsistensi dan kecepatan sangat penting, terutama ketika berhadapan dengan file kolom baris kecil yang dioptimalkan (ORC). Akun penyimpanan blob blok premium saat digunakan dengan Data Lake Storage, telah berulang kali menunjukkan peningkatan performa 3X atas akun v2 tujuan umum standar dalam skenario ini. Kueri dijalankan cukup cepat agar terasa lokal ke mesin komputasi.
Dalam kasus lain, mitra menyimpan dan mengkuerikan log yang dihasilkan dari solusi keamanan mereka. Log dihasilkan dengan menggunakan Databricks, lalu disimpan di akun penyimpanan blob blok premium yang diaktifkan Data Lake Storage. Pengguna akhir mengkueri dan mencari data ini dengan menggunakan Azure Data Explorer. Pengguna akhir memilih jenis akun ini untuk meningkatkan stabilitas dan meningkatkan performa kueri interaktif. Mereka juga menetapkan kebijakan manajemen siklus hidup Delete Action
ke beberapa hari, yang membantu mengurangi biaya. Kebijakan ini mencegah mereka menyimpan data selamanya. Sebaliknya, data dihapus setelah tidak lagi diperlukan.
Alur pemrosesan data
Di hampir setiap industri, ada kebutuhan bagi perusahaan untuk memproses data. Data mentah dari berbagai sumber perlu dibersihkan dan diproses agar berguna untuk penggunaan downstream dalam alat seperti dasbor data yang membantu pengguna membuat keputusan.
Sementara kecepatan pemrosesan tidak selalu menjadi perhatian utama ketika memproses data, beberapa industri membutuhkannya. Misalnya, perusahaan di industri layanan keuangan sering kali perlu memproses data dengan andal serta secepat mungkin. Untuk mendeteksi penipuan, perusahaan-perusahaan tersebut harus memproses masukan dari berbagai sumber, mengidentifikasi risiko bagi pelanggan mereka, dan mengambil tindakan cepat.
Dalam beberapa kasus, kami telah melihat mitra menggunakan beberapa akun penyimpanan standar untuk menyimpan data dari berbagai sumber. Beberapa dari data ini kemudian dipindahkan ke akun penyimpanan blob blok premium dengan dukungan Data Lake Store tempat aplikasi pemrosesan data sering membaca data yang baru tiba. Panggilan daftar direktori di akun ini jauh lebih cepat dan dilakukan jauh lebih konsisten daripada yang seharusnya dilakukan di akun v2 umum standar. Kecepatan dan konsistensi yang ditawarkan oleh akun memastikan bahwa data baru selalu tersedia untuk sistem pemrosesan downstream secepat mungkin. Hal ini membantu mereka mengambil dan bertindak atas potensi risiko keamanan dengan segera.
Internet of Things (IoT)
IoT telah menjadi bagian penting dari kehidupan kita sehari-hari. IoT digunakan untuk melacak pergerakan mobil, mengontrol lampu, dan memantau kesehatan kita. IoT juga memiliki aplikasi industri. Misalnya, perusahaan menggunakan IoT untuk mengaktifkan proyek pabrik pintar mereka, meningkatkan hasil pertanian, dan rig minyak untuk pemeliharaan prediktif. Akun penyimpanan blob blok premium menambah nilai signifikan pada skenario ini.
Kami memiliki mitra di industri pertambangan. Mereka menggunakan Data Lake Storage memungkinkan akun penyimpanan blob blok premium bersama dengan HDInsight (Hbase) untuk menyerap data sensor rangkaian waktu dari beberapa jenis peralatan penambangan, dengan profil beban yang sangat membebani. Penyimpanan blob blok premium telah membantu memenuhi kebutuhan mereka akan penyerapan sample rate yang tinggi. Penyimpanan ini juga hemat biaya, karena penyimpanan blob blok premium dioptimalkan dari segi biaya untuk beban kerja yang melakukan sejumlah besar transaksi tulis, dan beban kerja ini menghasilkan sejumlah besar transaksi tulis kecil (dalam puluhan ribu per detik).
Machine Learning
Dalam banyak kasus, banyak data harus diproses untuk melatih model pembelajaran mesin. Untuk menyelesaikan pemrosesan ini, mesin komputasi harus berjalan untuk waktu yang lama. Dibandingkan dengan biaya penyimpanan, biaya komputasi biasanya menyumbang persentase yang jauh lebih besar dari tagihan Anda, sehingga mengurangi jumlah waktu yang digunakan mesin komputasi dapat menyebabkan penghematan yang signifikan. Latensi rendah yang Anda dapatkan dengan menggunakan penyimpanan blob blok premium dapat secara signifikan mengurangi waktu dan tagihan Anda.
Kami memiliki partner yang menyebarkan alur pemrosesan data untuk memicu kluster tempat mereka menjalankan pelatihan dan inferensi pembelajaran mesin. Mereka menyimpan tabel spark (file parket) dan titik pemeriksaan ke akun penyimpanan blob blok premium. Titik pemeriksaan Spark dapat membuat sejumlah besar file dan folder bersarang. Operasi daftar direktori mereka cepat karena menggabungkan latensi rendah akun penyimpanan blob blok premium dengan struktur data hierarkis yang disediakan dengan Data Lake Storage.
Kami juga memiliki mitra di industri semikonduktor dengan kasus penggunaan yang bersinggungan dengan IoT dan pembelajaran mesin. Perangkat IoT yang terpasang pada mesin di pabrik manufaktur mengambil gambar wafer semikonduktor dan mengirimkannya ke akun mereka. Dengan menggunakan inferensi pembelajaran mendalam, sistem ini dapat menginformasikan mesin di lokasi jika terjadi masalah dengan produksi dan apabila tindakan perlu diambil. Mesin-mesin ini harus dapat memuat dan memproses gambar dengan cepat dan andal. Menggunakan akun penyimpanan blob blok premium yang diaktifkan Data Lake Storage membantu memungkinkan hal ini.
Analitik streaming real time
Untuk mendukung analitik interaktif hampir secara real time, sistem harus menyerap dan memproses data dalam jumlah besar, lalu membuat data tersebut tersedia untuk sistem hilir. Menggunakan akun penyimpanan blob blok premium berkemampuan Data Lake Storage sangat cocok untuk jenis skenario ini.
Perusahaan di industri media dan hiburan dapat menghasilkan sejumlah besar log dan data telemetri dalam waktu singkat saat mereka menyiarkan suatu acara. Beberapa mitra kami mengandalkan beberapa mitra jaringan pengiriman konten (CDN) untuk streaming. Mereka harus membuat keputusan mendekati real time tentang mitra CDN mana yang akan dialokasikan lalu lintasnya. Oleh karena itu, data harus tersedia untuk mengkueri beberapa detik setelah diserap. Untuk memfasilitasi pengambilan keputusan yang cepat ini, mereka menggunakan data yang disimpan dalam penyimpanan blob blok premium, dan memproses data tersebut di Azure Data Explorer (ADX). Semua telemetri yang diunggah ke penyimpanan diubah dalam ADX, tempat telemetri tersebut dapat disimpan dalam format yang sudah dikenal yang dapat dikueri oleh operator dan eksekutif dengan cepat dan andal.
Data diunggah ke beberapa akun Azure Blob Storage performa premium. Setiap akun tersambung ke sumber daya Event Grid dan Event Hub. ADX mengambil data dari Azure Blob Storage, melakukan transformasi yang diperlukan untuk menormalkan data (Misalnya: mendekompresi file zip atau mengkonversi dari JSON ke CSV). Kemudian, data tersebut dibuat tersedia untuk kueri melalui ADX dan dasbor yang ditampilkan di Grafana. Dasbor Grafana digunakan oleh operator, eksekutif, dan pengguna lainnya. Pelanggan menyimpan log asli mereka di penyimpanan performa premium, atau mereka menyalinnya ke akun penyimpanan v2 umum tempat mereka dapat disimpan di tingkat akses panas atau dingin untuk retensi jangka panjang dan analisis di masa mendatang.
Mulai menggunakan premium
Pertama, periksa untuk memastikan fitur Azure Blob Storage favorit Anda kompatibel dengan akun penyimpanan blob blok premium, lalu buat akun.
Catatan
Anda tidak dapat mengonversi akun penyimpanan v2 umum standar yang ada ke akun penyimpanan blob blok premium. Untuk bermigrasi ke akun penyimpanan blob block premium, Anda harus membuat akun penyimpanan blob blok premium, dan memigrasikan data ke akun baru.
Periksa kompatibilitas fitur Azure Blob Storage
Beberapa fitur Azure Blob Storage belum didukung atau memiliki dukungan parsial di akun penyimpanan blob blok premium. Sebelum memilih premium, tinjau artikel Dukungan fitur Azure Blob Storage di akun Microsoft Azure Storage untuk menentukan apakah fitur yang ingin Anda gunakan didukung penuh di akun Anda. Dukungan fitur selalu berkembang, jadi pastikan untuk meninjau artikel ini secara berkala untuk pembaruan.
Buat Akun penyimpanan baru
Untuk membuat akun penyimpanan blob blok premium, pastikan untuk memilih opsi performa Premium dan jenis akun Blob blok saat Anda membuat akun tersebut.
Catatan
Beberapa fitur Azure Blob Storage belum didukung atau memiliki dukungan parsial di akun penyimpanan blob blok premium. Sebelum memilih premium, tinjau artikel Dukungan fitur Azure Blob Storage di akun Microsoft Azure Storage untuk menentukan apakah fitur yang ingin Anda gunakan didukung penuh di akun Anda. Dukungan fitur selalu berkembang, jadi pastikan untuk meninjau artikel ini secara berkala untuk pembaruan.
Jika akun penyimpanan Anda akan digunakan untuk analitik, kami sangat menyarankan Anda menggunakan Azure Data Lake Storage bersama dengan akun penyimpanan blob blok premium. Untuk membuka kunci kemampuan Azure Data Lake Storage, aktifkan pengaturan namespace hierarkis di tab Tingkat Lanjut di halaman Buat akun penyimpanan.
Gambar berikut ini memperlihatkan pengaturan ini di halaman Buat akun penyimpanan.
Untuk panduan lengkap, lihat akun Membuat akun penyimpanan.