Bagikan melalui


Meningkatkan Azure Blob Storage dengan kemampuan Azure Data Lake Storage

Artikel ini membantu Anda mengaktifkan namespace hierarkis dan membuka kunci kemampuan seperti keamanan tingkat file dan direktori dan operasi yang lebih cepat. Kemampuan ini banyak digunakan oleh beban kerja analitik big data dan disebut secara kolektif sebagai Azure Data Lake Storage.

Untuk mempelajari selengkapnya tentang kemampuan ini dan mengevaluasi dampak peningkatan ini pada beban kerja, aplikasi, biaya, integrasi layanan, alat, fitur, dan dokumentasi, lihat Meningkatkan Azure Blob Storage dengan kemampuan Azure Data Lake Storage.

Penting

Peningkatan merupakan proses satu arah. Tidak ada cara untuk mengembalikan akun Anda setelah melakukan peningkatan. Kami menyarankan Anda memvalidasi peningkatan Anda di lingkungan nonproduksi.

Siapkan diri untuk meningkatkan

Untuk bersiap meningkatkan akun penyimpanan Anda ke Data Lake Storage:

Tinjau dukungan fitur

Akun penyimpanan Anda mungkin dikonfigurasi untuk menggunakan fitur yang belum didukung di akun yang diaktifkan Data Lake Storage. Jika akun Anda menggunakan fitur tersebut, peningkatan tidak akan melewati langkah validasi. Tinjau artikel dukungan fitur Blob Storage di akun Azure Storage untuk mengidentifikasi fitur yang tidak didukung. Jika Anda menggunakan fitur tersebut di akun Anda, nonaktifkan fitur tersebut sebelum memulai peningkatan.

Fitur berikut ini didukung untuk akun Data Lake Storage, tetapi tidak didukung oleh proses peningkatan:

  • Rekam jepret blob
  • Ruang Lingkup Enkripsi
  • Penyimpanan yang tidak bisa diubah
  • Hapus sementara untuk blob
  • Penghapusan kontainer sementara

Jika akun penyimpanan Anda mengaktifkan fitur tersebut, Anda harus menonaktifkannya sebelum melakukan peningkatan. Jika Anda ingin melanjutkan menggunakan fitur setelah peningkatan selesai, aktifkan kembali.

Dalam beberapa kasus, Anda harus menyediakan waktu untuk melakukan operasi pembersihan setelah menonaktifkan fitur sebelum melakukan peningkatan. Salah satu contohnya adalah fitur penghapusan sementara blob . Anda harus menonaktifkan penghapusan lunak blob lalu mengizinkan semua blob yang dihapus secara lunak untuk kedaluwarsa sebelum Anda dapat meningkatkan akun.

Menghapus blob halaman dari akun penyimpanan

Anda tidak dapat memperbarui akun penyimpanan yang berisi page blobs. Pastikan untuk menghapus blob halaman dari akun penyimpanan sebelum Anda melakukan peningkatan.

Pastikan segmen dari setiap jalur blob diberi nama

Proses migrasi membuat direktori untuk setiap segmen jalur blob. Direktori Data Lake Storage harus memiliki nama sehingga migrasi berhasil, setiap segmen jalur dalam direktori virtual harus memiliki nama. Persyaratan yang sama berlaku untuk segmen yang dinamai hanya dengan karakter spasi. Jika ada segmen jalur yang tidak disebutkan namanya (//) atau dinamai hanya dengan karakter spasi (_), maka sebelum melanjutkan migrasi, Anda harus menyalin blob tersebut ke jalur baru yang kompatibel dengan persyaratan penamaan ini.

Mencegah aktivitas tulis ke akun penyimpanan

Peningkatan mungkin gagal jika aplikasi menulis ke akun penyimpanan selama peningkatan. Untuk mencegah aktivitas tulis seperti itu:

  1. Hentikan aplikasi atau layanan apa pun yang mungkin melakukan operasi tulis.

  2. Lepaskan atau batalkan sewa yang ada pada kontainer dan blob di akun penyimpanan.

Setelah peningkatan selesai, putuskan sewa yang Anda buat untuk melanjutkan memungkinkan akses tulis ke kontainer dan blob.

Peringatan

Melanggar sewa aktif tanpa menonaktifkan aplikasi atau komputer virtual yang saat ini mengakses sumber daya tersebut dapat memiliki hasil yang tidak terduga. Pastikan untuk menghentikan sementara aktivitas tulis saat ini sebelum memutuskan perjanjian sewa saat ini.

Lakukan peningkatan

  1. Masuk ke portal Azure untuk memulai.

  2. Temukan akun penyimpanan Anda dan tampilkan gambaran umum akun.

  3. Pilih opsi migrasi Data Lake Gen2.

    Halaman Konfigurasi peningkatan ke akun Storage dengan kemampuan Azure Data Lake Gen2 muncul.

    Halaman konfigurasi

  4. Perluas bagian Langkah 1: Tinjau perubahan akun sebelum memutakhirkan dan klik Tinjau dan setujui perubahan.

  5. Di halaman Tinjau perubahan akun , pilih kotak centang lalu klik Setujui perubahan.

  6. Perluas bagian Langkah 2: Validasi akun sebelum memutakhirkan lalu klik Mulai validasi.

    Jika validasi gagal, kesalahan muncul di halaman. Dalam beberapa kasus, tautan Tampilkan kesalahan muncul. Jika tautan tersebut muncul, pilih tautan tersebut.

    Lihat tautan kesalahan

    Kemudian, dari menu konteks file error.json , pilih Unduh.

    Halaman json kesalahan

    Buka file yang diunduh untuk menentukan mengapa akun tidak melewati langkah validasi. JSON berikut menunjukkan bahwa fitur yang tidak kompatibel diaktifkan pada akun. Dalam hal ini, Anda akan menonaktifkan fitur dan kemudian memulai proses validasi lagi.

    {
     "startTime": "2021-08-04T18:40:31.8465320Z",
     "id": "45c84a6d-6746-4142-8130-5ae9cfe013a0",
     "incompatibleFeatures": [
         "Blob Delete Retention Enabled"
     ],
     "blobValidationErrors": [],
     "scannedBlobCount": 0,
     "invalidBlobCount": 0,
     "endTime": "2021-08-04T18:40:34.9371480Z"
    }
    
  7. Setelah akun Anda berhasil divalidasi, perluas bagian Langkah 3: Tingkatkan akun , lalu klik Mulai peningkatan.

    Penting

    Anda tidak dapat melakukan operasi tulis saat akun Anda sedang dalam proses peningkatan. Operasi baca tidak dinonaktifkan, tetapi kami sangat menyarankan agar Anda menangguhkan operasi baca karena operasi tersebut mungkin mengganggu proses peningkatan.

    Ketika migrasi berhasil diselesaikan, pesan yang mirip dengan yang berikut ini muncul.

    Halaman migrasi selesai

Hentikan pembaruan

Anda dapat menghentikan migrasi sebelum selesai.

Untuk menghentikan peningkatan sebelum selesai, pilih Batalkan peningkatan saat peningkatan sedang berlangsung.

Batalkan pemutakhiran

Memigrasikan data, beban kerja, dan aplikasi

  1. Konfigurasikan layanan pada workload Anda untuk menunjuk ke salah satu dari titik akhir Blob service atau Data Lake storage.

    Titik akhir akun

  2. Untuk beban kerja Hadoop yang menggunakan driver Windows Azure Storage Blob atau driver WASB , pastikan untuk memodifikasinya untuk menggunakan driver Azure Blob File System (ABFS ). Tidak seperti driver WASB yang membuat permintaan ke titik akhir Blob service, driver ABFS akan membuat permintaan ke titik akhir Data Lake Storage akun Anda.

  3. Uji aplikasi kustom untuk memastikan bahwa aplikasi tersebut berfungsi seperti yang diharapkan dengan akun Anda yang ditingkatkan.

    Akses multi-protokol pada Data Lake Storage memungkinkan sebagian besar aplikasi untuk terus menggunakan API Blob tanpa modifikasi. Jika Anda mengalami masalah atau ingin menggunakan API untuk bekerja dengan operasi direktori dan ACL, pertimbangkan untuk memindahkan beberapa kode Anda untuk menggunakan API Data Lake Storage. Lihat panduan untuk .NET, Java, Python, Node.js, dan REST.

  4. Uji skrip kustom apa pun untuk memastikan bahwa skrip berfungsi seperti yang diharapkan dengan akun Anda yang ditingkatkan.

    Seperti halnya dengan API Blob, banyak skrip Anda kemungkinan akan berfungsi tanpa mengharuskan Anda untuk memodifikasinya. Namun, jika diperlukan, Anda dapat meningkatkan file skrip untuk menggunakan cmdlet PowerShell Data Lake Storage, dan perintah Azure CLI.

Lihat juga

Pengantar penyimpanan Azure Data Lake