Veri Bilimi projeleri için lakehouse'da verilere başvurma

Bu hızlı başlangıçta, dış ADLS hesabında depolanan verilere başvurma ve bunu Veri bilimi projelerinizde kullanma açıklanmaktadır. Bu hızlı başlangıcı tamamladıktan sonra, lakehouse'unuzda ADLS depolamaya yönelik bir kısayolunuz ve dış verilerinize erişen Spark kodu içeren bir not defteriniz olacak.

Kısayol için veri hazırlama

  1. Azure'da ADLS 2. Nesil hesabı oluşturma

  2. Hiyerarşik ad alanlarını etkinleştirme

    Screenshot of hierarchical namespaces in storage account.

  3. Verileriniz için klasör oluşturma

  4. Verileri karşıya yükleme

  5. Blob Depolama Contributor rolüne kullanıcı kimliğinizi ekleme

  6. Depolama hesabı uç noktasını alma

Kısayol oluşturma

  1. Lakehouse Explorer'a ulaşmak için göl evinizi açın

  2. Dosyaların altında verilere başvuracağınız bir klasör oluşturun

  3. Sağ seçin (...) ve klasör adının yanındaki Yeni Kısayol'a tıklayın

    Screenshot of new shortcut link.

  4. Dış Kaynaklar ADLS 2. > Nesil'i seçin

  5. Depolama hesabında kısayol adı, depolama hesabı uç noktası, veri klasörünüzün konumunu sonlandırma

    Screenshot of new shortcut dialog.

  6. Oluştur’u seçin

Not Defteri'nde başvuruda bulunan verilere erişme

  1. Mevcut not defterini açma veya yeni not defteri oluşturma
  2. Göl evinizi not defterine sabitleyin
  3. Kısayol klasöründe verilerinize göz atın
  4. Yapılandırılmış veri içeren bir dosya seçin ve kodun oluşturulmasını sağlamak için dosyayı not defterine sürükleyin
  5. Dosya içeriğini almak için kod yürütme
  6. Veri analizi için kod ekleme