Sdílet prostřednictvím


Odkazování na data v lakehouse pro projekty Datová Věda

Tento rychlý start vysvětluje, jak odkazovat na data uložená v externím účtu ADLS a používat je v projektech datových věd. Po dokončení tohoto rychlého startu budete mít zástupce úložiště ADLS ve vašem lakehouse a poznámkovém bloku s kódem Sparku, který přistupuje k vašim externím datům.

Příprava dat na zástupce

  1. Vytvoření účtu ADLS Gen2 v Azure

  2. Povolení hierarchických oborů názvů

    Snímek obrazovky s hierarchickými obory názvů v účtu úložiště

  3. Vytváření složek pro vaše data

  4. Nahrání dat

  5. Přidání identity uživatele do role BlobStorageContributor

  6. Získání koncového bodu účtu úložiště

Vytvoření zástupce

  1. Otevřete lakehouse a přejděte do Průzkumníka Lakehouse.

  2. V části soubory vytvořte složku, ve které odkazujete na data.

  3. Vpravo vyberte (...) a vedle názvu složky vyberte Nový zástupce.

    Snímek obrazovky s novým odkazem na zástupce z Průzkumníka jezera

  4. Výběr externích zdrojů > ADLS Gen2

  5. Zadejte název zástupce, koncový bod účtu úložiště, ukončete umístění datové složky v účtu úložiště.

    Snímek obrazovky s novým dialogovým oknem zástupce, kde jsou zadány podrobnosti zástupce

  6. Výběr možnosti vytvoření

Přístup k odkazovaným datům v poznámkovém bloku

  1. Otevření existujícího nebo vytvoření nového poznámkového bloku
  2. Připnutí jezera do poznámkového bloku
  3. Procházení dat ve složce zástupce
  4. Vyberte soubor se strukturovanými daty a přetáhněte ho do poznámkového bloku, abyste získali vygenerovaný kód.
  5. Spuštění kódu pro získání obsahu souboru
  6. Přidání kódu pro analýzu dat