Hacer referencia a datos en lakehouse para proyectos de Ciencia de datos

En este inicio rápido se explica cómo hacer referencia a los datos almacenados en una cuenta de ADLS externa y usarlos en los proyectos de ciencia de datos. Después de completar este inicio rápido, tendrá un acceso directo al almacenamiento de ADLS en lakehouse y un cuaderno con código de Spark que accede a los datos externos.

Importante

Microsoft Fabric está actualmente en versión preliminar. Esta información está relacionada con un producto en versión preliminar que puede modificarse considerablemente antes de su lanzamiento. Microsoft no ofrece ninguna garantía, expresa o implícita, con respecto a la información que se ofrece aquí.

Preparación de datos para acceso directo

  1. En Azure, cree una cuenta de ADLS Gen2.

  2. Habilitación de espacios de nombres jerárquicos

    Captura de pantalla de los espacios de nombres jerárquicos en la cuenta de almacenamiento.

  3. Creación de carpetas para los datos

  4. Carga de datos

  5. Incorporación de la identidad de usuario al rol BlobStorageContributor

  6. Obtención del punto de conexión de la cuenta de almacenamiento

Crear un acceso directo

  1. Abra su instancia de Lakehouse para llegar al Explorador de Lakehouse.

  2. En archivos, cree una carpeta en la que haga referencia a los datos.

  3. Seleccione (...) con el botón derecho y seleccione Nuevo acceso directo junto al nombre de la carpeta.

    Captura de pantalla del nuevo vínculo de acceso directo.

  4. Seleccione Orígenes > externos ADLS Gen2.

  5. Proporcione el nombre del acceso directo, el punto de conexión de la cuenta de almacenamiento y finalice la ubicación de la carpeta de datos en la cuenta de almacenamiento.

    Captura de pantalla del nuevo cuadro de diálogo de acceso directo.

  6. Haga clic en Crear

Acceso a datos a los que se hace referencia en Notebook

  1. Abrir un cuaderno existente o crear nuevo cuaderno
  2. Anclar su instancia de Lakehouse al cuaderno
  3. Examinar los datos en la carpeta de acceso directo
  4. Seleccione un archivo con datos estructurados y arrástrelo al cuaderno para obtener el código generado.
  5. Ejecutar código para obtener contenido de archivo
  6. Adición de código para el análisis de datos

Pasos siguientes