Hacer referencia a datos en lakehouse para proyectos de Ciencia de datos
En este inicio rápido se explica cómo hacer referencia a los datos almacenados en una cuenta de ADLS externa y usarlos en los proyectos de ciencia de datos. Después de completar este inicio rápido, tendrá un acceso directo al almacenamiento de ADLS en lakehouse y un cuaderno con código de Spark que accede a los datos externos.
Importante
Microsoft Fabric está actualmente en versión preliminar. Esta información está relacionada con un producto en versión preliminar que puede modificarse considerablemente antes de su lanzamiento. Microsoft no ofrece ninguna garantía, expresa o implícita, con respecto a la información que se ofrece aquí.
Preparación de datos para acceso directo
En Azure, cree una cuenta de ADLS Gen2.
Habilitación de espacios de nombres jerárquicos
Creación de carpetas para los datos
Carga de datos
Incorporación de la identidad de usuario al rol BlobStorageContributor
Obtención del punto de conexión de la cuenta de almacenamiento
Crear un acceso directo
Abra su instancia de Lakehouse para llegar al Explorador de Lakehouse.
En archivos, cree una carpeta en la que haga referencia a los datos.
Seleccione (...) con el botón derecho y seleccione Nuevo acceso directo junto al nombre de la carpeta.
Seleccione Orígenes > externos ADLS Gen2.
Proporcione el nombre del acceso directo, el punto de conexión de la cuenta de almacenamiento y finalice la ubicación de la carpeta de datos en la cuenta de almacenamiento.
Haga clic en Crear
Acceso a datos a los que se hace referencia en Notebook
- Abrir un cuaderno existente o crear nuevo cuaderno
- Anclar su instancia de Lakehouse al cuaderno
- Examinar los datos en la carpeta de acceso directo
- Seleccione un archivo con datos estructurados y arrástrelo al cuaderno para obtener el código generado.
- Ejecutar código para obtener contenido de archivo
- Adición de código para el análisis de datos