Preparación del sistema para el tutorial de ciencia de datos

Antes de comenzar los módulos del tutorial de ciencia de datos de un extremo a otro, obtenga información sobre los requisitos previos, el conjunto de datos de ejemplo, qué cuadernos importar y cómo asociar un lakehouse a esos cuadernos.

Importante

Microsoft Fabric está actualmente en versión preliminar. Esta información está relacionada con un producto en versión preliminar que puede modificarse considerablemente antes de su lanzamiento. Microsoft no ofrece ninguna garantía, expresa o implícita, con respecto a la información que se ofrece aquí.

Requisitos previos

  1. Power BI Premium suscripción. Para más información, consulte Adquisición de Power BI Premium.

  2. Un área de trabajo de Power BI con capacidad Premium asignada.

  3. Un lago de Microsoft Fabric existente. Cree una instancia de Lakehouse siguiendo los pasos descritos en Creación de una instancia de Lakehouse en Microsoft Fabric.

Conjunto de datos de ejemplo

En este tutorial, usamos el conjunto de datos amarillo NYC Taxi y Limousine, que es un conjunto de datos a gran escala que contiene viajes de taxi en la ciudad de 2009 a 2018. El conjunto de datos incluye varias características, como fechas de recogida y entrega, horas, ubicaciones, tarifas, tipos de pago y recuentos de pasajeros. El conjunto de datos se puede usar con diversos fines, como analizar patrones de tráfico, tendencias de demanda, estrategias de precios y comportamiento de los controladores.

Importación de cuadernos de tutoriales

Usamos el elemento de cuaderno en la experiencia de Ciencia de datos para demostrar diversas funcionalidades de Fabric. Los cuadernos están disponibles como archivos de Jupyter Notebook que se pueden importar en el área de trabajo habilitada para Fabric.

  1. Descargue los archivos notebooks(.ipynb) de este tutorial desde la carpeta primaria Ciencia de datos Código fuente del tutorial.

  2. Cambie a la experiencia de Ciencia de datos con el icono del conmutador de experiencia en la esquina izquierda de la página principal.

    Captura de pantalla del menú del conmutador de experiencia, en la que se muestra dónde seleccionar Ciencia de datos.

  3. En la página principal de la experiencia de ciencia de datos, seleccione Importar cuadernos y cargue los archivos de cuaderno para los módulos 1 a 5 que descargó en el paso 1.

    Captura de pantalla que muestra dónde seleccionar Importar cuaderno en la página principal de Ciencia de datos.

    Captura de pantalla del cuadro de diálogo Estado de importación, en la que se muestra dónde seleccionar Cargar.

  4. Una vez importados los cuadernos, seleccione Ir al área de trabajo en el cuadro de diálogo importar.

    Captura de pantalla del cuadro de diálogo de importación correcta, en la que se muestra dónde seleccionar Ir al área de trabajo.

  5. Los cuadernos importados ya están disponibles en el área de trabajo para su uso.

    Captura de pantalla que muestra una lista de cuadernos disponibles en un área de trabajo.

Adjuntar una casa de lago a los cuadernos

Para demostrar las características de Fabric Lakehouse, los cinco primeros módulos de este tutorial requieren adjuntar un lago predeterminado a los cuadernos. En los pasos siguientes se muestra cómo agregar una instancia de Lakehouse existente a un cuaderno en un área de trabajo habilitada para Fabric.

  1. Abra el cuaderno del primer módulo 01 Ingesta de datos en Lakehouse mediante Apache Spark en el área de trabajo.

  2. Seleccione Agregar lakehouse en el panel izquierdo y seleccione Existente lakehouse para abrir el cuadro de diálogo Centro de datos .

  3. Seleccione el área de trabajo y la instancia de Lakehouse que va a usar con estos tutoriales y seleccione Agregar.

  4. Una vez que se agrega un lakehouse, es visible en el panel lakehouse de la interfaz de usuario del cuaderno donde se pueden ver las tablas y los archivos almacenados en lakehouse.

Nota:

Antes de ejecutar todos los cuadernos, debe realizar estos pasos para cada cuaderno de este tutorial.

Diagrama de los pasos del proceso para adjuntar una instancia de LakeHouse a un cuaderno.

Pasos siguientes