Compartir vía


Cómo usar los cuadernos de Microsoft Fabric

El cuaderno de Microsoft Fabric es un elemento de código principal para desarrollar trabajos de Apache Spark y experimentos de aprendizaje automático. Se trata de una superficie interactiva basada en la web que usan los científicos de datos e ingenieros de datos para escribir código que se beneficie de visualizaciones enriquecidas y texto de Markdown. Los ingenieros de datos escriben código para la ingesta, preparación y transformación de datos. Los científicos de datos también usan cuadernos para crear soluciones de aprendizaje automático, incluyendo la creación de experimentos y modelos, el seguimiento de modelos y la implementación.

Con un cuaderno de Fabric puede hacer lo siguiente:

  • Empezar a trabajar sin esfuerzo alguno de configuración.
  • Explorar y procesar fácilmente los datos con una experiencia intuitiva de poco código.
  • Mantener los datos protegidos con las características de seguridad empresarial integradas.
  • Analizar datos en formatos sin procesar (CSV, TXT, JSON, etc.) y formatos de archivos procesados (parquet, Delta Lake, etc.) mediante las eficaces funcionalidades de Spark.
  • Ser productivo con funcionalidades de creación mejoradas y visualización de datos integrada.

En este artículo se describe cómo usar cuadernos en experiencias de ciencia de datos e ingeniería de datos.

Contexto de seguridad del cuaderno en ejecución

La ejecución de un cuaderno se puede desencadenar de tres maneras diferentes en Fabric, con plena flexibilidad para cumplir diferentes escenarios:

  • Ejecución interactiva: el usuario desencadena manualmente la ejecución a través de las distintas entradas de la experiencia de usuario o llamando a la API de REST. La ejecución se llevaría a cabo en el contexto de seguridad del usuario actual.
  • Ejecución como actividad de canalización: la ejecución se desencadena desde la canalización de Data Factory de Microsoft Fabric. Puede encontrar los pasos detallados en la Actividad del cuaderno. La ejecución se llevaría a cabo en el contexto de seguridad del propietario de la canalización.
  • Programador: la ejecución se desencadena desde un plan de programador. La ejecución se llevaría a cabo en el contexto de seguridad del usuario que configura o actualiza el plan del programador.

La flexibilidad de estas opciones de ejecución con un contexto de seguridad diferente le permite cumplir distintos escenarios y requisitos, pero también requiere que tenga en cuenta el contexto de seguridad al diseñar y desarrollar el cuaderno; de lo contrario, puede provocar un comportamiento inesperado e incluso algunos problemas de seguridad.

La primera vez que se crea un cuaderno, se mostrará un mensaje de advertencia para recordarle el riesgo de ejecutar el código sin revisarlo.

Captura de pantalla que muestra la advertencia de ejecución del cuaderno.

Estos son algunos procedimientos recomendados para ayudarle a evitar problemas de seguridad:

  • Antes de ejecutar manualmente el cuaderno, abra la configuración del cuaderno y compruebe la sección Detalle en el panel Acerca de la actualización de modificación para asegurarse de que el cambio más reciente es correcto.
  • Antes de añadir una actividad de cuaderno a una canalización, abra la configuración del cuaderno y compruebe la sección Detalle en el panel Acerca de la actualización de modificación para asegurarse de que el cambio más reciente es correcto. Si no está seguro del cambio más reciente, es mejor que abra el cuaderno para revisar el cambio antes de añadirlo a la canalización.
  • Antes de actualizar el plan del programador, abra la configuración del cuaderno y compruebe la sección Detalle en el panel Acerca de la actualización de modificación para asegurarse de que el cambio más reciente es correcto. Si no está seguro del cambio más reciente, es mejor que abra el cuaderno para revisar el cambio antes de actualizar el plan del programador.
  • Separe el área de trabajo en fases diferentes (desarrollo, prueba, producción) y controle el acceso a las otras fases para evitar el problema de seguridad. Añada solo el usuario en quien confíe a la fase de producción.

Creación de cuadernos

Puede crear un cuaderno o importar uno existente.

Creación un nuevo cuaderno

Como en otros procesos de creación de elementos de Fabric estándar, puede crear fácilmente un cuaderno desde la página principal de Ingeniería de datos de Fabric, la opción Nuevo del área de trabajo o en Crear centro.

Importar los cuaderno existentes

Puede importar uno o varios cuadernos existentes desde el equipo local a un área de trabajo de Fabric desde la página principal de Ingeniería de datos o Ciencia de datos. Los cuadernos de Fabric reconocen los archivos estándar .ipynb de Jupyter Notebook y los archivos de código fuente como .py, .scala y .sql, y crear respectivamente nuevos elementos de cuaderno.

Captura de pantalla que muestra dónde encontrar las opciones de los cuadernos en el menú Crear.

Exportación de un cuaderno

Puede exportar el cuaderno a otros formatos estándar. Un cuaderno de Synapse se puede exportar a:

  • El archivo de cuaderno estándar (.ipynb), que se usa normalmente para cuadernos de Jupyter Notebook.
  • Un archivo HTML (.html), que se puede abrir directamente desde el explorador.
  • Un archivo de Python (.py).
  • Un archivo de Latex (.tex).

Captura de pantalla que muestra dónde exportar un cuaderno.

Guardado de un cuaderno

En Fabric, un cuaderno se guardará automáticamente de manera predeterminada después de abrirlo y de editarlo; no hay que preocuparse por perder los cambios del código. También puede usar Guardar una copia para clonar en otra copia en el área de trabajo actual o en otra área de trabajo.

Captura de pantalla que muestra dónde guardar una copia.

Si prefiere guardar manualmente un cuaderno, puede cambiar a la opción de guardado Manual para tener una rama local del elemento del cuaderno y, a continuación, usar Guardar o CTRL+s para guardar los cambios.

Captura de pantalla que muestra dónde cambiar el guardado manual.

También puede cambiar al modo de guardado manual seleccionando Editar ->Opciones de guardado ->Manual. Para activar una rama local del cuaderno, guárdelo manualmente seleccionando Guardar o use el método abreviado de teclado Ctrl+s.

Conectar lakehouses y cuadernos

Los cuadernos de Fabric ahora admiten interacciones cercanas con los almacenes de lago; puede agregar fácilmente un almacén de lago nuevo o existente desde el Explorador del almacén de lago.

Puede ir a diferentes almacenes de lago en el Explorador del almacén de lago y anclar un almacén de lago para establecerlo como predeterminado. A continuación, el almacén predeterminado se monta en el directorio de trabajo del entorno de ejecución y puede leer o escribir en el almacén de lago predeterminado mediante una ruta de acceso local.

Captura de pantalla que muestra dónde anclar un Lakehouse predeterminado.

Nota:

Debe reiniciar la sesión después de anclar un nuevo almacén de lago o cambiar el nombre del almacén de lago predeterminado.

Agregar o eliminar una instancia de Lakehouse

Al seleccionar el icono X situado junto a un nombre del Lakehouse, se quita de la pestaña del cuaderno, pero el elemento Lakehouse sigue existiendo en el área de trabajo.

Seleccione Agregar Lakehouse para agregar más al cuaderno, ya sea agregando uno existente o creando uno nuevo.

Explorar un archivo Lakehouse

La subcarpeta y los archivos de la sección Tablas y Archivos de la vista Lake aparecen en un área de contenido entre la lista de Lakehouse y el contenido del cuaderno. Seleccione diferentes carpetas de la sección Tablas y Archivos para actualizar el área de contenido.

Operaciones de carpeta y de archivo

Si selecciona un archivo (.csv, .parquet, .txt, .jpg, .png, etc.) con un clic derecho, puede usar la API de Spark y la de Pandas para cargar los datos. Se genera una nueva celda de código y se inserta debajo de la celda que tiene el foco.

Puede copiar fácilmente una ruta de acceso con un formato diferente al del archivo o carpeta que se ha seleccionado y usar la ruta de acceso correspondiente en el código.

Captura de pantalla que muestra el menú contextual de archivos en Lakehouse.

Recursos de los cuadernos

El explorador de recursos de los cuadernos proporciona un sistema de archivos similar a Unix para ayudar a administrar las carpetas y los archivos. Ofrece un espacio de sistema de archivos que se puede escribir, donde puede almacenar archivos de tamaño pequeño, como módulos de código, modelos semánticos e imágenes. Puede acceder fácilmente a ellos con código en el cuaderno de la misma manera que si estuviera trabajando con el sistema de archivos local.

GIF animado de los recursos de los cuadernos.

Esta carpeta integrada es una carpeta predefinida del sistema para cada instancia del cuaderno. Conserva un almacenamiento de hasta 500 MB para almacenar las dependencias del cuaderno actual. Estas son las principales funcionalidades de los recursos del cuaderno:

  • Puede usar operaciones comunes como crear, eliminar, cargar, descargar, arrastrar y colocar, cambiar el nombre, duplicar y buscar a través de la interfaz de usuario.
  • Puede usar rutas de acceso relativas como builtin/YourData.txt para explorar de manera rápida. El método de mssparkutils.nbResPath le ayuda a componer la ruta de acceso completa.
  • Puede mover fácilmente los datos validados a un almacén de lago mediante la opción Escribir en almacén de lago. Fabric tiene fragmentos de código enriquecido insertados para los tipos de archivo comunes, que le ayudarán a empezar a trabajar rápidamente.
  • Estos recursos también están disponibles para usarse en el caso de ejecución del cuaderno de referencia mediante mssparkutils.notebook.run().

Nota:

  • Actualmente, Fabric admite la carga de determinados tipos de archivo mediante la interfaz de usuario, incluidos archivos .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg y .xlsx. Puede escribir en la carpeta integrada con tipos de archivo que no estén en la lista mediante código; sin embargo, el cuaderno de Fabric no admite la generación de fragmentos de código en tipos de archivo no admitidos.
  • Cada tamaño de archivo debe ser inferior a 50 MB y la carpeta integrada permite hasta 100 instancias de archivo o de carpeta en total.
  • Si usa mssparkutils.notebook.run(), utilice el comando mssparkutils.nbResPath para acceder al recurso del cuaderno de destino. La ruta de acceso relativa "builtin/" siempre apuntará a la carpeta integrada del cuaderno raíz.

Colaborar en un cuaderno

El cuaderno de Fabric es un elemento de colaboración que admite la edición por parte de varios usuarios en el mismo cuaderno.

Cuando abre un cuaderno, se entra al modo de edición conjunta de manera predeterminada y todas las ediciones del cuaderno se guardarán automáticamente. Si los compañeros abren el mismo cuaderno al mismo tiempo, verá su perfil, la salida de la ejecución, el indicador del cursor, el indicador de selección y el seguimiento de la edición. Mediante las características de colaboración, puede realizar fácilmente la programación en pareja, la depuración remota y los escenarios de tutoría.

Captura de pantalla que muestra una celda de código que está editando otro usuario.

Uso compartido de un cuaderno

Compartir un cuaderno es una manera cómoda de colaborar con los miembros del equipo. Los roles de área de trabajo autorizados pueden ver o editar/ejecutar cuadernos de forma predeterminada. Puede compartir un cuaderno con los permisos especificados concedidos.

  1. Seleccione Compartir en la barra de herramientas del cuaderno.

    Captura de pantalla que muestra dónde seleccionar Compartir.

  2. Seleccione la categoría correspondiente de personas que pueden ver este cuaderno. Puede elegir los permisos Compartir, Editar o Ejecutar para los destinatarios.

    Captura de pantalla que muestra dónde seleccionar los permisos.

  3. Después de seleccionar Aplicar, puede enviar el cuaderno directamente o copiar el vínculo para otros usuarios. A continuación, los destinatarios pueden abrir el cuaderno con la vista correspondiente concedida por su nivel de permisos.

    Captura de pantalla que muestra dónde crear y enviar un vínculo.

  4. Para administrar aún más los permisos del cuaderno, seleccione Lista de elementos del área de trabajo>Más opciones y, a continuación, seleccione Administrar permisos. Desde esa pantalla, puede actualizar el acceso y los permisos existentes del cuaderno.

    Captura de pantalla que muestra dónde administrar los permisos en el área de trabajo.

Comentar una celda de código

La creación de comentarios es otra característica útil en escenarios de colaboración. Actualmente, Fabric admite la adición de comentarios de nivel de celda.

  1. Seleccione el botón Comentarios de la barra de herramientas del cuaderno o el indicador de comentario de celda para abrir el panel Comentarios.

    Captura de pantalla que muestra dónde seleccionar Comentario.

  2. Seleccione el código en la celda de código, seleccione Nuevo en el panel Comentarios, agregue los comentarios y, a continuación, seleccione Publicar comentario para guardarlo.

    Captura de pantalla que muestra dónde seleccionar Nuevo.

  3. Si las necesita, busque las opciones Editar comentario, Resolver conversación y Eliminar conversación; para ello, seleccione la opción Más situada junto al comentario.

Etiquetado de otros usuarios en un comentario

"Etiquetado" hace referencia a mencionar y notificar a un usuario en un subproceso de comentario, lo que mejora la colaboración de forma eficaz en los detalles.

  1. Seleccione una sección de código en una celda y un nuevo subproceso de comentario.

  2. Introduzca el nombre de usuario y elija el correcto en la lista de sugerencias si desea mencionar a alguien para obtener información sobre una determinada sección.

  3. Comparta sus conclusiones y publíquelas.

  4. Se desencadenará una notificación por correo electrónico y el usuario hace clic en el vínculo Abrir comentarios para localizar rápidamente esta celda.

  5. Además, autorice y configure los permisos para los usuarios al etiquetar a alguien que no tiene acceso, lo que garantiza que los recursos de código estén bien administrados.

GIF animado de etiquetar a otros en un comentario.

Nota:

Para un elemento de comentario, el usuario etiquetado ya no recibirá una notificación por correo electrónico si actualiza el comentario en un plazo de una hora. Pero enviará una notificación por correo electrónico al nuevo usuario etiquetado.

Cambio del modo del cuaderno

Los cuadernos de Fabric admiten dos modos entre los que puede cambiar fácilmente: el modo de edición y el modo de visualización.

Captura de pantalla en la que se muestra dónde cambiar entre los modos.

  • Modo de edición: puede editar y ejecutar las celdas y colaborar con otros usuarios en el cuaderno.
  • Modo de visualización: solo puede ver el contenido de la celda, la salida y los comentarios del cuaderno. Todas las operaciones que realizan cambios en el cuaderno están deshabilitadas.