Compartir a través de


Cómo usar los cuadernos de Microsoft Fabric

El cuaderno de Microsoft Fabric es un elemento de código principal para desarrollar trabajos de Apache Spark y experimentos de aprendizaje automático. Se trata de una superficie interactiva basada en la web que usan los científicos de datos e ingenieros de datos para escribir código que se beneficie de visualizaciones enriquecidas y texto de Markdown. Los ingenieros de datos escriben código para la ingesta, preparación y transformación de datos. Los científicos de datos también usan cuadernos para crear soluciones de aprendizaje automático, incluyendo la creación de experimentos y modelos, el seguimiento de modelos y la implementación.

Con un cuaderno de Fabric puede hacer lo siguiente:

  • Comienza sin esfuerzo de configuración.
  • Explorar y procesar fácilmente los datos con una experiencia intuitiva de poco código.
  • Mantener los datos protegidos con las características de seguridad empresarial integradas.
  • Analizar datos en formatos sin procesar (CSV, TXT, JSON, etc.) y formatos de archivos procesados (parquet, Delta Lake, etc.) mediante las eficaces funcionalidades de Spark.
  • Ser productivo con funcionalidades de creación mejoradas y visualización de datos integrada.

En este artículo se describe cómo usar cuadernos en experiencias de ciencia de datos e ingeniería de datos.

Contexto de seguridad del cuaderno en ejecución

La ejecución de un cuaderno se puede desencadenar de tres maneras diferentes en Fabric, con plena flexibilidad para cumplir diferentes escenarios:

  • Ejecución interactiva: el usuario desencadena manualmente la ejecución a través de las distintas entradas de la experiencia de usuario o llamando a la API de REST. La ejecución se llevaría a cabo en el contexto de seguridad del usuario actual.
  • Ejecución como actividad de canalización: la ejecución se desencadena desde la canalización de Data Factory de Microsoft Fabric. Puede encontrar los pasos detallados en la Actividad del cuaderno. La ejecución se llevaría a cabo en el contexto de seguridad del propietario de la canalización.
  • Planificador: la ejecución se desencadena desde un plan del planificador. La ejecución se llevaría a cabo en el contexto de seguridad del usuario que configura o actualiza el plan del programador.

La flexibilidad de estas opciones de ejecución con un contexto de seguridad diferente le permite cumplir distintos escenarios y requisitos, pero también requiere que tenga en cuenta el contexto de seguridad al diseñar y desarrollar el cuaderno; de lo contrario, puede provocar un comportamiento inesperado e incluso algunos problemas de seguridad.

La primera vez que se crea un cuaderno, se muestra un mensaje de advertencia para recordarle el riesgo de ejecutar el código sin revisarlo.

Captura de pantalla que muestra la advertencia de ejecución del cuaderno.

Estos son algunos procedimientos recomendados para ayudarle a evitar problemas de seguridad:

  • Antes de ejecutar manualmente el cuaderno, abra la configuración del cuaderno y compruebe la sección Detalle en el panel Acerca de la actualización de modificación para asegurarse de que el cambio más reciente es correcto.
  • Antes de agregar una actividad de cuaderno a una canalización, abra la configuración del cuaderno y active la sección Detalles en el panel Acerca de la actualización de modificación, asegúrese de que está bien con el cambio más reciente. Si no está seguro del cambio más reciente, es mejor que abra el cuaderno para revisar el cambio antes de añadirlo a la canalización.
  • Antes de actualizar la programación, abra la configuración del cuaderno y revise la sección de Detalles en el panel Acerca de para verificar la actualización de modificación. Asegúrese de que está de acuerdo con el cambio más reciente. Si no está seguro del cambio más reciente, es mejor que abra el cuaderno para revisar el cambio antes de actualizar el plan del programador.
  • Separe el área de trabajo en fases diferentes (desarrollo, prueba, producción) y controle el acceso a las otras fases para evitar el problema de seguridad. Agregue solo el usuario de confianza en la fase de producción.

Creación de cuadernos

Puede crear un cuaderno o importar uno existente.

Crea un nuevo cuaderno

Como en otros procesos de creación de elementos de Fabric estándar, puede crear fácilmente un cuaderno desde la página principal de Ingeniería de datos de Fabric, la opción Nuevo del área de trabajo o en Crear centro.

Importar los cuadernos existentes

Puedes importar uno o varios cuadernos existentes desde el equipo local mediante la entrada de la barra de herramientas del área de trabajo. Los cuadernos de Fabric reconocen los archivos .ipynb estándar de Jupyter Notebook y los archivos de origen, como .py, .scala y .sql, y crean nuevos elementos de cuaderno en consecuencia.

Captura de pantalla que muestra dónde encontrar las opciones de los cuadernos en el menú Crear.

Exportación de un cuaderno

Puede exportar el cuaderno a otros formatos estándar. El cuaderno de Synapse se puede exportar a:

  • El archivo de cuaderno estándar (.ipynb), que se usa normalmente para cuadernos de Jupyter Notebook.
  • Un archivo HTML (.html), que se puede abrir directamente desde el explorador.
  • Un archivo de Python (.py).
  • Un archivo de Latex (.tex).

Captura de pantalla que muestra dónde exportar un cuaderno.

Guardar un cuaderno

En Fabric, un cuaderno se guardará automáticamente de manera predeterminada después de abrirlo y de editarlo; no hay que preocuparse por perder los cambios del código. También puede usar Guardar una copia para clonar en otra copia en el área de trabajo actual o en otra área de trabajo.

Captura de pantalla que muestra dónde guardar una copia.

Si prefiere guardar manualmente un cuaderno, puede cambiar a la opción de guardado Manual para tener una rama local del elemento del cuaderno y, a continuación, usar Guardar o CTRL+s para guardar los cambios.

Captura de pantalla que muestra dónde cambiar el guardado manual.

También puede cambiar al modo de guardado manual seleccionando Editar ->Opciones de guardado ->Manual. Para activar una rama local de tu bloc de notas y guardarla manualmente, selecciona Guardar o usa el atajo de teclado Ctrl+s.

Conectar lakehouses y cuadernos

Los cuadernos de Fabric ahora admiten interacciones cercanas con los almacenes de lago; puede agregar fácilmente un almacén de lago nuevo o existente desde el Explorador del almacén de lago.

Puede ir a diferentes almacenes de lago en el Explorador del almacén de lago y anclar un almacén de lago para establecerlo como predeterminado. A continuación, el almacén predeterminado se monta en el directorio de trabajo del entorno de ejecución y puede leer o escribir en el almacén de lago predeterminado mediante una ruta de acceso local.

Recorte de pantalla que muestra dónde anclar un Lakehouse predeterminado.

Nota:

Debe reiniciar la sesión después de anclar un nuevo almacén de lago o cambiar el nombre del almacén de lago predeterminado.

Adición o eliminación de una casa del lago

Al seleccionar el icono X situado junto a un nombre del almacén de lago de datos, se quita de la pestaña del cuaderno, pero el elemento del almacén de lago de datos sigue existiendo en el área de trabajo.

Seleccione Agregar Lakehouse para añadir más lakehouses al cuaderno, ya sea incorporando uno existente o creando uno nuevo.

Explorar un archivo del almacén de lago de datos

La subcarpeta y los archivos de la sección Tablas y Archivos de la vista Lake aparecen en un área de contenido entre la lista de Lakehouse y el contenido del cuaderno. Seleccione diferentes carpetas de la sección Tablas y Archivos para actualizar el área de contenido.

Operaciones de carpeta y de archivo

Si selecciona un archivo (.csv,.parquet,.txt,.jpg,.png, etc.) con un clic con el botón derecho del mouse, puede usar spark o Pandas API para cargar los datos. Se genera una nueva celda de código y se inserta debajo de la celda que tiene el foco.

Puede copiar fácilmente una ruta de acceso con un formato diferente al del archivo o carpeta que se ha seleccionado y usar la ruta de acceso correspondiente en el código.

Captura de pantalla que muestra el menú contextual de archivos en Lakehouse.

Recursos de notebooks

El explorador de recursos de los cuadernos proporciona un sistema de archivos similar a Unix para ayudar a administrar las carpetas y los archivos. Ofrece un espacio de sistema de archivos que se puede escribir, donde puede almacenar archivos de tamaño pequeño, como módulos de código, modelos semánticos e imágenes. Puede acceder fácilmente a ellos con código en el cuaderno de la misma manera que si estuviera trabajando con el sistema de archivos local.

GIF animado de recursos de bloc de notas.

Nota:

  • Los almacenamientos de recursos máximos para carpetas integradas y carpetas de entorno son de 500 MB, con un tamaño de archivo único de hasta 100 MB. Ambos permiten hasta 100 instancias de archivo o carpeta en total.
  • Si usa notebookutils.notebook.run(), utilice el comando notebookutils.nbResPath para acceder al recurso del cuaderno de destino. La ruta de acceso relativa builtin/ siempre apuntará a la carpeta integrada del cuaderno raíz.

Carpeta de recursos integrados

La carpeta de recursos integrados es una carpeta definida por el sistema única para cada cuaderno. Se recomienda usar la carpeta de recursos integrada para almacenar los datos usados en el cuaderno actual. Estas son las capacidades clave de los recursos del notebook.

  • Puede usar operaciones comunes como crear, eliminar, cargar, descargar, arrastrar y colocar, cambiar el nombre, duplicar y buscar a través de la interfaz de usuario.
  • Puede usar rutas de acceso relativas como builtin/YourData.txt para explorar de manera rápida. El método notebookutils.nbResPath le ayuda a componer la ruta de acceso completa.
  • Puede mover fácilmente los datos validados a un almacén de lago mediante la opción Escribir en almacén de lago de datos. Fabric inserta fragmentos de código enriquecidos para tipos de archivo comunes que le ayudarán a empezar a trabajar rápidamente.
  • Estos recursos también están disponibles para usarse en el caso de Ejecución del cuaderno de referencia mediante el caso notebookutils.notebook.run().

Carpeta de recursos del entorno

La Carpeta de Recursos del Entorno es un repositorio compartido diseñado para simplificar la colaboración en varios cuadernos.

  • Puedes encontrar la pestaña Recursos dentro del entorno y tener las operaciones completas para administrar los archivos de recursos aquí. Estos archivos se pueden compartir entre varios cuadernos una vez que el cuaderno está conectado al entorno actual.

    Captura de pantalla que muestra dónde administrar recursos en el entorno.

  • En la página Cuaderno, puedes encontrar fácilmente una segunda carpeta raíz en Recursos heredados del entorno conectado.

    Captura de pantalla que muestra dónde abrir la carpeta de recursos del entorno.

  • También puede realizar acciones en los archivos o carpetas de la misma manera que lo hace con la carpeta de Recursos integrados.

  • La ruta de acceso del recurso del entorno se encuentra montada automáticamente en el clúster de cuadernos. Puede usar la ruta de acceso relativa /env para acceder a los recursos del entorno.

Nota:

La lectura y escritura con una ruta de acceso relativa no funciona en una Sesión de simultaneidad alta.

Editor de archivos

El editor de archivos te permite ver y editar archivos directamente dentro de la carpeta de recursos del cuaderno y la carpeta de recursos del entorno en el cuaderno. Los tipos de archivo admitidos incluyen CSV, TXT, HTML, YML, PY, SQL, entre otros. Con el editor de archivos, puedes acceder y modificar archivos fácilmente en el cuaderno, admite el resaltado de palabras clave y proporciona un servicio de lenguaje necesario al abrir y editar archivos de código como .py y .sql.

  • Puedes acceder a esta característica mediante la opción "Ver y editar" en el menú Archivo. Hacer doble clic en el archivo es una manera más rápida.

    Captura de pantalla que muestra dónde ver y editar archivos.

  • El cambio de contenido en el editor de archivos debe guardarse manualmente haciendo clic en el botón Guardar o el método abreviado de teclado: Ctrl+S, el editor de archivos no admite el guardado automático.

  • El modo notebook también afecta al editor de archivos. Solo puedes ver los archivos, pero no puedes editarlos si estás en el modo de cuaderno sin el permiso de edición.

Nota:

Estas son algunas limitaciones para el editor de archivos.

  • El límite en el tamaño de archivo es de 1 MB.
  • Estos tipos de archivo no son compatibles con la vista y la edición: .xlsx y .parquet.

Colaborar en un cuaderno

El cuaderno de Fabric es un elemento de colaboración que admite la edición por parte de varios usuarios en el mismo cuaderno.

Al abrir un bloc de notas, se entra en el modo de edición conjunta de forma predeterminada, y cada modificación del bloc de notas se guarda automáticamente. Si tus compañeros abren el mismo cuaderno al mismo tiempo, verás su perfil, el resultado de ejecución, el indicador del cursor, el indicador de selección y el rastreo de edición. Mediante las características de colaboración, puede realizar fácilmente la programación en par, el debugging remoto y las situaciones de tutoría.

Captura de pantalla que muestra una celda de código que está editando otro usuario.

Uso compartido de un cuaderno

Compartir un cuaderno es una manera cómoda de colaborar con los miembros del equipo. Los roles de área de trabajo autorizados pueden ver o editar/ejecutar cuadernos de forma predeterminada. Puede compartir un cuaderno con los permisos especificados concedidos.

  1. Seleccione Compartir en la barra de herramientas del cuaderno.

    Captura de pantalla que muestra dónde seleccionar Compartir.

  2. Seleccione la categoría correspondiente de personas que pueden ver este cuaderno. Puede elegir los permisos Compartir, Editar o Ejecutar para los destinatarios.

    Captura de pantalla que muestra dónde seleccionar los permisos.

  3. Después de seleccionar Aplicar, puede enviar el cuaderno directamente o copiar el vínculo para otros usuarios. A continuación, los destinatarios pueden abrir el cuaderno con la vista correspondiente concedida por su nivel de permisos.

    Captura de pantalla que muestra dónde crear y enviar un vínculo.

  4. Para administrar aún más los permisos del cuaderno, seleccione Lista de elementos del área de trabajo>Más opciones y, a continuación, seleccione Administrar permisos. Desde esa pantalla, puede actualizar el acceso y los permisos existentes del cuaderno.

    Captura de pantalla que muestra dónde administrar los permisos en el área de trabajo.

Comentar una celda de código

La creación de comentarios es otra característica útil en escenarios de colaboración. Actualmente, Fabric admite la adición de comentarios de nivel de celda.

  1. Seleccione el botón Comentarios de la barra de herramientas del cuaderno o el indicador de comentario de celda para abrir el panel Comentarios.

    Captura de pantalla que muestra dónde seleccionar Comentario.

  2. Seleccione el código en la celda de código, seleccione Nuevo en el panel Comentarios, agregue los comentarios y, a continuación, seleccione Publicar comentario para guardarlo.

    Captura de pantalla que muestra dónde seleccionar Nuevo.

  3. Si las necesita, busque las opciones Editar comentario, Resolver conversación y Eliminar conversación; para ello, seleccione la opción Más situada junto al comentario.

Etiquetar a otros en un comentario

"Etiquetado" hace referencia a mencionar y notificar a un usuario en un subproceso de comentario, lo que mejora la colaboración de manera eficiente en los aspectos específicos.

  1. Seleccione una sección de código en una celda y cree un nuevo hilo de comentarios.

  2. Introduzca el nombre de usuario y elija el correcto en la lista de sugerencias si desea mencionar a alguien para obtener información sobre una determinada sección.

  3. Comparta sus conclusiones y publíquelas.

  4. Se desencadena una notificación por correo electrónico y el usuario hace clic en el vínculo Abrir comentarios para localizar rápidamente esta celda.

  5. Además, autorice y configure los permisos para los usuarios al etiquetar a alguien que no tiene acceso, lo que garantiza que los recursos de código estén bien administrados.

GIF animado de etiquetar a otros en un comentario.

Nota:

Para un elemento de comentario, el usuario etiquetado ya no recibirá una notificación por correo electrónico si actualiza el comentario en un plazo de una hora. Pero envía una notificación por correo electrónico al nuevo usuario etiquetado.

Historial de versiones

Importante

Esta característica se encuentra en versión preliminar.

El historial de versiones le permite crear fácilmente versiones de los cambios en el cuaderno activo. Admite el seguimiento del historial y la administración de cuadernos con funcionalidades sólidas de control de versiones integradas, lo que resulta especialmente útil para el trabajo colaborativo con varios colaboradores en el mismo cuaderno.

  1. Acceda al historial de versiones desde la barra de herramientas global del cuaderno.

    Captura de pantalla que muestra el acceso al historial.

  2. Notebook admite dos maneras de crear puntos de control.

    • Punto de control manual: puede crear manualmente una nueva versión para registrar los hitos de desarrollo, lo que proporciona flexibilidad para administrar las versiones de los cuadernos.

      Captura de pantalla que muestra cómo crear una nueva versión.

    • Punto de control del sistema: estos puntos de control se crean automáticamente cada 5 minutos en función del intervalo de tiempo de edición por el sistema de Cuaderno, lo que garantiza que el trabajo se guarda y tiene versiones coherentes. Puede encontrar los registros de modificación de todos los colaboradores en la cronología de puntos de control del sistema. Captura de pantalla que muestra la lista de puntos de control de expansión.

  3. Puede hacer clic en un punto de control para abrir la vista de diferencias, resalta las diferencias de contenido entre el punto de control seleccionado y la versión activa actual, incluidas las diferencias de contenido de celda, salida de celda y metadatos. La versión de este punto de control se puede administrar individualmente en el menú "más opciones ".

    Captura de pantalla que muestra la diferencia de vista.

  4. Puede administrar la versión desde el menú desplegable del punto de control, si desea mantener una versión perviosa, haga clic en Restaurar desde el punto de control y sobrescriba el cuaderno actual o use guardar como copia para clonarlo en un nuevo cuaderno.

    Captura de pantalla que muestra más opciones con el punto de control.

Nota:

  • Limitación conocida: Después de hacer clic en el botón Restaurar y navegar hacia Atrás al cuaderno, el cuaderno no se recuperará inmediatamente del punto de control. Una barra de mensajes le pide que vea los cambios. Debe hacer clic en el botón Ver cambios y seleccionar mantener la versión guardada para finalizar la restauración. Captura de pantalla en la que se muestran los cambios de vista después de la restauración.
  • Los puntos de control del sistema expirarán después de 1 año.

Conmutador del modo notebook

Los cuadernos de Fabric admiten cuatro modos que se pueden cambiar fácilmente: Modo de desarrollo , Modo de solo ejecución , Modo de edición y Modo de vista . Cada modo se asigna a una combinación de permisos específica. Al compartir el cuaderno con otros miembros del equipo, puede conceder permisos adecuados a los destinatarios. Pueden ver el mejor modo de cuaderno disponible según su permiso y pueden cambiar entre el modo al que tienen permiso.

Captura de pantalla en la que se muestra dónde cambiar entre los modos.

  • Modo de Desarrollo: lectura, ejecución, permiso de escritura necesario.
  • Modo de Solo ejecución: lectura, ejecución y permiso necesario.
  • Modo de Edición: se necesita permiso de lectura y escritura.
  • Modo de Vista: se necesita permiso de lectura.