Compartir vía


Cómo usar los cuadernos de Microsoft Fabric

El cuaderno de Microsoft Fabric es un elemento de código principal para desarrollar trabajos de Apache Spark y experimentos de aprendizaje automático. Se trata de una superficie interactiva basada en la web que usan los científicos de datos e ingenieros de datos para escribir código que se beneficie de visualizaciones enriquecidas y texto de Markdown. Los ingenieros de datos escriben código para la ingesta, preparación y transformación de datos. Los científicos de datos también usan cuadernos para crear soluciones de aprendizaje automático, incluyendo la creación de experimentos y modelos, el seguimiento de modelos y la implementación.

Con un cuaderno de Fabric puede hacer lo siguiente:

  • Comienza sin esfuerzo de configuración.
  • Explorar y procesar fácilmente los datos con una experiencia intuitiva de poco código.
  • Mantener los datos protegidos con las características de seguridad empresarial integradas.
  • Analizar datos en formatos sin procesar (CSV, TXT, JSON, etc.) y formatos de archivos procesados (parquet, Delta Lake, etc.) mediante las eficaces funcionalidades de Spark.
  • Ser productivo con funcionalidades de creación mejoradas y visualización de datos integrada.

En este artículo se describe cómo usar cuadernos en experiencias de ciencia de datos e ingeniería de datos.

Contexto de seguridad del cuaderno en ejecución

La ejecución del cuaderno se puede desencadenar de tres maneras, cada una con un contexto de seguridad diferente:

  • Ejecución interactiva: se desencadena manualmente la ejecución a través de la interfaz de usuario o la API REST. El cuaderno de notas se ejecuta en el contexto de seguridad del usuario actual.
  • Ejecución como actividad de canalización: la ejecución se desencadena desde una canalización de Fabric Data Factory. Consulte Actividad del cuaderno para obtener más información. El cuaderno se ejecuta bajo la identidad del último usuario que modificó la canalización, no del propietario de la canalización ni del cuaderno. Esto significa que la última vez que editó la canalización determina el contexto de seguridad para el acceso a datos, las llamadas API y los permisos.
  • Programador: la ejecución se desencadena desde una ejecución programada. El cuaderno se ejecuta bajo la identidad del usuario que creó o actualizó el horario por última vez.

Estas opciones de ejecución proporcionan flexibilidad para diferentes escenarios, pero debe comprender qué identidad ejecuta el cuaderno. El contexto de seguridad afecta a los permisos de acceso a datos, la autorización de llamadas API y la disponibilidad de los recursos. Algunas APIs (como los puntos de conexión de T-SQL) no admiten entidades de servicio y requieren una entidad de seguridad de usuario.

La primera vez que se crea un cuaderno, se muestra un mensaje de advertencia para recordarle el riesgo de ejecutar el código sin revisarlo.

Captura de pantalla que muestra la advertencia de ejecución del cuaderno.

Siga estos procedimientos recomendados para evitar problemas de seguridad:

  • Antes de ejecutar manualmente un cuaderno: compruebe quién modificó el cuaderno por última vez y use el panel historial de versiones para revisar los cambios de contenido reales antes de ejecutar el código que no escribió.
  • Antes de agregar un cuaderno a una canalización: compruebe quién modificó por última vez la canalización, ya que el cuaderno se ejecuta bajo la identidad de ese usuario. Abra el cuaderno desde la canalización para revisar su contenido más reciente. Si la identidad no tiene los permisos necesarios (o si necesita un principal de usuario en lugar de un principal de servicio para ciertas API), pida al usuario adecuado que edite la canalización para actualizar la identidad del último modificador.
  • Antes de crear o actualizar una programación: el cuaderno se ejecuta bajo la identidad de quien cree o actualice la programación. Asegúrese de que el usuario tiene los permisos necesarios para todas las operaciones del cuaderno.
  • Usar fases del área de trabajo: separe las áreas de trabajo en fases de desarrollo, prueba y producción. Restrinja el acceso a las áreas de trabajo de producción solo a los usuarios de confianza.

Creación de cuadernos

Puede crear un cuaderno o importar uno existente.

Crea un nuevo cuaderno

Como en otros procesos de creación de elementos de Fabric estándar, puede crear fácilmente un cuaderno desde la página principal de Ingeniería de datos de Fabric, la opción Nuevo del área de trabajo o en Crear centro.

Importar los cuadernos existentes

Puedes importar uno o varios cuadernos existentes desde el equipo local mediante la entrada de la barra de herramientas del área de trabajo. Los cuadernos de Fabric reconocen los archivos .ipynb estándar de Jupyter Notebook y los archivos de origen, como .py, .scala y .sql, y crean nuevos elementos de cuaderno en consecuencia.

Captura de pantalla que muestra dónde encontrar las opciones del cuaderno en el menú Nuevo.

Exportación de un cuaderno

Puede exportar el cuaderno a otros formatos estándar. El cuaderno de Fabric se puede exportar a:

Captura de pantalla que muestra dónde exportar el cuaderno.

Guardar un cuaderno

En Fabric, un cuaderno se guardará automáticamente de manera predeterminada después de abrirlo y de editarlo; no hay que preocuparse por perder los cambios del código. También puede usar Guardar una copia para clonar en otra copia en el área de trabajo actual o en otra área de trabajo.

Captura de pantalla que muestra dónde guardar una copia.

Si prefiere guardar manualmente un cuaderno, puede cambiar a la opción de guardado Manual para tener una rama local del elemento del cuaderno y, a continuación, usar Guardar o CTRL+s para guardar los cambios.

Captura de pantalla que muestra dónde cambiar el guardado manual.

También puede cambiar al modo de guardado manual seleccionando Editar ->Opciones de guardado ->Manual. Para activar una rama local de tu bloc de notas y guardarla manualmente, selecciona Guardar o usa el atajo de teclado Ctrl+s.

Conectar lakehouses y cuadernos

Los cuadernos de Fabric ahora admiten interacciones cercanas con los almacenes de lago; puede agregar fácilmente un almacén de lago nuevo o existente desde el Explorador del almacén de lago.

Puede ir a diferentes almacenes de lago en el Explorador del almacén de lago y anclar un almacén de lago para establecerlo como predeterminado. A continuación, el almacén predeterminado se monta en el directorio de trabajo del entorno de ejecución y puede leer o escribir en el almacén de lago predeterminado mediante una ruta de acceso local.

Captura de pantalla que muestra dónde anclar un Lakehouse predeterminado.

Nota:

Debe reiniciar la sesión después de anclar un nuevo almacén de lago o cambiar el nombre del almacén de lago predeterminado.

Adición o eliminación de una casa del lago

Al seleccionar el icono X situado junto a un nombre del almacén de lago de datos, se quita de la pestaña del cuaderno, pero el elemento del almacén de lago de datos sigue existiendo en el área de trabajo.

Seleccione Agregar Lakehouse para añadir más lakehouses al cuaderno, ya sea incorporando uno existente o creando uno nuevo.

Explorar un archivo del almacén de lago de datos

La subcarpeta y los archivos de la sección Tablas y Archivos de la vista Lake aparecen en un área de contenido entre la lista de Lakehouse y el contenido del cuaderno. Seleccione diferentes carpetas de la sección Tablas y Archivos para actualizar el área de contenido.

Operaciones de carpeta y de archivo

Si selecciona un archivo (.csv,.parquet,.txt,.jpg,.png, etc.) con un clic con el botón derecho del mouse, puede usar spark o Pandas API para cargar los datos. Se genera una nueva celda de código y se inserta debajo de la celda que tiene el foco.

Puede copiar fácilmente una ruta de acceso con un formato diferente al del archivo o carpeta que se ha seleccionado y usar la ruta de acceso correspondiente en el código.

Captura de pantalla que muestra el menú contextual de los archivos en lakehouse.

Recursos de notebooks

El explorador de recursos de los cuadernos proporciona un sistema de archivos similar a Unix para ayudar a administrar las carpetas y los archivos. Ofrece un espacio de sistema de archivos que se puede escribir, donde puede almacenar archivos de tamaño pequeño, como módulos de código, modelos semánticos e imágenes. Puede acceder fácilmente a ellos con código en el cuaderno de la misma manera que si estuviera trabajando con el sistema de archivos local.

GIF animado de recursos de cuadernos.

Nota:

  • Los almacenamientos de recursos máximos para carpetas integradas y carpetas de entorno son de 500 MB, con un tamaño de archivo único de hasta 100 MB. Ambos permiten hasta 100 instancias de archivo o carpeta en total.
  • Si usa notebookutils.notebook.run(), utilice el comando notebookutils.nbResPath para acceder al recurso del cuaderno de destino. La ruta de acceso relativa builtin/ siempre apuntará a la carpeta integrada del cuaderno raíz.

Carpeta de recursos integrados

La carpeta de recursos integrados es una carpeta definida por el sistema única para cada cuaderno. Se recomienda usar la carpeta de recursos integrada para almacenar los datos usados en el cuaderno actual. Estas son las capacidades clave de los recursos del notebook.

  • Puede usar operaciones comunes como crear, eliminar, cargar, descargar, arrastrar y colocar, cambiar el nombre, duplicar y buscar a través de la interfaz de usuario.
  • Puede usar rutas de acceso relativas como builtin/YourData.txt para explorar de manera rápida. El método notebookutils.nbResPath le ayuda a componer la ruta de acceso completa.
  • Puede mover fácilmente los datos validados a un almacén de lago mediante la opción Escribir en almacén de lago de datos. Fabric inserta fragmentos de código enriquecidos para tipos de archivo comunes que le ayudarán a empezar a trabajar rápidamente.
  • Estos recursos también están disponibles para usarse en el caso de Ejecución del cuaderno de referencia mediante el caso notebookutils.notebook.run().

Carpeta de recursos del entorno

La Carpeta de Recursos del Entorno es un repositorio compartido diseñado para simplificar la colaboración en varios cuadernos.

  • Puedes encontrar la pestaña Recursos dentro del entorno y tener las operaciones completas para administrar los archivos de recursos aquí. Estos archivos se pueden compartir entre varios cuadernos una vez que el cuaderno está conectado al entorno actual.

    Captura de pantalla que muestra dónde administrar recursos en el entorno.

  • En la página Cuaderno, puedes encontrar fácilmente una segunda carpeta raíz en Recursos heredados del entorno conectado.

    Captura de pantalla que muestra dónde abrir la carpeta de recursos del entorno.

  • También puede realizar acciones en los archivos o carpetas de la misma manera que lo hace con la carpeta de Recursos integrados.

  • La ruta de acceso del recurso del entorno se encuentra montada automáticamente en el clúster de cuadernos. Puede usar la ruta de acceso relativa /env para acceder a los recursos del entorno.

Nota:

La lectura y escritura con una ruta de acceso relativa no funciona en una Sesión de simultaneidad alta.

Editor de archivos

El editor de archivos te permite ver y editar archivos directamente dentro de la carpeta de recursos del cuaderno y la carpeta de recursos del entorno en el cuaderno. Los tipos de archivo admitidos incluyen CSV, TXT, HTML, YML, PY, SQL, entre otros. Con el editor de archivos, puedes acceder y modificar archivos fácilmente en el cuaderno, admite el resaltado de palabras clave y proporciona un servicio de lenguaje necesario al abrir y editar archivos de código como .py y .sql.

  • Puedes acceder a esta característica mediante la opción "Ver y editar" en el menú Archivo. Hacer doble clic en el archivo es una manera más rápida.

    Captura de pantalla que muestra dónde ver y editar archivos.

  • El cambio de contenido en el editor de archivos debe guardarse manualmente haciendo clic en el botón Guardar o el método abreviado de teclado: Ctrl+S, el editor de archivos no admite el guardado automático.

  • El modo notebook también afecta al editor de archivos. Solo puedes ver los archivos, pero no puedes editarlos si estás en el modo de cuaderno sin el permiso de edición.

Nota:

Estas son algunas limitaciones para el editor de archivos.

  • El límite en el tamaño de archivo es de 1 MB.
  • Estos tipos de archivo no son compatibles con la vista y la edición: .xlsx y .parquet.

Colaborar en un cuaderno

El cuaderno de Fabric es un elemento de colaboración que admite la edición por parte de varios usuarios en el mismo cuaderno.

Al abrir un bloc de notas, se entra en el modo de edición conjunta de forma predeterminada, y cada modificación del bloc de notas se guarda automáticamente. Si tus compañeros abren el mismo cuaderno al mismo tiempo, verás su perfil, el resultado de ejecución, el indicador del cursor, el indicador de selección y el rastreo de edición. Mediante las características de colaboración, puede realizar fácilmente la programación en par, el debugging remoto y las situaciones de tutoría.

Captura de pantalla que muestra una celda de código con otra edición del usuario.

Uso compartido de un cuaderno

Compartir un cuaderno es una manera cómoda de colaborar con los miembros del equipo. Los roles de área de trabajo autorizados pueden ver o editar/ejecutar cuadernos de forma predeterminada. Puede compartir un cuaderno con los permisos especificados concedidos.

  1. Seleccione Compartir en la barra de herramientas del cuaderno.

    Captura de pantalla que muestra dónde seleccionar Compartir.

  2. Seleccione la categoría correspondiente de personas que pueden ver este cuaderno. Puede elegir los permisos Compartir, Editar o Ejecutar para los destinatarios.

    Captura de pantalla que muestra dónde seleccionar permisos.

  3. Después de seleccionar Aplicar, puede enviar el cuaderno directamente o copiar el vínculo para otros usuarios. A continuación, los destinatarios pueden abrir el cuaderno con la vista correspondiente concedida por su nivel de permisos.

    Captura de pantalla que muestra dónde crear y enviar un vínculo.

  4. Para administrar aún más los permisos del cuaderno, seleccione Lista de elementos del área de trabajo>Más opciones y, a continuación, seleccione Administrar permisos. Desde esa pantalla, puede actualizar el acceso y los permisos existentes del cuaderno.

    Captura de pantalla que muestra dónde administrar permisos en el área de trabajo.

Comentar una celda de código

La creación de comentarios es otra característica útil en escenarios de colaboración. Actualmente, Fabric admite la adición de comentarios de nivel de celda.

  1. Seleccione el botón Comentarios de la barra de herramientas del cuaderno o el indicador de comentario de celda para abrir el panel Comentarios.

    Captura de pantalla que muestra dónde seleccionar Comentario.

  2. Seleccione el código en la celda de código, seleccione Nuevo en el panel Comentarios, agregue los comentarios y, a continuación, seleccione Publicar comentario para guardarlo.

    Captura de pantalla que muestra dónde seleccionar Nuevo.

  3. Si las necesita, busque las opciones Editar comentario, Resolver conversación y Eliminar conversación; para ello, seleccione la opción Más situada junto al comentario.

Etiquetar a otros en un comentario

"Etiquetado" hace referencia a mencionar y notificar a un usuario en un subproceso de comentario, lo que mejora la colaboración de manera eficiente en los aspectos específicos.

  1. Seleccione una sección de código en una celda y cree un nuevo hilo de comentarios.

  2. Escriba el nombre de usuario y elija el correcto en la lista de sugerencias si desea mencionar a alguien en una discusión sobre una determinada sección.

  3. Comparta sus conclusiones y publíquelas.

  4. Se desencadena una notificación por correo electrónico y el usuario hace clic en el vínculo Abrir comentarios para localizar rápidamente esta celda.

  5. Además, autorice y configure los permisos para los usuarios al etiquetar a alguien que no tiene acceso, lo que garantiza que los recursos de código estén bien administrados.

GIF animado de etiquetar a otros en un comentario.

Nota:

Para un elemento de comentario, el usuario etiquetado ya no recibirá una notificación por correo electrónico si actualiza el comentario en un plazo de una hora. Pero envía una notificación por correo electrónico al nuevo usuario etiquetado.

Historial de versiones

Importante

Esta característica se encuentra en versión preliminar.

El historial de versiones le permite crear fácilmente versiones de los cambios en el cuaderno activo. Admite el seguimiento del historial y la administración de cuadernos con funcionalidades sólidas de control de versiones integradas, lo que resulta especialmente útil para el trabajo colaborativo con varios colaboradores en el mismo cuaderno.

  1. Acceda al historial de versiones desde la barra de herramientas global del cuaderno.

    Captura de pantalla que muestra el acceso al historial.

  2. Notebook admite dos maneras de crear puntos de control.

    • Punto de control manual: puede crear manualmente una nueva versión para registrar los hitos de desarrollo, lo que proporciona flexibilidad para administrar las versiones de los cuadernos.

      Captura de pantalla que muestra cómo crear una nueva versión.

    • Punto de control del sistema: estos puntos de control se crean automáticamente cada 5 minutos en función del intervalo de tiempo de edición por el sistema de Cuaderno, lo que garantiza que el trabajo se guarda y tiene versiones coherentes. Puede encontrar los registros de modificación de todos los colaboradores en la cronología de puntos de control del sistema. Captura de pantalla que muestra la lista de puntos de control de expansión.

  3. Puede hacer clic en un punto de control para abrir la vista de diferencias, resalta las diferencias de contenido entre el punto de control seleccionado y la versión activa actual, incluidas las diferencias de contenido de celda, salida de celda y metadatos. La versión de este punto de control se puede administrar individualmente en el menú "más opciones ".

    Captura de pantalla que muestra la diferencia de vista.

  4. Puede administrar la versión desde el menú desplegable del punto de control, si desea mantener una versión perviosa, haga clic en Restaurar desde el punto de control y sobrescriba el cuaderno actual o use guardar como copia para clonarlo en un nuevo cuaderno.

    Captura de pantalla que muestra más opciones con el punto de control.

Nota:

  • Limitación conocida: cuando varios colaboradores están editando, si uno de ellos hace clic en el botón Restaurar y, a continuación, navega hacia Atrás al cuaderno, el cuaderno no se recuperará inmediatamente del punto de control. Una barra de mensajes le pide que vea los cambios. Debe hacer clic en el botón Ver cambios y seleccionar mantener la versión guardada para finalizar la restauración. Captura de pantalla en la que se muestran los cambios de vista después de la restauración.
  • Los puntos de control del sistema expirarán después de 1 año.

Conmutador del modo notebook

Los cuadernos de Fabric admiten cuatro modos que se pueden cambiar fácilmente: Modo de desarrollo , Modo de solo ejecución , Modo de edición y Modo de vista . Cada modo se asigna a una combinación de permisos específica. Al compartir el cuaderno con otros miembros del equipo, puede conceder permisos adecuados a los destinatarios. Pueden ver el mejor modo de cuaderno disponible según su permiso y pueden cambiar entre el modo al que tienen permiso.

Captura de pantalla que muestra dónde cambiar los modos.

  • Modo de Desarrollo: lectura, ejecución, permiso de escritura necesario.
  • Modo de Solo ejecución: lectura, ejecución y permiso necesario.
  • Modo de Edición: se necesita permiso de lectura y escritura.
  • Modo de Vista: se necesita permiso de lectura.