Compartir a través de


Creación, configuración y uso de un entorno en Microsoft Fabric

El entorno de Microsoft Fabric es un elemento consolidado para toda la configuración de hardware y software. En un entorno puede seleccionar tiempos de ejecución de Spark diferentes, configurar los recursos de proceso, instalar bibliotecas desde repositorios públicos o directorios locales, etc.

En este tutorial se proporciona información general sobre cómo crear, configurar y usar un entorno.

Creación de un entorno

Hay varios puntos de entrada para crear entornos nuevos.

  • Punto de entrada estándar

    En el centro de creación o en la sección Nuevo del área de trabajo, puede encontrar la opción para crear un nuevo entorno como otros elementos de Fabric.

  • Creación durante la selección

    Al seleccionar el entorno del cuaderno, la definición del trabajo de Spark y el valor predeterminado del área de trabajo, puede encontrar la opción para crear un entorno nuevo.

Configuración de un entorno

Existen tres componentes principales en un entorno, que son el proceso de Spark (que incluye el tiempo de ejecución de Spark), las bibliotecas y los recursos. Las configuraciones de las bibliotecas y el proceso de Spark son necesarias para que la publicación sea eficaz, mientras que los recursos son un almacenamiento compartido que puede cambiar en tiempo real. Consulte la sección Guardar y publicar cambios para obtener más detalles.

Configuración del proceso de Spark

Para un entorno, puede elegir entre varios runtimes de Spark, cada uno con su propia configuración predeterminada y sus paquetes preinstalados. Para ver los runtimes disponibles, vaya a la pestaña Inicio del entorno y seleccione Runtime. Seleccione el runtime que mejor se adapte a sus necesidades.

Captura de pantalla de la elección del tiempo de ejecución en el entorno.

Importante

  • Si va a actualizar el runtime de un entorno con configuraciones o bibliotecas existentes, debe volver a publicar el contenido en función de la versión de runtime actualizada.
  • Si las configuraciones o bibliotecas existentes no son compatibles con la versión de runtime recién actualizada, se produce un error en la publicación. Debe quitar las configuraciones o bibliotecas incompatibles y volver a publicar el entorno.

El proceso de Spark de Microsoft Fabric proporciona una velocidad y eficiencia sin precedentes ejecutando Spark, así como experiencias adaptadas a los requisitos. En el entorno puede elegir entre varios grupos creados por administradores de áreas de trabajo y administradores de capacidades. Puede ajustar aún más las configuraciones y administrar las propiedades de Spark para que sean eficaces en las sesiones de Spark. Para obtener más información, consulte Opciones de configuración de proceso de Spark en entornos de Fabric.

Administración de bibliotecas

Excepto para las bibliotecas integradas proporcionadas por cada runtime de Spark, el entorno de Fabric permite instalar bibliotecas desde orígenes públicos o cargar bibliotecas personalizadas compiladas por usted o su organización. Una vez que instale correctamente las bibliotecas, están disponibles en las sesiones de Spark. Para obtener más información, consulte Administración de bibliotecas en entornos de Fabric. También puede encontrar los procedimientos recomendados para administrar bibliotecas en Microsoft Fabric.Administración de bibliotecas de Apache Spark en Microsoft Fabric

Recursos

La sección Recursos del entorno facilita la capacidad de administrar recursos pequeños durante la fase de desarrollo. Cuando se adjuntan, puede accederse a los archivos cargados en el entorno entre los distintos cuadernos. Para obtener más información, consulte Administrar recursos en el entorno de Fabric

Guardar y publicar cambios

En la pestaña Inicio de la cinta del entorno, puede encontrar fácilmente dos botones denominados Guardar y Publicar. Se activarán cuando haya cambios pendientes sin guardar o sin publicar en las secciones Bibliotecas y Proceso de Spark.

Captura de pantalla que muestra dónde seleccionar las acciones Guardar y Publicar.

También verá un banner que muestra estos dos botones cuando hay cambios pendientes en las secciones Bibliotecas y Proceso de Spark, los cuales tienen las mismas funciones que los de la cinta.

  • Los cambios no guardados se pierden si actualiza o deja abierto el navegador. Seleccione el botón Guardar para asegurarse de que los cambios se registran antes de salir. Guardar no aplica la configuración, pero almacena los cambios en la caché del sistema.
  • Seleccione Publicar para aplicar los cambios en Bibliotecas y Proceso de Spark. Aparecerá la página Cambios pendientes para efectuar una revisión final antes de la publicación. A continuación, seleccione Publicar todo para iniciar la configuración en el entorno de Fabric. Este proceso puede tardar un poco, especialmente si se producen cambios en la biblioteca.
  • Para cancelar un proceso de publicación, seleccione Ver progreso en el banner y Cancelar la operación.
  • Cuando la publicación finaliza, aparece una notificación. Se produce una notificación de error si hay algún problema durante el proceso.

Nota:

El entorno solo acepta una publicación de cada vez. Mientras hay una publicación en curso, no se pueden realizar más cambios en las bibliotecas ni en la sección de Proceso de Spark. La publicación no afecta a la adición, eliminación ni edición de los archivos y carpetas de la sección Recursos. Las acciones para administrar recursos son en tiempo real y la publicación no bloquea los cambios en la sección de recursos.

Compartir un entorno existente

Microsoft Fabric admite el uso compartido de un elemento con un nivel de permisos diferente.

Captura de pantalla que muestra cómo compartir un entorno.

Al compartir un elemento de entorno, los destinatarios reciben automáticamente el permiso de lectura. Con este permiso, pueden explorar las configuraciones del entorno y adjuntarlo a cuadernos o trabajos de Spark. Para que la ejecución de código sea fluida, asegúrese de conceder permisos de lectura para los entornos adjuntos al compartir cuadernos y definiciones de trabajos de Spark.

Además, puede compartir el entorno con permisos para Compartir y Editar. Los usuarios con permiso para compartir pueden seguir compartiendo el entorno con otros usuarios. Mientras tanto, los destinatarios con permiso para editar pueden actualizar el contenido del entorno.

Cómo adjuntar un entorno

El entorno de Microsoft Fabric se puede adjuntar a las áreas de trabajo de Ingeniería/Ciencia de datos o a sus cuadernos y definiciones de trabajos de Spark.

Cómo adjuntar un entorno como valor predeterminado del área de trabajo

Importante

Una vez seleccionado un entorno como valor predeterminado del área de trabajo, solo los administradores del área de trabajo pueden actualizar el contenido del entorno predeterminado.

Busque la pestaña Entorno seleccionando Configuración del área de trabajo>Configuración de Ingeniería de datos/Science>Configuración Spark.

Captura de pantalla de la configuración del área de trabajo, opción Establecer entorno predeterminado.

Los administradores de áreas de trabajo pueden definir la carga de trabajo predeterminada para todas las áreas de trabajo. Los valores configurados aquí son eficaces para cuadernos y definiciones de trabajo de Spark que se asocian a Configuración del área de trabajo. Captura de pantalla del rango efectivo en la configuración del área de trabajo.

El botón de alternancia Establecer entorno predeterminado puede mejorar la experiencia del usuario. De forma predeterminada, este botón de alternancia se establece en Desactivado. Si no hay ninguna propiedad o biblioteca de Spark predeterminada necesaria como valor predeterminado del área de trabajo, los administradores pueden definir el runtime de Spark en esta circunstancia. Sin embargo, si un administrador quiere preparar un proceso y bibliotecas predeterminados de Spark para el área de trabajo, puede cambiar el botón de alternancia a Activado y adjuntar fácilmente un entorno como valor predeterminado del área de trabajo. Esta opción hace que todas las configuraciones del entorno sean eficaces como la Configuración del área de trabajo .

Captura de pantalla de la selección del entorno predeterminado.

Cómo adjuntar un entorno a un cuaderno o a una definición de trabajo de Spark

El Entorno está disponible en las pestañas Notebook e inicio de definición de trabajo de Spark. La asociación a un entorno permite que cuadernos y definiciones de trabajos de Spark accedan a sus bibliotecas, configuraciones de proceso y recursos. El explorador mostrará todos los entornos disponibles, incluidos los compartidos con usted, desde el área de trabajo actual y desde otras áreas de trabajo a las que tiene acceso.

Captura de pantalla que muestra dónde adjuntar un entorno en un cuaderno.

Nota:

Si cambia a otro entorno durante una sesión activa, el entorno recién seleccionado no surtirá efecto hasta la siguiente sesión. Al adjuntar un entorno desde otra área de trabajo, ambas áreas de trabajo deben tener la misma capacidad y la misma configuración de seguridad de red. Aunque puede seleccionar entornos de áreas de trabajo con diferentes capacidades o configuración de seguridad de red, la sesión no se podrá iniciar. Al adjuntar un entorno desde otra área de trabajo, se omite la configuración de proceso en ese entorno. En su lugar, las configuraciones de grupo y proceso tendrán como valor predeterminado la configuración del área de trabajo actual.