Creación, configuración y uso de un entorno en Microsoft Fabric
Los entornos de Microsoft Fabric son un elemento consolidado de toda la configuración de hardware y software. En un entorno puede seleccionar tiempos de ejecución de Spark diferentes, configurar los recursos de proceso, instalar bibliotecas desde repositorios públicos o directorios locales, etc.
En este tutorial se proporciona información general sobre cómo crear, configurar y usar un entorno.
Creación de un entorno
Hay varios puntos de entrada para crear entornos nuevos.
Punto de entrada estándar
En el centro de creación o en la sección Nuevo del área de trabajo, puede encontrar la opción para crear un nuevo entorno como otros elementos de Fabric.
Creación durante la selección
Al seleccionar el entorno del cuaderno, la definición del trabajo de Spark y el valor predeterminado del área de trabajo, puede encontrar la opción para crear un entorno nuevo.
Configuración de un entorno
Existen tres componentes principales en un entorno, que son el proceso de Spark (que incluye el tiempo de ejecución de Spark), las bibliotecas y los recursos. Las configuraciones de las bibliotecas y el proceso de Spark son necesarias para que la publicación sea eficaz, mientras que los recursos son un almacenamiento compartido que puede cambiar en tiempo real. Consulte la sección Guardar y publicar cambios para obtener más detalles.
Configuración del proceso de Spark
Para un entorno, puede elegir entre varios runtimes de Spark, cada uno con su propia configuración predeterminada y sus paquetes preinstalados. Para ver los runtimes disponibles, vaya a la pestaña Inicio del entorno y seleccione Runtime. Seleccione el runtime que mejor se adapte a sus necesidades.
Importante
- Si va a actualizar el runtime de un entorno con configuraciones o bibliotecas existentes, debe volver a publicar el contenido en función de la versión de runtime actualizada.
- Si las configuraciones o bibliotecas existentes no son compatibles con la versión de runtime recién actualizada, se produce un error en la publicación. Debe quitar las configuraciones o bibliotecas incompatibles y volver a publicar el entorno.
El proceso de Spark de Microsoft Fabric proporciona una velocidad y eficiencia sin precedentes ejecutando Spark, así como experiencias adaptadas a los requisitos. En el entorno puede elegir entre varios grupos creados por administradores de áreas de trabajo y administradores de capacidades. Puede ajustar aún más las configuraciones y administrar las propiedades de Spark para que sean eficaces en las sesiones de Spark. Para obtener más información, consulte Opciones de configuración de proceso de Spark en entornos de Fabric.
Administración de bibliotecas
Excepto para las bibliotecas integradas proporcionadas por cada runtime de Spark, el entorno de Fabric permite instalar bibliotecas desde orígenes públicos o cargar bibliotecas personalizadas compiladas por usted o su organización. Una vez que instale correctamente las bibliotecas, están disponibles en las sesiones de Spark. Para obtener más información, consulte Administración de bibliotecas en entornos de Fabric.
Recursos
La sección Recursos del entorno facilita la capacidad de administrar recursos pequeños durante la fase de desarrollo. Cuando se adjuntan, puede accederse a los archivos cargados en el entorno entre los distintos cuadernos. Para obtener más información, consulte Administrar recursos en el entorno de Fabric
Guardar y publicar cambios
En la pestaña Inicio de la cinta del entorno, puede encontrar fácilmente dos botones denominados Guardar y Publicar. Se activarán cuando haya cambios pendientes sin guardar o sin publicar en las secciones Bibliotecas y Proceso de Spark.
También verá un banner que muestra estos dos botones cuando hay cambios pendientes en las secciones Bibliotecas y Proceso de Spark, los cuales tienen las mismas funciones que los de la cinta.
- Los cambios no guardados se pierden si actualiza o deja abierto el navegador. Seleccione el botón Guardar para asegurarse de que los cambios se registran antes de salir. Guardar no aplica la configuración, pero almacena los cambios en la caché del sistema.
- Seleccione Publicar para aplicar los cambios en Bibliotecas y Proceso de Spark. Aparecerá la página Cambios pendientes para efectuar una revisión final antes de la publicación. A continuación, seleccione Publicar todo para iniciar la configuración en el entorno de Fabric. Este proceso puede tardar un poco, especialmente si se producen cambios en la biblioteca.
- Para cancelar un proceso de publicación, seleccione Ver progreso en el banner y Cancelar la operación.
- Cuando la publicación finaliza, aparece una notificación. Se produce una notificación de error si hay algún problema durante el proceso.
Nota:
El entorno solo acepta una publicación de cada vez. Mientras hay una publicación en curso, no se pueden realizar más cambios en las bibliotecas ni en la sección de Proceso de Spark. La publicación no afecta a la adición, eliminación ni edición de los archivos y carpetas de la sección Recursos. Las acciones para administrar recursos son en tiempo real y la publicación no bloquea los cambios en la sección de recursos.
Cómo adjuntar un entorno
El entorno de Microsoft Fabric se puede adjuntar a las áreas de trabajo de Ingeniería/Ciencia de datos o a sus cuadernos y definiciones de trabajos de Spark.
Cómo adjuntar un entorno como valor predeterminado del área de trabajo
Busque la pestaña Entorno seleccionando Configuración del área de trabajo ->Ingeniería/Ciencia de datos ->Configuración de Spark.
Nuevas áreas de trabajo
Cuando esté trabajando en un área de trabajo que sea nueva o no tenga configurada la biblioteca y la configuración de Spark, aparecerá la siguiente pantalla Configuración de Spark.
Los administradores de áreas de trabajo pueden definir la carga de trabajo predeterminada para todas las áreas de trabajo. Los valores configurados aquí son eficaces para los cuadernos y definiciones de trabajos de Spark que se adjuntan a la configuración del área de trabajo.
El botón de alternancia Establecer entorno predeterminado puede mejorar la experiencia del usuario. De forma predeterminada, este botón de alternancia se establece en Desactivado. Si no hay ninguna propiedad o biblioteca de Spark predeterminada necesaria como valor predeterminado del área de trabajo, los administradores pueden definir el runtime de Spark en esta circunstancia. Sin embargo, si un administrador quiere preparar un proceso y bibliotecas predeterminados de Spark para el área de trabajo, puede cambiar el botón de alternancia a Activado y adjuntar fácilmente un entorno como valor predeterminado del área de trabajo. Esta opción hace que todas las configuraciones del entorno sean eficaces como configuración del área de trabajo.
Áreas de trabajo con propiedades o biblioteca de Spark existentes
La característica de entorno es una actualización importante de la sección Ingeniería de datos o Ciencia de datos de la Configuración del área de trabajo. Como parte de esta actualización, Fabric ya no admite la administración de bibliotecas ni la incorporación de nuevas propiedades de Spark en el nivel de área de trabajo. Puede migrar las bibliotecas existentes y las propiedades de Spark a un entorno y adjuntarlas como valor predeterminado del área de trabajo. Para obtener más información, consulte Migrar bibliotecas de áreas de trabajo y propiedades de Spark a un entorno predeterminado.
Cómo adjuntar un entorno a un cuaderno o a una definición de trabajo de Spark
El menú Entorno aparece tanto en la pestaña Inicio del cuaderno como en la de la definición de trabajo de Spark. Los entornos disponibles se muestran en el menú. Si selecciona un entorno, el proceso de Spark y las bibliotecas configuradas en él serán efectivos después de iniciar una sesión de Spark.
Nota:
Si cambia de entorno mientras se encuentra en una sesión activa, el entorno recién seleccionado no surtirá efecto hasta la siguiente sesión.
Compartir un entorno existente
Microsoft Fabric admite el uso compartido de un elemento con un nivel de permisos diferente.
Al compartir un elemento de entorno, los destinatarios reciben automáticamente el permiso de lectura. Con este permiso, pueden explorar las configuraciones del entorno y adjuntarlo a cuadernos o trabajos de Spark. Para que la ejecución de código sea fluida, asegúrese de conceder permisos de lectura para los entornos adjuntos al compartir cuadernos y definiciones de trabajos de Spark.
Además, puede compartir el entorno con permisos para Compartir y Editar. Los usuarios con permiso para compartir pueden seguir compartiendo el entorno con otros usuarios. Mientras tanto, los destinatarios con permiso para editar pueden actualizar el contenido del entorno.