Creación, configuración y uso de un entorno en Microsoft Fabric

Los entornos de Microsoft Fabric ofrecen configuraciones flexibles para ejecutar los trabajos de Spark. En un entorno puede seleccionar entornos de ejecución de Spark diferentes, configurar los recursos de proceso e instalar bibliotecas desde repositorios públicos o cargar las personalizadas que se han compilado localmente. Puede asociar entornos a sus cuadernos y definiciones de trabajo de Spark con toda facilidad.

En este tutorial se proporciona información general sobre cómo crear, configurar y usar un entorno.

Importante

El elemento de entorno de Microsoft Fabric se encuentra actualmente en versión preliminar.

Creación de un entorno

Hay varios puntos de entrada para crear un entorno.

Creación de un entorno desde la página principal, la vista del área de trabajo o el centro de creación

  • Página principal de Ingeniería de datos

    En la página principal de Ingeniería de datos, seleccione Nuevo y, a continuación, seleccione la tarjeta Entorno para crear un entorno. Screenshot of the Environment card in the Data Engineering homepage.

  • Página principal de Ciencia de datos

    En la página principal de Ciencia de datos, seleccione Nuevo y, a continuación, seleccione la tarjeta Entorno para crear un nuevo entorno. Screenshot of the Environment card in the Data Science homepage.

  • Vista Área de trabajo

    En el área de trabajo, seleccione Nuevo y, a continuación, seleccione Entorno (versión preliminar). Screenshot of the Environment card in the workspace view.

  • Centro de creación

    En el centro de creación, puede seleccionar la tarjeta Entorno en las secciones Ingeniería de datos o Ciencia de datos. Screenshot showing where you can select the Environment card in the creation hub.

Crear un entorno a partir de los menús adjuntos

También puede crear un entorno desde la ubicación donde se adjunta un entorno. Para obtener más información, consulte Asociar un entorno.

  • Menú adjunto de cuaderno

    En la pestaña Inicio de la cinta del cuaderno hay un menú para adjuntar un entorno. Seleccione Área de trabajo predeterminada y, a continuación, seleccione Nuevo entorno para crear uno nuevo. Screenshot showing where to select New Environment from the Workspace default menu in the in notebook screen.

  • Menú adjunto de definición de trabajo de Spark

    Puede adjuntar un entorno desde la pestaña Inicio de la cinta de opciones de definición de trabajo de Spark y también crear un nuevo entorno desde el mismo menú. En la cinta de opciones, seleccione Área de trabajo predeterminada y, a continuación, seleccione Nuevo entorno. Screenshot showing where to select New Environment from the Workspace default menu in the Spark job definition screen.

  • Menú adjunto de configuración del área de trabajo

    En la sección Ingeniería/Ciencia de datos de la pantalla de configuración del área de trabajo, un administrador del área de trabajo puede adjuntar un entorno como valor predeterminado del área de trabajo. Para obtener más información, consulte Asociar un entorno como valor predeterminado del área de trabajo. También puede crear uno nuevo en la pestaña Entorno.

    Screenshot showing where to select New Environment in the Workspace default attachment menu in Workspace settings.

Configuración de un entorno

Hay tres componentes principales que puede configurar para un entorno: el tiempo de ejecución de Spark, las bibliotecas y el proceso de Spark.

Elección de un tiempo de ejecución de Spark

Para un entorno, puede elegir entre varios runtimes de Spark, cada uno con su propia configuración predeterminada y sus paquetes preinstalados. Para ver los runtimes disponibles, vaya a la pestaña Inicio del entorno y seleccione Runtime. Seleccione el runtime que mejor se adapte a sus necesidades.

Screenshot of choosing runtime in environment.

Importante

  • Si va a actualizar el runtime de un entorno con configuraciones o bibliotecas existentes, debe volver a publicar el contenido en función de la versión de runtime actualizada.
  • Si las configuraciones o bibliotecas existentes no son compatibles con la versión de runtime recién actualizada, se produce un error en la publicación. Debe quitar las configuraciones o bibliotecas incompatibles y volver a publicar el entorno.

Configuración del proceso de Spark

El proceso de Spark de Microsoft Fabric proporciona una velocidad y eficiencia sin precedentes ejecutando Spark, así como experiencias adaptadas a los requisitos. En el entorno puede elegir entre varios grupos creados por administradores de áreas de trabajo y administradores de capacidades. Puede ajustar aún más las configuraciones y administrar las propiedades de Spark para que sean eficaces en las sesiones de Spark. Para obtener más información, consulte Opciones de configuración de proceso de Spark en entornos de Fabric.

Administración de bibliotecas

Excepto para las bibliotecas integradas proporcionadas por cada runtime de Spark, el entorno de Fabric permite instalar bibliotecas desde orígenes públicos o cargar bibliotecas personalizadas compiladas por usted o su organización. Una vez que instale correctamente las bibliotecas, están disponibles en las sesiones de Spark. Para obtener más información, consulte Administración de bibliotecas en entornos de Fabric.

Guardar y publicar cambios

Para guardar o publicar cambios en un entorno de Fabric, seleccione la opción que desee en la cinta de opciones en la pestaña Inicio.

Screenshot showing where to select the save and Publish actions.

  • La opción Guardar está activa cuando tiene cambios que no se guardan. Si actualiza la página sin guardarla, se perderán todos los cambios pendientes. Si alguna sección contiene una entrada no válida, la opción Guardar está deshabilitada. La acción Guardar se aplica a todos los cambios no guardados tanto de la sección Bibliotecas como de la sección Proceso de Spark.
  • La opción Publicar está activa cuando hay cambios que no están publicados. No es necesario guardar antes de publicar los cambios. Al seleccionar Publicar, aparece la página Cambios pendientes, donde puede revisar todos los cambios antes de la publicación. Después de seleccionar Publicar todo, el entorno de Fabric ejecuta trabajos en el back-end para preparar las configuraciones para su uso. Este proceso tarda varios minutos, especialmente si se incluyen cambios en la biblioteca.

Nota:

Durante el proceso de publicación, si los cambios afectan a las bibliotecas, el sistema ayudará a descargar dependencias y a resolver posibles conflictos.

Cuando tenga cambios pendientes, aparecerá un banner pidiéndole que los guarde o publique.

  • Puede seleccionar Guardar o Publicar; estas acciones son las mismas que Guardar y Publicar en la pestaña Inicio.
  • Durante el proceso de publicación, al seleccionar Ver progreso en el banner se abre la página Cambios pendientes de nuevo. Para detener el proceso de publicación, seleccione Cancelar en la página Cambios pendientes.
  • Aparece una notificación cuando se realiza la publicación o si el proceso encuentra errores.

Cómo adjuntar un entorno

El entorno de Microsoft Fabric se puede adjuntar a las áreas de trabajo de Ingeniería/Ciencia de datos o a sus cuadernos y definiciones de trabajos de Spark.

Cómo adjuntar un entorno como valor predeterminado del área de trabajo

Busque la pestaña Entorno seleccionando Configuración del área de trabajo ->Ingeniería/Ciencia de datos ->Configuración de Spark.

Nuevas áreas de trabajo

Cuando esté trabajando en un área de trabajo que sea nueva o no tenga configurada la biblioteca y la configuración de Spark, aparecerá la siguiente pantalla Configuración de Spark.

Screenshot of the Workspace settings Set default environment screen.

Los administradores de áreas de trabajo pueden definir la experiencia predeterminada para todas las áreas de trabajo. Los valores configurados aquí son eficaces para los cuadernos y definiciones de trabajos de Spark que se adjuntan a la configuración del área de trabajo. Screenshot of Workspace configuration effective range.

El botón de alternancia Establecer entorno predeterminado puede mejorar la experiencia del usuario. De forma predeterminada, este botón de alternancia se establece en Desactivado. Si no hay ninguna propiedad o biblioteca de Spark predeterminada necesaria como valor predeterminado del área de trabajo, los administradores pueden definir el runtime de Spark en esta circunstancia. Sin embargo, si un administrador quiere preparar un proceso y bibliotecas predeterminados de Spark para el área de trabajo, puede cambiar el botón de alternancia a Activado y adjuntar fácilmente un entorno como valor predeterminado del área de trabajo. Esta opción hace que todas las configuraciones del entorno sean eficaces como configuración del área de trabajo.

Screenshot of default environment selection.

Áreas de trabajo con propiedades o biblioteca de Spark existentes

La característica de entorno es una actualización importante de la sección Ingeniería de datos o Ciencia de datos de la Configuración del área de trabajo. Como parte de esta actualización, Fabric ya no admite la administración de bibliotecas ni la incorporación de nuevas propiedades de Spark en el nivel de área de trabajo. Puede migrar las bibliotecas existentes y las propiedades de Spark a un entorno y adjuntarlas como valor predeterminado del área de trabajo. Para obtener más información, consulte Migrar bibliotecas de áreas de trabajo y propiedades de Spark a un entorno predeterminado.

Cómo adjuntar un entorno a un cuaderno o a una definición de trabajo de Spark

El menú Entorno aparece tanto en la pestaña Inicio del cuaderno como en la de la definición de trabajo de Spark. Los entornos disponibles se muestran en el menú. Si selecciona un entorno, el proceso de Spark y las bibliotecas configuradas en él serán efectivos después de iniciar una sesión de Spark.

Screenshot showing where to attach an environment in a notebook.

Nota:

Si cambia de entorno mientras se encuentra en una sesión activa, el entorno recién seleccionado no surtirá efecto hasta la siguiente sesión.