Compartir vía


Migración de las bibliotecas de áreas de trabajo y propiedades de Spark a un entorno predeterminado

El entorno de Microsoft Fabric proporciona configuraciones flexibles para ejecutar los trabajos de Spark. En un entorno puede seleccionar entornos de ejecución de Spark diferentes, configurar los recursos de proceso e instalar bibliotecas desde repositorios públicos o cargar las personalizadas que se han compilado localmente. Puede asociar entornos a sus cuadernos y definiciones de trabajo de Spark con toda facilidad.

La configuración de área de trabajo de Ingeniería de datos y Ciencia de datos se actualiza para incluir entornos de Fabric. Como parte de esta actualización, Fabric ya no admite la incorporación de nuevas bibliotecas y propiedades de Spark en la configuración del área de trabajo. En su lugar, puede crear un entorno de Fabric, configurar la biblioteca y la propiedad en él y asociarlo como entorno predeterminado del área de trabajo. Después de crear un entorno y establecerlo como predeterminado, puede migrar las bibliotecas existentes y las propiedades de Spark a ese entorno predeterminado.

En este tutorial aprenderá a migrar las bibliotecas de áreas de trabajo existentes y las propiedades de Spark a un entorno.

Importante

  • La configuración del área de trabajo está restringida a los administradores.
  • La configuración del área de trabajo existente sigue siendo efectiva para los cuadernos o definiciones de trabajos de Spark aunque no haya ningún entorno asociado a ellos. Sin embargo, no puede realizar más cambios en esa configuración. SE RECOMIENDA ENCARECIDAMENTE migrar la configuración existente a un entorno.
  • El proceso de migración incluye un paso que quita permanentemente todas las configuraciones existentes. Siga detenidamente estas instrucciones. No hay ninguna manera de devolver los archivos en caso de que estos se eliminen accidentalmente.

Preparación de los archivos para la migración

En Configuración del área de trabajo, revise las configuraciones existentes. Captura de pantalla que muestra dónde encontrar las opciones de configuración en Configuración actual en la pestaña Entorno.

  1. Anote la versión del entorno de ejecución actual.

  2. Para descargar las configuraciones existentes seleccione Descargar todos los archivos.

    El contenido se descarga como archivos diferentes. Sparkproperties.yml contiene todos los pares clave-valor de las propiedades de Spark. El archivo Publiclibrary.yml contiene todas las definiciones de biblioteca pública. Los paquetes personalizados cargados por usted o su organización se descargan como archivos uno a uno. Captura de pantalla que muestra cómo la configuración se descarga en diferentes formatos de archivo.

Una vez descargados los archivos, puede llevar a cabo la migración.

Creación y configuración de un entorno

  1. Cree un entorno en la lista de áreas de trabajo o centro de creación. Después de crear un nuevo entorno, aparecerá la página Entorno.

  2. En la pestaña Inicio del entorno, asegúrese de que la versión del entorno de ejecución sea la misma que la del entorno de ejecución del área de trabajo existente.

    Captura de pantalla que muestra dónde comprobar la versión del entorno de ejecución.

  3. Omita este paso si no ha tenido ninguna biblioteca pública en la configuración del área de trabajo. Vaya a la sección Bibliotecas públicas y seleccione Agregar desde .yml en la cinta de opciones. Cargue Publiclibrary.yml, que descargó de la configuración del área de trabajo existente.

    Captura de pantalla que muestra dónde seleccionar Agregar desde .yml para instalar una biblioteca pública.

  4. Omita este paso si no ha tenido ninguna biblioteca personalizada en la configuración del área de trabajo. Vaya a la sección Bibliotecas personalizadas y seleccione Cargar en la cinta de opciones. Cargue los archivos de biblioteca personalizados, que se descargaron de la configuración del área de trabajo existente.

    Captura de pantalla que muestra dónde seleccionar Cargar para instalar una biblioteca personalizada.

  5. Omita este paso si no ha tenido ninguna propiedad de Spark en la configuración del área de trabajo. Vaya a la sección Propiedades de Spark y seleccione Cargar en la cinta de opciones. Cargue el archivo Sparkproperties.yml, que descargó de la configuración del área de trabajo existente.

  6. Seleccione Publicar y vuelva a revisar los cambios cuidadosamente. Si todo es correcto, publique los cambios. La publicación tarda varios minutos en finalizar.

Una vez completada la publicación, habrá configurado correctamente el entorno.

Habilitación y selección de un entorno predeterminado en la configuración del área de trabajo

Importante

Todas las configuraciones existentes se descartarán cuando seleccione Habilitar entorno. Asegúrese de que ha descargado todas las configuraciones existentes y las ha instalado correctamente en un entorno antes de continuar.

  1. Vaya a Configuración del área de trabajo ->Ingeniería/Ciencia de datos ->Entorno y seleccione Habilitar entorno. Esta acción quita las configuraciones existentes y da comienzo a la experiencia del entorno de nivel de área de trabajo.

    Aparecerá la siguiente pantalla cuando elimine correctamente las configuraciones existentes.

    Captura de pantalla de la configuración de una nueva área de trabajo.

  2. Mueva el botón de alternancia Personalizar entorno a la posición de encendido. Esta opción le permite asociar un entorno como valor predeterminado del área de trabajo.

    Captura de pantalla que muestra dónde mover el botón de alternancia Personalizar entorno a la posición de encendido.

  3. Seleccione el entorno que configuró en los pasos anteriores como valor predeterminado del área de trabajo y seleccione Guardar.

    Captura de pantalla que muestra dónde seleccionar un entorno para asociarlo como entorno predeterminado.

  4. Confirme que el nuevo entorno aparece ahora en Entorno predeterminado para el área de trabajo en la página Configuración de Spark.

    Captura de pantalla del éxito de una migración.