Migración de las bibliotecas de áreas de trabajo y propiedades de Spark a un entorno predeterminado
El entorno de Microsoft Fabric proporciona configuraciones flexibles para ejecutar los trabajos de Spark. En un entorno puede seleccionar entornos de ejecución de Spark diferentes, configurar los recursos de proceso e instalar bibliotecas desde repositorios públicos o cargar las personalizadas que se han compilado localmente. Puede asociar entornos a sus cuadernos y definiciones de trabajo de Spark con toda facilidad.
La configuración de área de trabajo de Ingeniería de datos y Ciencia de datos se actualiza para incluir entornos de Fabric. Como parte de esta actualización, Fabric ya no admite la incorporación de nuevas bibliotecas y propiedades de Spark en la configuración del área de trabajo. En su lugar, puede crear un entorno de Fabric, configurar la biblioteca y la propiedad en él y asociarlo como entorno predeterminado del área de trabajo. Después de crear un entorno y establecerlo como predeterminado, puede migrar las bibliotecas existentes y las propiedades de Spark a ese entorno predeterminado.
En este tutorial aprenderá a migrar las bibliotecas de áreas de trabajo existentes y las propiedades de Spark a un entorno.
Importante
- La configuración del área de trabajo está restringida a los administradores.
- La configuración del área de trabajo existente sigue siendo efectiva para los cuadernos o definiciones de trabajos de Spark aunque no haya ningún entorno asociado a ellos. Sin embargo, no puede realizar más cambios en esa configuración. SE RECOMIENDA ENCARECIDAMENTE migrar la configuración existente a un entorno.
- El proceso de migración incluye un paso que quita permanentemente todas las configuraciones existentes. Siga detenidamente estas instrucciones. No hay ninguna manera de devolver los archivos en caso de que estos se eliminen accidentalmente.
Preparación de los archivos para la migración
En Configuración del área de trabajo, revise las configuraciones existentes.
Anote la versión del entorno de ejecución actual.
Para descargar las configuraciones existentes seleccione Descargar todos los archivos.
El contenido se descarga como archivos diferentes. Sparkproperties.yml contiene todos los pares clave-valor de las propiedades de Spark. El archivo Publiclibrary.yml contiene todas las definiciones de biblioteca pública. Los paquetes personalizados cargados por usted o su organización se descargan como archivos uno a uno.
Una vez descargados los archivos, puede llevar a cabo la migración.
Creación y configuración de un entorno
Cree un entorno en la lista de áreas de trabajo o centro de creación. Después de crear un nuevo entorno, aparecerá la página Entorno.
En la pestaña Inicio del entorno, asegúrese de que la versión del entorno de ejecución sea la misma que la del entorno de ejecución del área de trabajo existente.
Omita este paso si no ha tenido ninguna biblioteca pública en la configuración del área de trabajo. Vaya a la sección Bibliotecas públicas y seleccione Agregar desde .yml en la cinta de opciones. Cargue Publiclibrary.yml, que descargó de la configuración del área de trabajo existente.
Omita este paso si no ha tenido ninguna biblioteca personalizada en la configuración del área de trabajo. Vaya a la sección Bibliotecas personalizadas y seleccione Cargar en la cinta de opciones. Cargue los archivos de biblioteca personalizados, que se descargaron de la configuración del área de trabajo existente.
Omita este paso si no ha tenido ninguna propiedad de Spark en la configuración del área de trabajo. Vaya a la sección Propiedades de Spark y seleccione Cargar en la cinta de opciones. Cargue el archivo Sparkproperties.yml, que descargó de la configuración del área de trabajo existente.
Seleccione Publicar y vuelva a revisar los cambios cuidadosamente. Si todo es correcto, publique los cambios. La publicación tarda varios minutos en finalizar.
Una vez completada la publicación, habrá configurado correctamente el entorno.
Habilitación y selección de un entorno predeterminado en la configuración del área de trabajo
Importante
Todas las configuraciones existentes se descartarán cuando seleccione Habilitar entorno. Asegúrese de que ha descargado todas las configuraciones existentes y las ha instalado correctamente en un entorno antes de continuar.
Vaya a Configuración del área de trabajo ->Ingeniería/Ciencia de datos ->Entorno y seleccione Habilitar entorno. Esta acción quita las configuraciones existentes y da comienzo a la experiencia del entorno de nivel de área de trabajo.
Aparecerá la siguiente pantalla cuando elimine correctamente las configuraciones existentes.
Mueva el botón de alternancia Personalizar entorno a la posición de encendido. Esta opción le permite asociar un entorno como valor predeterminado del área de trabajo.
Seleccione el entorno que configuró en los pasos anteriores como valor predeterminado del área de trabajo y seleccione Guardar.
Confirme que el nuevo entorno aparece ahora en Entorno predeterminado para el área de trabajo en la página Configuración de Spark.