Creación de un clúster con Data Lake Storage Gen2 mediante Azure Portal

El Portal de Azure es una herramienta de administración basada en web para servicios y recursos hospedados en la nube de Microsoft Azure. En este artículo aprenderá a crear clústeres de Azure HDInsight basados en Linux mediante el portal. Puede encontrar más detalles en Creación de clústeres de HDInsight.

Advertencia

La facturación de los clústeres de HDInsight se prorratea por minuto, tanto si se usan como si no. Por consiguiente, asegúrese de eliminar el clúster cuando termine de usarlo. Consulte Eliminación de un clúster de HDInsight.

Si no tiene ninguna suscripción a Azure, cree una cuenta gratuita antes de empezar.

Para crear un clúster de HDInsight que use Data Lake Storage Gen2 para el almacenamiento, siga estos pasos para configurar una cuenta de almacenamiento que tenga un espacio de nombres jerárquico.

Crear una identidad administrada asignada por el usuario

Cree una identidad administrada asignada por el usuario si todavía no tiene una.

  1. Inicie sesión en Azure Portal.
  2. En la parte superior izquierda, haga clic en Crear un recurso.
  3. En el cuadro de búsqueda, escriba usuario asignado y haga clic en Identidad administrada asignada por el usuario.
  4. Haga clic en Crear.
  5. Escriba un nombre para la identidad administrada y seleccione la suscripción, el grupo de recursos y la ubicación correctos.
  6. Haga clic en Crear.

Para obtener más información sobre cómo funcionan las identidades administradas en Azure HDInsight, vea Identidades administradas en Azure HDInsight.

Create a user-assigned managed identity.

Creación de una cuenta de almacenamiento para su uso con Data Lake Storage Gen2

Creación de una cuenta de almacenamiento para su uso con Azure Data Lake Storage Gen2 habilitado.

  1. Inicie sesión en Azure Portal.
  2. En la parte superior izquierda, haga clic en Crear un recurso.
  3. En el cuadro de búsqueda, escriba almacenamiento y haga clic en Cuenta de almacenamiento.
  4. Haga clic en Crear.
  5. En la pantalla Crear la cuenta de almacenamiento:
    1. Seleccione la suscripción y el grupo de recursos correctos.
    2. Escriba un nombre para la cuenta de almacenamiento con Data Lake Storage Gen2.
    3. Haga clic en la pestaña Avanzado.
    4. Haga clic en Habilitado junto a Espacio de nombres jerárquico en Data Lake Storage Gen2.
    5. Haga clic en Revisar + crear.
    6. Haga clic en Crear

Para obtener más información sobre otras opciones durante la creación de la cuenta de almacenamiento, consulte Inicio rápido: Creación de una cuenta de almacenamiento para Azure Data Lake Storage Gen2.

Screenshot showing storage account creation in the Azure portal.

Configuración de permisos para la identidad administrada en Data Lake Storage Gen2

Asigne la identidad administrada al rol Propietario de datos de Storage Blob en la cuenta de almacenamiento.

  1. En Azure Portal, vaya a la cuenta de almacenamiento.

  2. Seleccione Access Control (IAM) .

  3. Seleccione Agregar > Agregar asignación de roles.

    Screenshot showing Access control (IAM) page with Add role assignment menu open.

  4. En la pestaña Rol, seleccione Propietario de datos de Storage Blob.

    Screenshot showing Add role assignment page with Role tab selected.

  5. En la pestaña Miembros, seleccione Identidad administrada y, a continuación, seleccione Seleccionar miembros.

  6. Seleccione la suscripción, seleccione Identidad administrada asignada por el usuario y, por último, seleccione la identidad que desee.

  7. En la pestaña Revisión y asignación, seleccione Revisión y asignación para asignar el rol.

    La identidad asignada por el usuario que seleccionó ahora aparece en el rol seleccionado.

    Para más información sobre las asignaciones de roles, consulte Asignación de roles de Azure mediante Azure Portal.

  8. Una vez completada la configuración inicial, puede crear un clúster a través del portal. El clúster debe estar en la misma región de Azure que la cuenta de almacenamiento. En la pestaña Almacenamiento del menú de creación del clúster, seleccione las siguientes opciones:

    • En Tipo de almacenamiento principal, haga clic en Azure Data Lake Storage Gen2.

    • En Cuenta de almacenamiento principal, busque y seleccione la cuenta de almacenamiento recién creada con Data Lake Storage Gen2.

    • En Identidad, seleccione la identidad administrada asignada por el usuario recién creada.

      Storage settings for using Data Lake Storage Gen2 with Azure HDInsight.

    Nota:

    • Para agregar una cuenta secundaria con Data Lake Storage Gen2 en el nivel de cuenta de almacenamiento, basta con asignar la identidad administrada que ha creado anteriormente a la nueva de Data Lake Storage Gen2 que quiere agregar. Tenga en cuenta que no se admite la adición de una cuenta de almacenamiento secundaria de Data Lake Storage Gen2 mediante la hoja "Cuentas de almacenamiento adicionales" en HDInsight.
    • Puede habilitar RA-GRS o RA-ZRS en la cuenta de Azure Blob Storage que usa HDInsight. Sin embargo, no se admite la creación de un clúster en el punto de conexión secundario RA-GRS o RA-ZRS.
    • HDInsight no admite la configuración de Data Lake Storage Gen2 como almacenamiento con redundancia de zona geográfica con acceso de lectura (RA-GZRS) o almacenamiento con redundancia de zona geográfica (GZRS).

Eliminación del clúster

Consulte Eliminación de un clúster de HDInsight con el explorador, PowerShell o la CLI de Azure.

Solución de problemas

Si experimenta problemas con la creación de clústeres de HDInsight, consulte los requisitos de control de acceso.

Pasos siguientes

Ha creado correctamente un clúster de HDInsight. Ahora puede aprender a trabajar con el clúster.

Clústeres de Apache Spark

Clústeres de Apache Hadoop

Clústeres de Apache HBase