Instalación de aplicaciones de Apache Hadoop de terceros en Azure HDInsight

Aprenda a instalar una aplicación de Apache Hadoop de terceros en Azure HDInsight. Para obtener instrucciones sobre cómo instalar su propia aplicación, consulte Instalación de aplicaciones de HDInsight personalizadas.

Una aplicación de HDInsight es una aplicación que los usuarios pueden instalar en un clúster de HDInsight. Estas aplicaciones puede desarrollarlas Microsoft, fabricantes de software independientes (ISV) o el propio usuario.

En la lista siguiente se muestran las aplicaciones publicadas:

Application Tipos de clúster Descripción
Plataforma de inteligencia AtScale Hadoop AtScale convierte el clúster de HDInsight en un servidor OLAP de escalabilidad horizontal, lo que permite consultar miles de millones de filas de datos de forma interactiva mediante las herramientas de inteligencia empresarial que ya conoce, posee y prefiere: desde Microsoft Excel, Power BI o Tableau Software hasta QlikView.
Datameer Hadoop La plataforma escalable de autoservicio de Datameer para preparar, explorar y administrar los datos para el análisis acelera la conversión de datos complejos de varios orígenes en información empresarial valiosa, con una entrega más rápida e inteligente de información detallada a escala empresarial.
Dataiku DSS en HDInsight Hadoop, Spark Dataiku DSS en una plataforma de ciencia de datos empresariales que permite a científicos y analistas de datos colaborar para diseñar y ejecutar nuevos servicios y productos de datos de forma más eficaz, con el fin de convertir los datos sin procesar en predicciones de gran impacto.
WANdisco Fusion HDI App Hadoop, Spark, HBase, Kafka El mantenimiento de la coherencia de los datos en un entorno distribuido es un desafío de las operaciones de datos masivos. WANdisco Fusion, una plataforma de software de nivel empresarial, soluciona este problema mediante la habilitación de la coherencia de datos no estructurados en cualquier entorno.
H2O SparklingWater para HDInsight Spark H2O Sparkling Water admite los siguientes algoritmos distribuidos: GLM, Naïve Bayes, Distributed Random Forest, Gradient Boosting Machine, Deep Neural Networks, Deep learning, K-means, PCA, Generalized Low Rank Models, Anomaly Detection, Autoencoders.
Striim para la integración de datos en tiempo real en HDInsight Hadoop, HBase, Spark, Kafka Striim es una plataforma de inteligencia e integración de datos de streaming de un extremo a otro que permite la ingesta continua, el procesamiento y el análisis de flujos de datos dispares.
Jumbune Enterprise: aceleración de análisis de macrodatos Hadoop, Spark A nivel general, Jumbune ayuda a las empresas mediante, 1. la aceleración del rendimiento de cargas de trabajo Hive, Java, Scala basadas en Tez, MapReduce y el motor de Spark; 2. la supervisión proactiva de clústeres de Hadoop; y 3. el establecimiento de administración de calidad de los datos en sistemas de archivos distribuidos.
Kyligence Enterprise Hadoop, HBase, Spark Con tecnología de Apache Kylin, Kyligence Enterprise permite la inteligencia empresarial sobre macrodatos. Como un motor OLAP empresarial en Hadoop, Kyligence Enterprise permite a los analistas empresariales diseñar una arquitectura de inteligencia empresarial en Hadoop con metodologías de inteligencia empresarial y almacenamiento de datos estándar del sector.
StreamSets Data Collector para HDInsight en la nube Hadoop, HBase, Spark, Kafka StreamSets Data Collector es un motor ligero y eficaz que transmite datos en tiempo real. Puede usar Data Collector para enrutar y procesar los datos de los flujos de datos. Incluye una licencia de prueba de 30 días.
Trifacta Wrangler Enterprise Hadoop, Spark, HBase Trifacta Wrangler Enterprise para HDInsight admite la limpieza y transformación de datos en toda la empresa para cualquier escala de datos. El costo de ejecutar Trifacta en Azure es una combinación de los costos de suscripción de Trifacta más los costos de infraestructura de Azure para las máquinas virtuales.
Plataforma de datos Unifi Hadoop, HBase, Spark Unifi Data Platform es un conjunto de herramientas de datos de autoservicio perfectamente integrado diseñado para permitir que el usuario de una empresa afronte los desafíos de datos que impulsan ingresos incrementales y reducen los costos o la complejidad operativa.

Para las instrucciones proporcionadas en este artículo se usa Azure Portal. También puede exportar la plantilla de Azure Resource Manager desde el portal u obtener una copia de dicha plantilla de proveedores y usar Azure PowerShell y la CLI de Azure clásica para implementarla. Consulte Creación de clústeres de Apache Hadoop en HDInsight con plantillas de Resource Manager.

Prerrequisitos

Si desea instalar aplicaciones de HDInsight en un clúster de HDInsight existente, debe tener un clúster de HDInsight. Para crearlo, consulte Crear clúster. También puede instalar aplicaciones de HDInsight al crear un clúster de HDInsight.

Instalación de aplicaciones en clústeres existentes

En el siguiente procedimiento, se muestra cómo instalar aplicaciones de HDInsight en un clúster de HDInsight existente.

Instalación de una aplicación HDInsight

  1. Inicie sesión en Azure Portal.

  2. Desde el menú de la izquierda, vaya a Todos los servicios>Analytics>HDInsight clusters (Clústeres de HDInsight).

  3. Seleccione un clúster de HDInsight de la lista. Si no tiene ninguno, debe crearlo primero. Consulte Crear clúster.

  4. En la categoría Configuración, seleccione Aplicaciones. Puede ver una lista de las aplicaciones instaladas en la ventana principal.

    HDInsight applications portal menu.

  5. Seleccione +Agregar en el menú. Verá una lista de las aplicaciones disponibles. Si +Agregar está atenuado, significa que no hay aplicaciones para esta versión del clúster de HDInsight.

    HDInsight applications available applications.

  6. Seleccione una de las aplicaciones disponibles y siga las instrucciones para aceptar los términos legales.

En las notificaciones del portal puede ver el estado de la instalación (seleccione el icono de campana de la parte superior del portal). Una vez instalada la aplicación, aparece en la lista de aplicaciones instaladas.

Instalación de aplicaciones durante la creación del clúster

Tiene la opción de instalar aplicaciones de HDInsight al crear un clúster. Durante el proceso, se instalan aplicaciones de HDInsight una vez que se haya creado el clúster y se encuentre en ejecución. Para instalar aplicaciones durante la creación del clúster mediante Azure Portal, en la pestaña Configuración y precios, seleccione + Agregar aplicación.

Azure portal cluster configuration applications.

Lista de las aplicaciones de HDInsight instaladas y sus propiedades

El portal muestra una lista de las aplicaciones de HDInsight instaladas para un clúster y las propiedades de cada una.

Lista de las aplicaciones de HDInsight y visualización de sus propiedades

  1. Inicie sesión en Azure Portal.

  2. Desde el menú de la izquierda, vaya a Todos los servicios>Analytics>HDInsight clusters (Clústeres de HDInsight).

  3. Seleccione un clúster de HDInsight de la lista.

  4. En la categoría Configuración, seleccione Aplicaciones. Puede ver una lista de las aplicaciones instaladas en la ventana principal.

    HDInsight applications installed apps.

  5. Seleccione una de las aplicaciones instaladas para mostrar la propiedad. En la propiedad se indican los siguientes elementos:

    Propiedad Descripción
    Nombre de la aplicación Nombre de la aplicación.
    Estado Estado de la aplicación.
    Página web la dirección URL de la aplicación web que ha implementado en el nodo perimetral. La credencial coincide con las credenciales de usuario HTTP que ha configurado para el clúster.
    Punto de conexión SSH puede usar SSH para conectarse al nodo perimetral. Las credenciales de SSH coinciden con las credenciales de usuario SSH que ha configurado para el clúster. Para más información, consulte Uso de SSH con HDInsight.
    Descripción Descripción de la aplicación.
  6. Para eliminar una aplicación, haga clic con el botón derecho en ella y haga clic en Eliminar en el menú contextual.

Conexión con el nodo perimetral

Puede conectar con el nodo perimetral mediante HTTP y SSH. Encontrará la información de punto de conexión en el portal. Para más información, consulte Uso de SSH con HDInsight.

Las credenciales del punto de conexión HTTP son las credenciales de usuario HTTP configuradas para el clúster de HDInsight. Las credenciales del punto de conexión SSH son las credenciales SSH configuradas para el clúster de HDInsight.

Solución de problemas

Consulte Solución de problemas de instalación.

Pasos siguientes