Delen via


HDInsight-clusters instellen met een aangepaste Ambari-database

Apache Ambari vereenvoudigt het beheer en de bewaking van een Apache Hadoop-cluster. Ambari biedt een gebruiksvriendelijke webinterface en REST API. Ambari is opgenomen in HDInsight-clusters en wordt gebruikt om het cluster te bewaken en configuratiewijzigingen aan te brengen.

Bij het maken van een normaal cluster, zoals beschreven in andere artikelen, zoals clusters instellen in HDInsight, wordt Ambari geïmplementeerd in een S0 Azure SQL Database die wordt beheerd door HDInsight en niet toegankelijk is voor gebruikers.

Met de aangepaste Ambari DB-functie kunt u een nieuw cluster implementeren en Ambari instellen in een externe database die u beheert. De implementatie wordt uitgevoerd met een Azure Resource Manager-sjabloon. Deze functie heeft de volgende voordelen:

  • Aanpassing: u kiest de grootte en verwerkingscapaciteit van de database. Als u grote clusters hebt die intensieve workloads verwerken, kan een Ambari-database met lagere specificaties een knelpunt worden voor beheerbewerkingen.
  • Flexibiliteit: u kunt de database naar behoefte schalen om aan uw vereisten te voldoen.
  • Beheer: u kunt back-ups en beveiliging voor uw database beheren op een manier die past bij de vereisten van uw organisatie.

In de rest van dit artikel worden de volgende punten besproken:

  • vereisten voor het gebruik van de aangepaste Ambari DB-functie
  • de stappen die nodig zijn om een HDInsight-cluster in te richten met behulp van uw eigen externe database voor Apache Ambari

Vereisten voor aangepaste Ambari-databases

U kunt een aangepaste Ambari-database implementeren met alle clustertypen en -versies. Meerdere clusters kunnen niet dezelfde Ambari-database gebruiken.

De aangepaste Ambari-database heeft de volgende andere vereisten:

  • De naam van de database mag geen afbreekstreepjes of spaties bevatten
  • U moet een bestaande Azure SQL DB-server en -database hebben.
  • De database die u voor de Ambari-installatie opgeeft, moet leeg zijn. Er mogen geen tabellen in het standaard-dbo-schema staan.
  • De gebruiker die verbinding maakt met de database, moet SELECT, CREATE TABLE, INSERT, UPDATE, DELETE, ALTER ON SCHEMA en VERWIJZINGEN VOOR SCHEMA-machtigingen voor de database hebben.
GRANT CREATE TABLE TO newuser;
GRANT INSERT TO newuser;
GRANT SELECT TO newuser;
GRANT UPDATE TO newuser;
GRANT DELETE TO newuser;
GRANT ALTER ON SCHEMA::dbo TO newuser;
GRANT REFERENCES ON SCHEMA::dbo TO newuser;
  • Schakel de optie in om toegang tot Azure-services toe te staan op de server waarop u Ambari host.
  • Ip-adressen van de HDInsight-service voor beheer moeten zijn toegestaan in de firewallregel. Zie IP-adressen voor HDInsight-beheer voor een lijst met de IP-adressen die moeten worden toegevoegd aan de firewallregel op serverniveau.

Wanneer u uw Apache Ambari DB host in een externe database, moet u de volgende punten onthouden:

  • U bent verantwoordelijk voor de extra kosten van de Azure SQL DB die Ambari bevat.
  • Maak periodiek een back-up van uw aangepaste Ambari-database. Azure SQL Database genereert automatisch back-ups, maar het tijdsbestek voor het bewaren van back-ups varieert. Zie Meer informatie over automatische back-ups van SQL-database voor meer informatie.
  • Wijzig het aangepaste Ambari DB-wachtwoord niet nadat het HDInsight-cluster de status Actief heeft bereikt. Dit wordt niet ondersteund.

Clusters implementeren met een aangepaste Ambari-database

Als u een HDInsight-cluster wilt maken dat gebruikmaakt van uw eigen externe Ambari-database, gebruikt u de aangepaste Ambari DB-snelstartsjabloon.

Bewerk de parameters in het azuredeploy.parameters.json bestand om informatie op te geven over uw nieuwe cluster en de database die Ambari bevat.

U kunt de implementatie starten met behulp van de Azure CLI. Vervang <RESOURCEGROUPNAME> door de resourcegroep waar u het cluster wilt implementeren.

az deployment group create --name HDInsightAmbariDBDeployment \
    --resource-group <RESOURCEGROUPNAME> \
    --template-file azuredeploy.json \
    --parameters azuredeploy.parameters.json

Waarschuwing

Gebruik de volgende aanbevolen SQL DB- en Headnode-VM voor uw HDInsight-cluster. Gebruik geen standaard Ambari DB (S0) voor een productieomgeving.

Grootte van databases en hoofdknooppunten

De volgende tabel bevat richtlijnen voor de Azure SQL DB-laag die moet worden geselecteerd op basis van de grootte van uw HDInsight-cluster.

Aantal werkknooppunten Vereiste DB-laag Vereiste headnode-VM
<=4 S0 4 core/28 GB RAM of hoger
>4 && <=8 S1 4 core/28 GB RAM of hoger
>8 && <=16 S2 4 core/28 GB RAM of hoger
>16 && && <=32 S3 8 core/56 GB RAM of hoger
>32 && <=64 S4 8 core/56 GB RAM of hoger
>64 && <=128 P2 16 core/112 GB RAM of hoger
>128 Contact met ondersteuning Contact met ondersteuning

Volgende stappen