Configurare cataloghi
Nota
Azure HDInsight su AKS verrà ritirato il 31 gennaio 2025. Prima del 31 gennaio 2025, sarà necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare interruzioni improvvise dei carichi di lavoro. I cluster rimanenti nella sottoscrizione verranno arrestati e rimossi dall’host.
Solo il supporto di base sarà disponibile fino alla data di ritiro.
Importante
Questa funzionalità è attualmente disponibile solo in anteprima. Le Condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure includono termini legali aggiuntivi che si applicano a funzionalità di Azure in versione beta, in anteprima o in altro modo non ancora disponibili a livello generale. Per informazioni su questa anteprima specifica, vedere Informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguire Microsoft per altri aggiornamenti nella Community di Azure HDInsight.
Ogni cluster Trino viene fornito per impostazione predefinita con alcuni cataloghi: system, tpcds, tpch
. È possibile aggiungere cataloghi personalizzati allo stesso modo in cui si farebbe con il software open source Trino.
Inoltre, Trino con HDInsight su AKS consente di archiviare i segreti in Key Vault in modo da non doverli specificare in modo esplicito nel modello di Resource Manager.
È possibile aggiungere un nuovo catalogo aggiornando il modello di Resource Manager del cluster, ad eccezione del catalogo hive, che è possibile aggiungere durante la creazione del cluster Trino nel portale di Azure.
In questo articolo viene illustrato come aggiungere un nuovo catalogo al cluster usando il modello di Resource Manager. Nell'esempio riportato in questo articolo vengono descritti i passaggi per l'aggiunta di cataloghi di SQL Server e Memoria.
Prerequisiti
- Cluster Trino operativo con HDInsight su AKS.
- Database SQL di Azure.
- L'accesso/password di Azure SQL server viene archiviato nei segreti di Key Vault e l’MSI assegnato dall'utente collegato al cluster Trino concede le autorizzazioni per leggerlo. Vedere Archiviare le credenziali in Key Vault e assegnare il ruolo a MSI.
- Creare il modello di Resource Manager per il cluster.
- Acquisire familiarità con la creazione e la distribuzione del modello di Resource Manager.
- Esaminare l'esempio del modello di Resource Manager del clusterarm-trino-catalog-sample.json completo.
Procedura per aggiungere il catalogo nel modello di Resource Manager
Collegare Key Vault e aggiungere segreti a
secretsProfile
nella proprietàclusterProfile
.In questo passaggio è necessario assicurarsi che Key Vault e i segreti siano configurati per il cluster Trino. Nell'esempio seguente le credenziali di SQL Server vengono archiviate nei segreti seguenti: trinotest-admin-user, trinotest-admin-pwd.
"secretsProfile": { "keyVaultResourceId": "/subscriptions/{USER_SUBSCRIPTION_ID}/resourceGroups/{USER_RESOURCE_GROUP}/providers/Microsoft.KeyVault/vaults/{USER_KEYVAULT_NAME}", "secrets": [ { "referenceName": "trinotest-admin-user", "keyVaultObjectName": "trinotest-admin-user", "type": "secret" }, { "referenceName": "trinotest-admin-pwd", "keyVaultObjectName": "trinotest-admin-pwd", "type": "secret" } ] },
Aggiungere cataloghi a
serviceConfigsProfiles
nella proprietàclusterProfile
.In questo passaggio è necessario aggiungere la configurazione del catalogo di Trino specifico al cluster. Nell'esempio seguente vengono configurati due cataloghi tramite i connettori di Memoria e SQL Server. La configurazione del catalogo può essere specificata in due modi diversi:
- Coppie chiave-valore nella sezione valori.
- Stringa singola nella proprietà del contenuto.
Il catalogo di Memoria viene definito tramite una coppia chiave-valore e quello del server SQL tramite un'opzione a stringa singola.
"serviceConfigsProfiles": [ { "serviceName": "trino", "configs": [ { "component": "catalogs", "files": [ { "fileName": "memory.properties", "values": { "connector.name": "memory", "memory.max-data-per-node": "128MB" } }, { "fileName": "trinotestdb1.properties", "content":"connector.name=sqlserver\nconnection-url=jdbc:sqlserver://server-name.database.windows.net:1433;database=db1;encrypt=true;trustServerCertificate=false;hostNameInCertificate=*.database.windows.net;loginTimeout=30;\nconnection-user=${SECRET_REF:trinotest-admin-user}\nconnection-password=${SECRET_REF:trinotest-admin-pwd}\n" }, ] } ] } ],
Proprietà
Proprietà Descrizione serviceName trino component Determina che la sezione di configurazione dei cataloghi debba essere "cataloghi". files Elenco dei file del catalogo di Trino da aggiungere al cluster. filename Elenco dei file del catalogo di Trino da aggiungere al cluster. content Stringa di escape json
da inserire nel file del catalogo di Trino. Questa stringa deve contenere tutte le proprietà del catalogo di Trino, che dipendono dal tipo di connettore usato. Per altre informazioni, vedere la documentazione del software open source Trino.${SECRET_REF:<referenceName>} Tag speciale per fare riferimento a un segreto da secretsProfile. Trino in fase di esecuzione recupera il segreto da Key Vault e lo sostituisce nella configurazione del catalogo. valori È possibile specificare la configurazione del catalogo usando la proprietà contenuto come stringa singola e coppie chiave-valore separate per ogni singola proprietà del catalogo di Trino, come illustrato per il catalogo di Memoria.
Distribuire il modello di Resource Manager aggiornato per riflettere le modifiche nel cluster. Informazioni su come distribuire un modello di Resource Manager.