Condividi tramite


Configurare gli endpoint del flusso di dati per Azure Data Lake Storage Gen2

Importante

Questa pagina include istruzioni per la gestione dei componenti di Operazioni IoT di Azure usando i manifesti di distribuzione kubernetes, disponibile in anteprima. Questa funzionalità viene fornita con diverse limitazioni e non deve essere usata per i carichi di lavoro di produzione.

Vedere le Condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure per le condizioni legali applicabili alle funzionalità di Azure in versione beta, in anteprima o non ancora rilasciate nella disponibilità generale.

Inviare dati ad Azure Data Lake Storage Gen2 nelle operazioni di Azure IoT configurando un endpoint del flusso di dati. Questa configurazione consente di specificare l'endpoint di destinazione, il metodo di autenticazione, la tabella e altre impostazioni.

Prerequisiti

Assegnare l'autorizzazione all'identità gestita

Per configurare un endpoint del flusso di dati per Azure Data Lake Storage Gen2, usare un'identità gestita assegnata dall'utente o assegnata dal sistema. Questo approccio è sicuro e rimuove la necessità di gestire manualmente le credenziali.

Dopo aver creato Azure Data Lake Storage Gen2, è necessario assegnare un ruolo all'identità gestita di Operazioni di Azure IoT che concede l'autorizzazione per la scrittura nell'account di archiviazione.

Se si usa un'identità gestita assegnata dal sistema, nel portale di Azure passare all'istanza di Operazioni IoT di Azure e selezionare Panoramica. Copiare il nome dell'estensione elencata dopo l'estensione Azure IoT Operations Arc. Ad esempio, azure-iot-operations-xxxx7. L'identità gestita assegnata dal sistema può essere trovata utilizzando lo stesso nome dell'estensione Arc di Operazioni di Azure IoT.

Passare quindi all'account di archiviazione di Azure >Controllo di accesso (IAM)>Aggiungi assegnazione ruolo.

  1. Nella scheda Ruolo selezionare un ruolo appropriato, ad esempio Storage Blob Data Contributor. In questo modo, l'identità gestita dispone delle autorizzazioni necessarie per scrivere nei contenitori BLOB Archiviazione di Azure. Per altre informazioni, vedere Autorizzare l'accesso ai BLOB usando Microsoft Entra ID.
  2. Nella scheda Membri :
    1. Se si usa un'identità gestita assegnata dal sistema, per Assegna accesso a, selezionare Utente, gruppo o entità servizio, quindi selezionare + Seleziona membri e cercare il nome dell'estensione Azure IoT Operations Arc.
    2. Se si usa un'identità gestita assegnata dall'utente, per Assegna accesso a, selezionare Identità gestita, quindi selezionare + Seleziona membri e cercare l'identità gestita assegnata dall'utente configurata per le connessioni cloud.

Creare un endpoint del flusso di dati per Azure Data Lake Storage Gen2

  1. Nel portale di Operazioni IoT selezionare la scheda Endpoint flusso di dati.

  2. In Crea nuovo endpoint del flusso di dati selezionare Azure Data Lake Storage (seconda generazione)>Nuovo.

    Screenshot che mostra come utilizzare l'esperienza operativa per creare un nuovo endpoint del flusso di dati ADLS V2.

  3. Immettere le impostazioni seguenti per l'endpoint:

    Impostazione Descrizione
    Nome Nome dell'endpoint del flusso di dati.
    Padrone di casa / Ospitante / Conduttore (depending on the intended context) Nome host dell'endpoint di Azure Data Lake Storage Gen2 nel formato <account>.blob.core.windows.net. Sostituire il segnaposto dell'account con il nome dell'account endpoint.
    Metodo di autenticazione Metodo utilizzato per l'autenticazione. È consigliabile scegliere Identità gestita assegnata dal sistema o identità gestita assegnata dall'utente.
    ID client ID client dell'identità gestita assegnata dall'utente. Obbligatorio se si usa l'identità gestita assegnata dall'utente.
    ID tenant ID tenant dell'identità gestita assegnata dall'utente. Obbligatorio se si usa l'identità gestita assegnata dall'utente.
    Nome segreto sincronizzato Nome di riferimento per il segreto nelle impostazioni del punto finale del flusso di dati e nel cluster Kubernetes. Obbligatorio se si usa il token di accesso.
    Nome del segreto del token di accesso Nome del segreto Kubernetes contenente il token di firma di accesso condiviso. Obbligatorio se si usa il token di accesso.
  4. Selezionare Applica per effettuare il provisioning dell'endpoint.

Utilizzare l'autenticazione con token di accesso

Seguire la procedura descritta nella sezione token di accesso per ottenere un token di firma di accesso condiviso per l'account di archiviazione e archiviarlo in un segreto Kubernetes.

Creare quindi la risorsa DataflowEndpoint e specificare il metodo di autenticazione del token di accesso. In questo caso sostituire <SAS_SECRET_NAME> con il nome del segreto contenente il token di firma di accesso condiviso e altri valori segnaposto.

Vedere la sezione token di accesso per i passaggi per creare un segreto nell'interfaccia utente Web dell'esperienza operativa.

Metodi di autenticazione disponibili

Per gli endpoint di Azure Data Lake Storage Gen2 sono disponibili i metodi di autenticazione seguenti.

Identità gestita assegnata dal sistema

Prima di configurare l'endpoint del flusso di dati, assegnare un ruolo all'identità gestita di Operazioni di Azure IoT che concede l'autorizzazione per la scrittura nell'account di archiviazione:

  1. Nel portale di Azure passare all'istanza di Operazioni IoT di Azure e selezionare Panoramica.
  2. Copiare il nome dell'estensione elencata dopo l'estensione Azure IoT Operations Arc. Ad esempio, azure-iot-operations-xxxx7.
  3. Passare alla risorsa cloud necessaria per concedere le autorizzazioni. Ad esempio, vai all'account di archiviazione di Azure >, Controllo di accesso (IAM)>, Aggiungi un'assegnazione di ruolo.
  4. Nella scheda Ruolo selezionare un ruolo appropriato.
  5. Nella scheda Membri , per Assegna accesso a, selezionare l'opzione Utente, gruppo o entità servizio , quindi selezionare + Seleziona membri e cercare l'identità gestita di Operazioni IoT di Azure. Ad esempio, azure-iot-operations-xxxx7.

Quindi, configurare l'endpoint del flusso di dati con le impostazioni di identità gestite assegnate dal sistema.

Nella pagina delle impostazioni dell'endpoint del flusso di dati dell'esperienza operativa, selezionare la scheda Basic e quindi scegliere Metodo di autenticazione>Identità gestita assegnata dal sistema.

Nella maggior parte dei casi, non è necessario specificare un gruppo di destinatari del servizio. Se non si specifica un gruppo di destinatari, viene creata un'identità gestita con l'ambito del gruppo di destinatari predefinito con l'account di archiviazione.

Se si ha la necessita di eseguire l'override del gruppo di destinatari dell'identità gestita assegnata dal sistema, è possibile specificare l'impostazione audience.

Nella maggior parte dei casi, non è necessario specificare un gruppo di destinatari del servizio. Se non si specifica un gruppo di destinatari, viene creata un'identità gestita con l'ambito del gruppo di destinatari predefinito con l'account di archiviazione.

Identità gestita assegnata dall'utente

Per utilizzare l'identità gestita assegnata dall'utente per l'autenticazione, è prima necessario distribuire Operazioni di Azure IoT con le impostazioni di sicurezza abilitate. È quindi necessario configurare un'identità gestita assegnata dall'utente per le connessioni cloud. Per altre informazioni, vedere Abilitare le impostazioni sicure nella distribuzione di Operazioni IoT di Azure.

Prima di configurare l'endpoint del flusso di dati, assegnare un ruolo all'identità gestita assegnata dall'utente che concede l'autorizzazione per la scrittura nell'account di archiviazione:

  1. Nel portale di Azure passare alla risorsa cloud necessaria per concedere le autorizzazioni. Ad esempio, vai all'account di archiviazione di Azure >, Controllo di accesso (IAM)>, Aggiungi un'assegnazione di ruolo.
  2. Nella scheda Ruolo selezionare un ruolo appropriato.
  3. Nella scheda Membri selezionare l'opzione Identità gestita per Assegnare l'accesso, quindi selezionare + Seleziona membri e cercare l'identità gestita assegnata dall'utente.

Quindi, configurare l'endpoint del flusso di dati con le impostazioni delle identità gestite assegnate dall'utente.

Nella pagina impostazioni dell'endpoint del flusso di dati dell'esperienza operativa, selezionare la scheda Di base, quindi scegliere Metodo di autenticazione>Identità gestita assegnata dall'utente.

Immettere l'ID client dell'identità gestita assegnata dall'utente e l'ID tenant nei campi appropriati.

In questo caso, l'ambito è facoltativo e la sua impostazione predefinita è https://storage.azure.com/.default. Per eseguire l'override dell'ambito predefinito, specificare l'impostazione scope tramite il manifesto Bicep o Kubernetes.

Token di accesso

L'uso di un token di accesso è un metodo di autenticazione alternativo. Questo metodo richiede di creare un Kubernetes secret con il SAS token e riferirsi al secret nella risorsa DataflowEndpoint.

Ottieni un token SAS per un account Azure Data Lake Storage Gen2 (ADLSv2). Ad esempio, utilizzare il portale di Azure per passare all'account di archiviazione. Nel menu a sinistra scegliere Sicurezza e rete>Firma di accesso condiviso. Utilizzare la tabella seguente per impostare le autorizzazioni necessarie.

Parametro Impostazione abilitata
Servizi consentiti BLOB
Tipi di risorse consentiti Oggetto, contenitore
Autorizzazioni consentite Lettura, scrittura, eliminazione, elenco, creazione

Per migliorare la sicurezza e seguire il principio dei privilegi minimi, è possibile generare un token di firma di accesso condiviso per un contenitore specifico. Per evitare errori di autenticazione, assicurarsi che il contenitore specificato nel token di firma di accesso condiviso corrisponda all'impostazione di destinazione del flusso di dati nella configurazione.

Importante

Per usare l'interfaccia utente Web dell'esperienza operativa per gestire i segreti, le operazioni di Azure IoT devono prima essere abilitate con impostazioni sicure configurando un insieme di credenziali delle chiavi di Azure e abilitando le identità del carico di lavoro. Per altre informazioni, vedere Abilitare le impostazioni sicure nella distribuzione di Operazioni IoT di Azure.

Nella pagina impostazioni dell'endpoint del flusso di dati dell'esperienza operativa, selezionare la scheda Di base e quindi scegliere Metodo di autenticazione>Token di accesso.

Qui, sotto Nome segreto sincronizzato, immettere un nome per il segreto. Questo nome viene utilizzato per fare riferimento al segreto nelle impostazioni dell'endpoint del flusso di dati e corrisponde al nome del segreto archiviato nel cluster Kubernetes.

Quindi, in Nome segreto token di accesso selezionare Aggiungi riferimento per aggiungere il segreto da Azure Key Vault. Nella pagina successiva selezionare il segreto da Azure Key Vault con Aggiungi da Azure Key Vault o Crea nuovo segreto.

Se si seleziona Crea nuovo, immettere le impostazioni seguenti:

Impostazione Descrizione
Nome segreto Nome del segreto in Azure Key Vault. Selezionare un nome facile da ricordare per selezionare il segreto in un secondo momento dall'elenco.
Valore segreto Token di firma di accesso condiviso nel formato 'sv=2022-11-02&ss=b&srt=c&sp=rwdlax&se=2023-07-22T05:47:40Z&st=2023-07-21T21:47:40Z&spr=https&sig=<signature>'.
Impostare la data di attivazione Se attivata, data in cui il segreto diventa attivo.
Impostare la data di scadenza Se attivata, data di scadenza del segreto.

Per altre informazioni sui segreti, vedere Creare e gestire segreti nelle operazioni IoT di Azure.

Impostazioni avanzate

È possibile impostare impostazioni avanzate per l'endpoint di Azure Data Lake Storage Gen2, ad esempio la latenza di invio in batch e il numero di messaggi.

Utilizzare le impostazioni batching per configurare il numero massimo di messaggi e la latenza massima prima che i messaggi vengano inviati alla destinazione. Questa impostazione è utile quando si voglia ottimizzare la larghezza di banda di rete e ridurre il numero di richieste alla destinazione.

Campo Descrizione Obbligatoria
latencySeconds Numero massimo di secondi di attesa prima dell'invio dei messaggi alla destinazione. Il valore predefinito è 60 secondi. NO
maxMessages Numero massimo di messaggi da inviare alla destinazione. Il valore predefinito è di 100000 messaggi. NO

Ad esempio, per impostare il numero massimo di messaggi su 1000 e la latenza massima su 100 secondi, utilizzare le impostazioni seguenti:

Nell'esperienza operativa selezionare la scheda Avanzate per l'endpoint del flusso di dati.

Screenshot che usa l'esperienza operativa per impostare le impostazioni avanzate di ADLS V2.

Passaggi successivi