Condividi tramite


Preparare i dati e caricarli nell'account Archiviazione

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse Rilevamento anomalie. Il servizio Rilevamento anomalie viene ritirato il 1° ottobre 2026.

Il rilevamento anomalie multivariate richiede il training per elaborare i dati e un account Archiviazione di Azure per archiviare i dati per ulteriori passaggi di training e inferenza.

Preparazione dei dati

Prima di tutto è necessario preparare i dati per il training e l'inferenza.

Schema dei dati di input

Il rilevamento anomalie multivariato supporta due tipi di schemi di dati: OneTable e MultiTable. È possibile usare uno di questi schemi per preparare i dati e caricarli in Archiviazione Account per un ulteriore training e inferenza.

Diagram of two data schemas with three steps: data preparation, training, inference.

Schema 1: OneTable

OneTable è un file CSV che contiene tutte le variabili che si desidera eseguire il training di un modello rilevamento anomalie multivariato e una timestamp colonna. Scaricare i dati di esempio di una tabella

  • I valori devono essere conformi a ISO 8601. I timestamp valori di altre variabili in altre colonne possono essere numeri interi o decimali con un numero qualsiasi di posizioni decimali.

  • Le variabili per il training e le variabili per l'inferenza devono essere coerenti. Ad esempio, se si usa series_1, series_2, series_3, series_4e series_5 per il training, è necessario fornire esattamente le stesse variabili per l'inferenza.

    Esempio:

Diagram of one table schema.

Schema 2: MultiTable

MultiTable è costituito da più file CSV in una cartella di file e ogni file CSV contiene solo due colonne di una variabile, con i nomi esatti delle colonne: timestamp e valore. Scaricare i dati di esempio di più tabelle e decomprimerli.

  • I timestamp valori devono essere conformi a ISO 8601. value I valori possono essere numeri interi o decimali con un numero qualsiasi di cifre decimali .

  • Il nome del file CSV verrà usato come nome della variabile e deve essere univoco. Ad esempio, temperature.csv e humidity.csv.

  • Le variabili per il training e le variabili per l'inferenza devono essere coerenti. Ad esempio, se si usa series_1, series_2, series_3, series_4e series_5 per il training, è necessario fornire esattamente le stesse variabili per l'inferenza.

    Esempio:

Diagram of multi table schema.

Nota

Se i timestamp hanno ore, minuti e/o secondi, assicurarsi che vengano arrotondati correttamente prima di chiamare le API. Ad esempio, se la frequenza dei dati dovrebbe essere un punto dati ogni 30 secondi, ma vengono visualizzati timestamp come "12:00:01" e "12:00:28", è un segnale forte che è consigliabile pre-elaborare i timestamp in nuovi valori come "12:00:00" e "12:00:30". Per informazioni dettagliate, vedere la sezione "Timestamp round-up" nel documento sulle procedure consigliate.

Caricare i dati nell'account Archiviazione

Dopo aver preparato i dati con uno dei due schemi precedenti, è possibile caricare il file CSV (OneTable) o la cartella dati (MultiTable) nell'account Archiviazione.

  1. Creare un account Archiviazione, compilare i campi, che sono simili ai passaggi durante la creazione di Rilevamento anomalie risorsa.

    Screenshot of Azure Storage account setup page.

  2. Selezionare Contenitore a sinistra nella risorsa account Archiviazione e selezionare +Contenitore per crearne uno che archivierà i dati.

  3. Caricare i dati nel contenitore.

    Caricare i dati di OneTable

    Passare al contenitore creato e selezionare Carica, quindi scegliere il file CSV preparato e caricare.

    Dopo aver caricato i dati, selezionare il file CSV e copiare l'URL del BLOB tramite il piccolo pulsante blu. Incollare l'URL in un punto pratico per ulteriori passaggi.

    Screenshot of copy blob url for one table.

    Caricare dati multitable

    Passare al contenitore creato e selezionare Carica, quindi selezionare Avanzate e avviare un nome di cartella in Carica nella cartella e selezionare tutte le variabili in file CSV separati e caricare.

    Dopo aver caricato i dati, passare alla cartella e selezionare un file CSV nella cartella, copiare l'URL del BLOB e mantenere la parte solo prima del nome del file CSV, quindi l'URL del BLOB finale deve collegarsi alla cartella. Incollare l'URL in un punto pratico per ulteriori passaggi.

    Screenshot of copy blob url for multi table.

  4. Concedere Rilevamento anomalie accesso per leggere i dati nell'account Archiviazione.

    • Nel contenitore selezionare Controllo di accesso(IAM) a sinistra, selezionare + Aggiungi per aggiungere un'assegnazione di ruolo. Se viene visualizzata la disabilitazione dell'assegnazione di ruolo, contattare il proprietario dell'account Archiviazione per aggiungere il ruolo proprietario al contenitore.

    Screenshot of set access control UI.

    • Cercare e selezionare il ruolo di lettore di dati BLOB Archiviazione e quindi selezionare Avanti. Tecnicamente, i ruoli evidenziati di seguito e il ruolo Proprietario dovrebbero funzionare tutti.

    Screenshot of add role assignment with reader roles selected.

    • Selezionare Assegna accesso all'identità gestita e Seleziona membri, quindi scegliere la risorsa rilevamento anomalie creata in precedenza, quindi selezionare Rivedi e assegna.

Passaggi successivi