Datenerfassungstools für die Data Science-VM

Als einen der ersten technischen Schritte in einem Data Science- oder KI-Projekt müssen Sie die zu verwendenden Datasets bestimmen und diese in Ihre Analyseumgebung importieren. Die Data Science Virtual Machine (DSVM) stellt Tools und Bibliotheken bereit, um Daten aus verschiedenen Quellen lokal in einen analytischen Datenspeicher auf der DSVM oder Daten in eine cloudbasierte oder lokale Datenplattform zu importieren.

Nachstehend sind einige der Datenverschiebungstools aufgeführt, die in der DSVM verfügbar sind.

Azure CLI

Category Wert
Was ist das? Ein Verwaltungstool für Azure. Enthält auch Befehlsverben zum Verschieben von Daten aus Azure-Datenplattformen wie Azure-Blobspeicher und Azure Data Lake Store.
Unterstützte DSVM-Versionen Windows, Linux
Typische Verwendung Importieren und Exportieren von Daten in bzw. aus Azure Storage und Azure Data Lake Store.
Verwendung/Ausführung Öffnen Sie eine Eingabeaufforderung, und geben Sie az ein, um die Hilfe anzuzeigen.
Links zu Beispielen Verwenden der Azure-Befehlszeilenschnittstelle

AzCopy

Category Wert
Was ist das? Ein Tool zum Kopieren von Daten in lokale und aus lokalen Dateien sowie in und aus Azure-Blobspeicher, -Dateien und -Tabellen.
Unterstützte DSVM-Versionen Windows
Typische Verwendung Kopieren von Dateien in Azure-Blobspeicher und Kopieren von Blobs zwischen Konten.
Verwendung/Ausführung Öffnen Sie eine Eingabeaufforderung, und geben Sie azcopy ein, um die Hilfe anzuzeigen.
Links zu Beispielen AzCopy unter Windows

Azure Cosmos DB-Datenmigrationstool

-- --
Was ist das? Tool, mit dem Daten aus verschiedenen Quellen in Azure Cosmos DB importiert werden können, eine NoSQL-Datenbank in der Cloud. Zu diesen Quellen gehören JSON-Dateien, CSV-Dateien, SQL, MongoDB, Azure-Tabellenspeicher, Amazon DynamoDB und Azure Cosmos DB-SQL-API-Sammlungen.
Unterstützte DSVM-Versionen Windows
Typische Verwendung Importieren von Dateien von einem virtuellen Computer in CosmosDB, Importieren von Daten aus Azure-Tabellenspeicher in CosmosDB und Importieren von Daten aus einer Microsoft SQL Server-Datenbank in CosmosDB
Verwendung/Ausführung Öffnen Sie zum Verwenden der Befehlszeilenversion eine Eingabeaufforderung, und geben Sie dt ein. Öffnen Sie zum Verwenden des GUI-Tools eine Eingabeaufforderung, und geben Sie dtui ein.
Links zu Beispielen Importieren von Daten in Azure Cosmos DB mit der DocumentDB-API

Azure Storage-Explorer

Category Wert
Was ist das? Grafische Benutzeroberfläche für die Interaktion mit Dateien, die in der Azure-Cloud gespeichert sind.
Unterstützte DSVM-Versionen Windows
Typische Verwendung Importieren und Exportieren von Daten aus der DSVM.
Verwendung/Ausführung Suchen Sie im Startmenü nach „Azure Storage-Explorer“.
Links zu Beispielen Azure Storage-Explorer

bcp

Category Wert
Was ist das? SQL Server-Tool zum Kopieren von Daten zwischen SQL Server und einer Datendatei.
Unterstützte DSVM-Versionen Windows
Typische Verwendung Importieren einer CSV-Datei in eine SQL Server-Tabelle und Exportieren einer SQL Server-Tabelle in eine Datei.
Verwendung/Ausführung Öffnen Sie eine Eingabeaufforderung, und geben Sie bcp ein, um die Hilfe anzuzeigen.
Links zu Beispielen bcp-Hilfsprogramm

blobfuse

Category Wert
Was ist das? Ein Tool zum Einbinden eines Azure-Blobspeichercontainers in das Linux-Dateisystem.
Unterstützte DSVM-Versionen Linux
Typische Verwendung Lesen aus und Schreiben in Blobs in einem Container.
Verwenden und Ausführen Führen Sie blobfuse auf einem Terminal aus.
Links zu Beispielen blobfuse auf GitHub