Herramientas de ingesta de datos de Data Science Virtual Machine
En una fase temprana de un proyecto de ciencia de datos o inteligencia artificial, debe identificar los conjuntos de datos necesarios y, a continuación, incorporarlos a su entorno de análisis. Data Science Virtual Machine (DSVM) proporciona herramientas y bibliotecas para incorporar datos de diferentes orígenes a recursos de almacenamiento de datos analíticos locales en DSVM. DSVM también puede incorporar datos a una plataforma de datos ubicada en la nube o en el entorno local.
DSVM ofrece estas herramientas de movimiento de datos:
CLI de Azure
Category | Value |
---|---|
¿Qué es? | Una herramienta de administración para Azure. Ofrece verbos de comando para mover datos de plataformas de datos de Azure, por ejemplo, Azure Blob Storage y Azure Data Lake Store |
Versiones de DSVM compatibles | Windows, Linux |
Usos típicos | Importar y exportar datos entre Azure Storage y Azure Data Lake Store |
¿Cómo se usa o ejecuta? | Abra un símbolo del sistema y escriba az para obtener ayuda. |
Vínculos a ejemplos | Uso de la CLI de Azure |
AzCopy
Category | Value |
---|---|
¿Qué es? | Una herramienta para copiar datos entre archivos locales, Azure Blob Storage, archivos y tablas |
Versiones de DSVM compatibles | Windows |
Usos típicos | Copiar archivos en Azure Blob Storage Copia de blobs entre cuentas |
¿Cómo se usa o ejecuta? | Abra un símbolo del sistema y escriba azcopy para obtener ayuda. |
Vínculos a ejemplos | AzCopy en Windows |
Herramienta de migración de datos de Azure Cosmos DB
Category | Value |
---|---|
¿Qué es? | Herramienta para importar datos de varios orígenes en Azure Cosmos DB; una base de datos NoSQL en la nube. Estos orígenes incluyen archivos JSON Archivos CSV SQL MongoDB Azure Table Storage Amazon DynamoDB Colecciones de Azure Cosmos DB for NoSQL |
Versiones de DSVM compatibles | Windows |
Usos típicos | Importar archivos desde una máquina virtual a Azure Cosmos DB importar datos de Azure Table Storage a Azure Cosmos DB importar datos de una base de datos de Microsoft SQL Server a Azure Cosmos DB |
¿Cómo se usa o ejecuta? | Para usar la versión de línea de comandos, abra un símbolo del sistema y escriba dt . Para usar la herramienta de la interfaz gráfica de usuario, abra un símbolo del sistema y escriba dtui |
Vínculos a ejemplos | Importación de datos a Azure Cosmos DB |
Explorador de Azure Storage
Category | Value |
---|---|
¿Qué es? | Interfaz gráfica de usuario para interactuar con los archivos almacenados en la nube de Azure |
Versiones de DSVM compatibles | Windows |
Usos típicos | Importar y exportar datos desde DSVM |
¿Cómo se usa o ejecuta? | Busque "Explorador de Azure Storage" en el menú Inicio |
Vínculos a ejemplos | Explorador de Azure Storage |
BCP
Category | Value |
---|---|
¿Qué es? | Herramienta de SQL Server para copiar datos entre SQL Server y un archivo de datos |
Versiones de DSVM compatibles | Windows |
Usos típicos | Importar un archivo CSV en una tabla de SQL Server Exportar una tabla de SQL Server a un archivo |
¿Cómo se usa o ejecuta? | Abra un símbolo del sistema y escriba bcp para obtener ayuda |
Vínculos a ejemplos | Utilidad bcp |
blobfuse
Category | Value |
---|---|
¿Qué es? | Una herramienta para montar un contenedor de Azure Blob Storage en el sistema de archivos de Linux |
Versiones de DSVM compatibles | Linux |
Usos típicos | Leer y escribir en blobs de un contenedor |
¿Cómo se usa y cómo se ejecuta? | Ejecute blobfuse en un terminal |
Vínculos a ejemplos | blobfuse en GitHub |