Tutorial: Copia de datos a Azure Data Box Disk mediante SMB

Copia de datos a Azure Data Box

Importante

Azure Data Box ahora admite la asignación del nivel de acceso en el nivel de blob. Los pasos incluidos en este tutorial reflejan el proceso de copia de datos actualizado y son específicos de los blobs en bloques.

Si necesitas ayuda para determinar el nivel de acceso adecuado para tus datos de blobs de bloques, consulta la sección Determinar el nivel de acceso adecuado para blobs en bloques. Sigue los pasos que se incluyen en la sección Copia de datos en Azure Data Box para copiar los datos en el nivel de acceso adecuado.

La información contenida en esta sección se aplica a los pedidos realizados después del 1 de abril de 2024.

En este tutorial se describe cómo conectarse al equipo host y copiar datos desde él mediante la interfaz de usuario web local.

En este tutorial, aprenderá a:

  • Requisitos previos
  • Conexión a un dispositivo Data Box
  • Determinación del nivel de acceso adecuado para blobs en bloques
  • Copia de datos a un dispositivo Data Box

Requisitos previos

Antes de comenzar, asegúrese de que:

  1. Ha completado el Tutorial: Instalación de un dispositivo Azure Data Box.
  2. Ha recibido su dispositivo Data Box y el estado del pedido en el portal se actualiza a Delivered (Entregado).
  3. Tiene un equipo host con los datos que desea copiar en su dispositivo Data Box. El equipo host debe:
    • Ejecutar un sistema operativo admitido.
    • Estar conectado a una red de alta velocidad. Es muy recomendable tener una conexión de 10 GbE como mínimo. Si no hay disponible una conexión de 10 GbE, use un vínculo de datos de 1 GbE, pero las velocidades de copia serán afectadas.

Conexión a un dispositivo Data Box

En función de la cuenta de almacenamiento seleccionada, Data Box crea hasta:

  • Tres recursos compartidos para cada cuenta de almacenamiento asociada (GPv1 y GPv2).
  • Un recurso compartido para Premium Storage.
  • Un recurso compartido para una cuenta de almacenamiento de blobs, que contiene una carpeta para cada uno de los cuatro niveles de acceso.

En la tabla siguiente se identifican los nombres de los recursos compartidos de Data Box a los que puedes conectarte y el tipo de datos cargados en la cuenta de almacenamiento de destino. También identifica la jerarquía de recursos compartidos y directorios en los que se copian los datos de origen.

Tipo de almacenamiento Nombre del recurso compartido Entidad de primer nivel Entidad de segundo nivel Entidad de tercer nivel
Blob en bloques <storageAccountName>_BlockBlob <\accessTier> <\containerName> <\blockBlob>
Blob en páginas <\storageAccountName>_PageBlob <\containerName> <\pageBlob>
Almacenamiento de archivos <\storageAccountName>_AzFile <\fileShareName> <\file>

No puedes copiar archivos directamente en la carpeta raíz de ningún recurso compartido de Data Box. En su lugar, crea carpetas dentro del recurso compartido de Data Box en función de tu caso de uso.

Los blobs en bloques admiten la asignación de niveles de acceso en el nivel de archivo. Al copiar archivos en el recurso compartido de blobs en bloques, el procedimiento recomendado es agregar nuevas subcarpetas dentro del nivel de acceso adecuado. Después de crear nuevas subcarpetas, continúa agregando archivos a cada subcarpeta según corresponda.

Se crea un nuevo contenedor para cualquier carpeta que resida en la raíz del recurso compartido de blobs en bloques. Cualquier archivo dentro de esa carpeta se copia en el nivel de acceso predeterminado de la cuenta de almacenamiento como un blob en bloques.

Para obtener más información sobre los niveles de acceso de blob, consulta Niveles de acceso para datos de blob. Para obtener información más detallada sobre los procedimientos recomendados del nivel de acceso, consulta Procedimientos recomendados para usar niveles de acceso de blobs.

En la tabla siguiente se muestra la ruta de acceso UNC a los recursos compartidos en tu Data Box y la correspondiente dirección URL de la ruta de acceso de Azure Storage donde se cargan los datos. La dirección URL final de la ruta de acceso de Azure Storage se puede derivar a partir de la ruta de acceso UNC al recurso compartido.

Tipos de Azure Storage Recursos compartidos de Data Box
Blobs en bloques de Azure
  • Ruta de acceso UNC a recursos compartidos: \\<DeviceIPAddress>\<storageaccountname_BlockBlob>\<accessTier>\<ContainerName>\myBlob.txt
  • Dirección URL de Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.txt
  • Blobs en páginas de Azure
  • Ruta de acceso UNC a recursos compartidos: \\<DeviceIPAddress>\<storageaccountname_PageBlob>\<ContainerName>\myBlob.vhd
  • Dirección URL de Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.vhd
  • Azure Files
  • Ruta de acceso UNC a recursos compartidos: \\<DeviceIPAddress>\<storageaccountname_AzFile>\<ShareName>\myFile.txt
  • Dirección URL de Azure Storage: https://<storageaccountname>.file.core.windows.net/<ShareName>/myFile.txt
  • Si usa un equipo host Windows Server, realice los pasos siguientes para conectarse a su dispositivo Data Box.

    1. El primer paso es autenticarse e iniciar sesión. Vaya a Connect and copy (Conectar y copiar). Seleccione SMB para obtener las credenciales de acceso de los recursos compartidos asociados con la cuenta de almacenamiento.

      Obtención de las credenciales de recursos compartidos para recursos compartido de archivos SMB

    2. En el cuadro de diálogo Access share and copy data (Acceder al recurso compartido y copiar datos), copie los valores de Username (Nombre de usuario) y Password (Contraseña) del recurso compartido. Después, seleccione Aceptar.

      Obtención del nombre de usuario y la contraseña de un recurso compartido de archivos

    3. En el ejemplo siguiente se usa una cuenta de almacenamiento de ejemplo denominada utsac1. Para acceder a los recursos compartidos asociados a la cuenta de almacenamiento desde el equipo host, abre una ventana de comandos. En el símbolo del sistema, escriba:

      net use \\<DeviceIPAddress>\<share name> /u:<IP address of the device>\<user name for the share>

      Dependiendo del formato de los datos, las rutas de acceso de los recursos compartidos son las siguientes:

      • Blob en bloques de Azure: \\<DeviceIPAddress>\utsac1_BlockBlob
      • Blob en páginas de Azure: \\<DeviceIPAddress>\utsac1_PageBlob
      • Azure Files: \\<DeviceIPAddress>\utsac1_AzFile
    4. Cuando se le solicite, escriba la contraseña del recurso compartido. Si la contraseña tiene caracteres especiales, agregue comillas dobles antes y después de ella. En el ejemplo siguiente se muestra la conexión a un recurso compartido con el comando anterior.

      C:\Users\Databoxuser>net use \\<DeviceIPAddress>\utSAC1_202006051000_BlockBlob /u:<DeviceIPAddress>\testuser1
      Enter the password for 'testuser1' to connect to '<DeviceIPAddress>': "ab1c2def$3g45%6h7i&j8kl9012345"
      The command completed successfully.
      
    5. Presione Windows + R. En la ventana Ejecutar, escriba \\<DeviceIPAddress>. Seleccione Aceptar para abrir el Explorador de archivos.

      Conexión a un recurso compartido de archivos mediante el Explorador de archivos

      Ahora debería ver los recursos compartidos como carpetas.

      Recursos compartidos de archivos en el Explorador de archivos

      Importante

      No puedes copiar los archivos directamente en la carpeta raíz de la cuenta de almacenamiento. Dentro de la carpeta raíz de una cuenta de almacenamiento de blobs en bloques, encontrarás una carpeta correspondiente a cada uno de los niveles de acceso disponibles.

      Para copiar los datos en Azure Data Box, primero debes seleccionar la carpeta correspondiente a uno de los niveles de acceso. A continuación, crea una subcarpeta dentro de la carpeta de ese nivel para almacenar los datos. Por último, copia los datos en la subcarpeta recién creada. Tu nueva subcarpeta representa el contenedor creado dentro de la cuenta de almacenamiento durante la ingesta. Los datos se cargan en este contenedor como blobs.

    Si usa un cliente Linux, utilice el siguiente comando para montar el recurso compartido SMB. El valor del parámetro vers identifica la versión de SMB que admite el host de Linux. Inserta la versión adecuada en el comando de ejemplo proporcionado. Para ver una lista de las versiones de SMB compatibles con Data Box, consulta Sistemas de archivos compatibles con clientes Linux.

    sudo mount -t cifs -o vers=2.1 10.126.76.138:/utsac1_BlockBlob /home/databoxubuntuhost/databox
    

    Determinación del nivel de acceso adecuado para blobs en bloques

    Importante

    La información contenida en esta sección se aplica a los pedidos realizados después del 1 de abril de 2024.

    Azure Storage permite almacenar datos de blobs en bloque en varios niveles de acceso dentro de la misma cuenta de almacenamiento. Esta capacidad permite organizar y almacenar datos de forma más eficaz en función de la frecuencia con la que se accede a ellos. La tabla siguiente contiene información y recomendaciones sobre los niveles de acceso de Azure Storage.

    Nivel Recomendación Procedimiento recomendado
    Acceso frecuente Resulta útil para los datos en línea a los que se accede o modifica con frecuencia. Este nivel tiene los costos de almacenamiento más altos, pero los de acceso más bajos. Los datos de este nivel deben estar en uso normal y activo.
    Acceso esporádico Resulta útil para los datos en línea a los que se accede o se modifican con poca frecuencia. Este nivel tiene menores costos de almacenamiento y mayores costos de acceso que el nivel de acceso frecuente. Los datos de este nivel deben almacenarse durante al menos 30 días.
    Acceso esporádico Útil para datos en línea a los que se accede o se modifican raramente pero que requieren una recuperación rápida. Este nivel tiene menores costos de almacenamiento y mayores costos de acceso que el nivel de acceso esporádico. Los datos de este nivel deben almacenarse durante un mínimo de 90 días.
    Archivo Resulta útil para los datos sin conexión a los que rara vez se accede y tiene requisitos de latencia más bajos. Los datos de este nivel deben almacenarse durante un mínimo de 180 días. Los datos eliminados del nivel de archivo en un plazo de 180 días están sujetos a un cargo por eliminación anticipada.

    Para obtener más información sobre los niveles de acceso de blob, consulta Niveles de acceso para datos de blob. Para obtener procedimientos recomendados más detallados, consulta Procedimientos recomendados de para usar niveles de acceso de blobs.

    Puedes transferir los datos de blobs en bloque al nivel de acceso adecuado copiándolos en la carpeta correspondiente dentro de Data Box. Este proceso se describe con más detalle en la sección Copia de datos en Azure Data Box.

    Copia de datos a un dispositivo Data Box

    Después de conectarse a uno o varios recursos compartidos de Data Box, el siguiente paso es copiar datos. Antes de comenzar la copia de datos, ten en cuenta las siguientes limitaciones:

    • Asegúrate de copiar los datos en el recurso compartido que corresponda al formato de datos necesario. Por ejemplo, copia los datos de blobs en bloque en la carpeta para blobs en bloque. Copia los discos duros virtuales en el recurso compartido de blobs en páginas. Si el formato de los datos no coincide con el recurso compartido correspondiente, la carga de datos en Azure producirá un error más adelante.
    • Al copiar datos en los recursos compartidos de AzFile o PageBlob, crea primero una carpeta en la raíz del recurso compartido y, a continuación, copia los archivos en esa carpeta.
    • Al copiar datos en el recurso compartido BlockBlob, crea una subcarpeta en el nivel de acceso deseado y, a continuación, copia los datos en la subcarpeta recién creada. La subcarpeta representa un contenedor en el que los datos se cargan como blobs. No se pueden copiar archivos directamente en la carpeta raíz de un recurso compartido.
    • Al copiar los datos, asegúrese de que su tamaño se ajusta a los límites descritos en los límites de tamaño de las cuentas de almacenamiento de Azure.
    • Si desea conservar los metadatos (listas de control de acceso, marcas de tiempo y atributos de archivos) al transferir los datos a Azure Files, siga las guía que se proporciona en el artículo sobre conservación de las ACL, los atributos y las marcas de tiempo de los archivos con Azure Data Box
    • Las cargas simultáneas por Data Box y otra aplicación que no es de Data Box podrían dar lugar a errores de carga de trabajos y daños en los datos.
    • Si usa los protocolos SMB y NFS para las copias de datos, se recomienda que:
      • Use diferentes cuentas de almacenamiento para SMB y NFS.
      • No copie los mismos datos en el mismo destino final de Azure mediante SMB y NFS. En estos casos, no se puede determinar el resultado final.
      • Aunque la copia a través de SMB y NFS en paralelo puede funcionar, no se recomienda hacerlo, ya que esto es propenso a errores humanos. Espere hasta que se complete la copia de datos SMB antes de iniciar una copia de datos NFS.

    Importante

    Asegúrate de mantener una copia de los datos de origen hasta que puedas confirmar que los datos se han copiado en Azure Storage.

    Después de conectarse al recurso compartido SMB, inicie la copia de datos. Para copiar los datos puede usar cualquier herramienta de copia de archivos compatible con SMB, como Robocopy. Con Robocopy se pueden iniciar varios trabajos de copia. Use el comando siguiente:

    robocopy <Source> <Target> * /e /r:3 /w:60 /is /nfl /ndl /np /MT:32 or 64 /fft /B /Log+:<LogFile>
    

    Los atributos se describen en la tabla siguiente.

    Atributo Descripción
    /e Copia los subdirectorios incluyendo los directorios vacíos.
    /r: Especifica el número de reintentos en las copias con errores.
    /w: Especifica el tiempo de espera entre reintentos, en segundos.
    /is Incluye los mismos archivos.
    /nfl Especifica que los nombres de archivo no se han registrado.
    /ndl Especifica que los nombres de directorio no se han registrado.
    /np Especifica que no se mostrará el progreso de la operación de copia (el número de archivos o directorios copiados hasta el momento). Mostrar el progreso reduce significativamente el rendimiento.
    /MT Especifica que se utilice subprocesamiento múltiple; se recomiendan 64 o 32 subprocesos. Esta opción que no se utiliza con los archivos cifrados. Es posible que debas separar los archivos cifrados y sin cifrar. Sin embargo, copiar con un solo subproceso disminuye de forma significativa el rendimiento.
    /fft Utilice esta opción para reducir la granularidad de la marca de tiempo para cualquier sistema de archivos.
    /B Copia los archivos en modo de copia de seguridad.
    /z Copia los archivos en modo de reinicio; use esta opción si el entorno es inestable. Esta opción reduce el rendimiento porque realiza un registro adicional.
    /zb Usa el modo de reinicio. Si se deniega el acceso, esta opción utiliza el modo de copia de seguridad. Esta opción reduce el rendimiento porque utiliza puntos de control.
    /efsraw Copia todos los archivos cifrados en el modo sin procesar de EFS. Usar solo con los archivos cifrados.
    log+:<LogFile> Anexa la salida al archivo de registro existente.

    El ejemplo siguiente muestra la salida del comando robocopy para copiar archivos en el dispositivo Data Box.

    C:\Users>robocopy
    
        -------------------------------------------------------------------------------
        ROBOCOPY     ::     Robust File Copy for Windows
        -------------------------------------------------------------------------------
    
            Started : Thursday, March 8, 2018 2:34:53 PM
            Simple Usage :: ROBOCOPY source destination /MIR
    
            source :: Source Directory (drive:\path or \\server\share\path).
            destination :: Destination Dir  (drive:\path or \\server\share\path).
                    /MIR :: Mirror a complete directory tree.
    
        For more usage information run ROBOCOPY /?
    
        ****  /MIR can DELETE files as well as copy them !
    
    C:\Users>Robocopy C:\Git\azure-docs-pr\contributor-guide \\10.126.76.172\devicemanagertest1_AzFile\templates /MT:32
    
        -------------------------------------------------------------------------------
        ROBOCOPY     ::     Robust File Copy for Windows
        -------------------------------------------------------------------------------
    
            Started : Thursday, March 8, 2018 2:34:58 PM
            Source : C:\Git\azure-docs-pr\contributor-guide\
                Dest : \\10.126.76.172\devicemanagertest1_AzFile\templates\
    
            Files : *.*
    
            Options : *.* /DCOPY:DA /COPY:DAT /MT:32 /R:5 /W:60
    
        ------------------------------------------------------------------------------
    
        100%        New File                 206        C:\Git\azure-docs-pr\contributor-guide\article-metadata.md
        100%        New File                 209        C:\Git\azure-docs-pr\contributor-guide\content-channel-guidance.md
        100%        New File                 732        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-index.md
        100%        New File                 199        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pr-criteria.md
                    New File                 178        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pull-request-co100%  .md
                    New File                 250        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pull-request-et100%  e.md
        100%        New File                 174        C:\Git\azure-docs-pr\contributor-guide\create-images-markdown.md
        100%        New File                 197        C:\Git\azure-docs-pr\contributor-guide\create-links-markdown.md
        100%        New File                 184        C:\Git\azure-docs-pr\contributor-guide\create-tables-markdown.md
        100%        New File                 208        C:\Git\azure-docs-pr\contributor-guide\custom-markdown-extensions.md
        100%        New File                 210        C:\Git\azure-docs-pr\contributor-guide\file-names-and-locations.md
        100%        New File                 234        C:\Git\azure-docs-pr\contributor-guide\git-commands-for-master.md
        100%        New File                 186        C:\Git\azure-docs-pr\contributor-guide\release-branches.md
        100%        New File                 240        C:\Git\azure-docs-pr\contributor-guide\retire-or-rename-an-article.md
        100%        New File                 215        C:\Git\azure-docs-pr\contributor-guide\style-and-voice.md
        100%        New File                 212        C:\Git\azure-docs-pr\contributor-guide\syntax-highlighting-markdown.md
        100%        New File                 207        C:\Git\azure-docs-pr\contributor-guide\tools-and-setup.md
        ------------------------------------------------------------------------------
    
                    Total    Copied   Skipped  Mismatch    FAILED    Extras
        Dirs :         1         1         1         0         0         0
        Files :        17        17         0         0         0         0
        Bytes :     3.9 k     3.9 k         0         0         0         0
    C:\Users>
    

    Para escenarios más específicos, como el uso de robocopy para enumerar, copiar o eliminar archivos en Data Box, consulte Uso de robocopy para enumerar, copiar y modificar archivos en Data Box.

    Para optimizar el rendimiento, use los siguientes parámetros de robocopy al copiar los datos.

    Plataforma Archivos pequeños principalmente < 512 KB Archivos medianos principalmente, de 512 KB a 1 MB Archivos grandes principalmente > 1 MB
    Data Box 2 sesiones de Robocopy
    16 subprocesos por sesión
    3 sesiones de Robocopy
    16 subprocesos por sesión
    2 sesiones de Robocopy
    24 subprocesos por sesión

    Para más información sobre el comando Robocopy, consulte Robocopy and a few examples (Robocopy y algunos ejemplos).

    Las notificaciones se muestran durante el proceso de copia para identificar errores.

    Una notificación de error de copia en Conectar y copiar

    Seleccione Descargar la lista de problemas.

    Conectar y copiar, Descargar la lista de problemas

    Abra la lista para ver los detalles del error y seleccione la dirección URL de resolución para ver la resolución recomendada.

    Conectar y copiar, descargar y ver errores

    Para más información, consulte Ver registro de errores durante la copia de datos en Data Box. Para obtener una lista detallada de errores durante la copia de datos, consulte Solución de problemas de Data Box.

    Para garantizar la integridad de los datos, la suma de comprobación se calcula a medida que los datos se copian. Una vez completada la copia, compruebe el espacio utilizado y el espacio disponible en el dispositivo.

    Comprobación del espacio libre y utilizado en el panel

    Puede copiar datos en su instancia de Data Box desde el servidor de origen a través de SMB, NFS, REST, el servicio de copia de datos o en discos administrados.

    En cada caso, asegúrese de que los nombres de los recursos compartidos y las carpetas, así como el tamaño de los datos, sigan las directrices descritas en los límites de servicio de Azure Storage y Data Box.

    Copia de datos mediante SMB

    Para copiar los datos mediante SMB:

    1. Si está utilizando un host de Windows, use el siguiente comando para conectarse a los recursos compartidos de SMB:

      \\<Device IP address>\ShareName

    2. Para recuperar las credenciales de acceso a los recursos compartidos, ve a la página Conectar y copiar de la interfaz de usuario web local de Data Box Heavy.

    3. Para copiar los datos, puede usar cualquier herramienta de copia de archivos compatible con SMB, como Robocopy.

    Para obtener instrucciones paso a paso, consulte Tutorial: Copia de datos a Azure Data Box Disk mediante SMB.

    Copia de datos mediante NFS

    Para copiar los datos mediante NFS:

    1. Cuando usas un host NFS, utiliza el siguiente comando para montar los recursos compartidos de NFS en la instancia de Data Box:

      sudo mount <Data Box device IP>:/<NFS share on Data Box device> <Path to the folder on local Linux computer>

    2. Para obtener las credenciales de acceso a los recursos compartidos, vaya a la página Connect & copy (Conectar y copiar) de la interfaz de usuario web local de Data Box.

    3. Use el comando cp o rsync para copiar los datos.

    Para obtener instrucciones paso a paso, consulte Tutorial: Copia de datos a Azure Data Box Disk mediante NFS.

    Copia de datos con REST

    Para copiar los datos mediante REST:

    1. Para copiar datos mediante el almacenamiento de blobs de Data Box con las API REST, puede conectarse a través de http o https.
    2. Para copiar datos al almacenamiento de blobs de Data Box, puede usar AzCopy.

    Para obtener instrucciones paso a paso, consulte Tutorial: Copia de datos a Azure Data Box Blob Storage mediante API REST.

    Copia de datos mediante el servicio de copia de datos

    Para copiar los datos mediante el servicio de copia de datos:

    1. Para copiar datos utilizando el servicio de copia de datos tendrá que crear un trabajo. En la interfaz de usuario de la web local de su instancia de Data Box, vaya a Administrar > Copiar datos > Crear.
    2. Rellene los parámetros y cree un trabajo.

    Para obtener instrucciones paso a paso, consulte Tutorial: Uso del servicio de copia de datos para copiar datos en Azure Data Box.

    Copia de datos en discos administrados

    Para copiar los datos en discos administrados:

    1. Al ordenar el dispositivo Data Box, selecciona Discos administrados como destino de almacenamiento.
    2. Conéctate a Data Box mediante los recursos compartidos de SMB o NFS.
    3. Copia los datos a través de las herramientas SMB o NFS.

    Para obtener instrucciones paso a paso, consulte Tutorial: Uso de Data Box para importar datos como discos administrados en Azure.

    Pasos siguientes

    En este tutorial, ha obtenido información acerca de varios temas relacionados con Azure Data Box, como:

    • Requisitos previos
    • Conexión a un dispositivo Data Box
    • Copia de datos a un dispositivo Data Box

    En el siguiente tutorial aprenderá a enviar su dispositivo Data Box a Microsoft.