Comparteix a través de


Tutorial: Uso del servicio de copia de datos para copiar datos en Azure Data Box

En este tutorial se describe cómo realizar la ingesta de datos mediante el servicio de copia de datos sin host intermedio. El servicio de copia de datos se ejecuta localmente en Azure Data Box, se conecta al dispositivo de almacenamiento conectado a la red (NAS) a través del protocolo bloque de mensajes del servidor (SMB) y copia los datos en Data Box.

Use el servicio de copia de datos:

  • En entornos de NAS donde pudiera no haber hosts intermedios disponibles.
  • Con archivos pequeños que demoran durante semanas la ingesta y carga de datos. El servicio de copia de datos mejora significativamente el tiempo de ingesta y de carga de archivos pequeños.

Nota:

No se admite oficialmente la compatibilidad del servicio de copia con dispositivos NAS que no sean Windows.

En este tutorial, aprenderá a:

  • Copia de datos a un dispositivo Data Box

Requisitos previos

Antes de empezar este tutorial:

  1. Complete el tutorial Configuración de Azure Data Box.
  2. Asegúrese de que el dispositivo Data Box se entregue y que el estado del pedido en el portal sea Entregado.
  3. Asegúrese de que tiene las credenciales del dispositivo NAS que contiene los datos de origen.
  4. Asegúrese de que está conectado a una red de alta velocidad. Es muy recomendable tener una conexión de Ethernet de 10 Gigabit (GbE) como mínimo. Puede usar un vínculo de datos de 1 GbE si una conexión de 10 GbE no está disponible, pero la velocidad de copia se ve afectada.

Copia de datos a un dispositivo Data Box

Una vez conectado al dispositivo NAS, el siguiente paso es copiar los datos.

Importante

Para evitar la posibilidad de corrupción o pérdida de datos, asegúrese de seguir las prácticas recomendadas:

  • Antes de iniciar las operaciones de copia de datos, asegúrese de que el tamaño de los datos se ajusta a los límites de tamaño descritos en el artículo límites de Azure Storage y Data Box.
  • Asegúrese de que los datos no se cargan en Data Box en otras aplicaciones fuera de Data Box. Las operaciones simultáneas de copia de datos pueden dar lugar a errores de carga y daños en los datos.
  • Asegúrese de que el servicio de copia de datos no está modificando los datos de origen mientras los lee. La modificación de datos durante las operaciones de copia puede provocar errores o daños en los datos.
  • Asegúrese de mantener una copia de los datos de origen hasta que se complete el proceso de transferencia de Data Box y de que los datos estén accesibles en Azure Storage.

Para copiar datos utilizando el servicio de copia de datos, tendrá que crear un trabajo:

  1. En la interfaz de usuario web local del dispositivo Data Box, seleccione Administrar>Copiar datos.

  2. En la página Copiar datos, seleccione Crear.

    Captura de pantalla de la página Copiar datos resaltando la ubicación del botón Crear.

  3. En el cuadro de diálogo Configurar trabajo e iniciar, rellene los siguientes campos:

    Campo Value
    Nombre del trabajo Un nombre exclusivo de menos de 230 caracteres para el trabajo. En el nombre del trabajo no se permiten los siguientes caracteres: <, >, |, ?, *, \, :, / y \.
    Ubicación de origen Proporcione la ruta de acceso SMB para el origen de datos en el formato: \\<ServerIPAddress>\<ShareName> o \\<ServerName>\<ShareName>.
    Nombre de usuario Nombre de usuario en formato \\<DomainName><UserName> para acceder al origen de datos. Los administradores locales requieren permisos de seguridad explícitos. Haga clic con el botón derecho en la carpeta, seleccione Propiedades, y a continuación, seleccione Seguridad para agregar el administrador local en la pestaña Seguridad.
    Contraseña Contraseña para acceder al origen de datos.
    Cuenta de almacenamiento de destino Seleccione la cuenta de almacenamiento de destino para cargar datos desde la lista.
    Tipo de destino Seleccione el tipo de almacenamiento de destino de la lista: Blob en bloques, Blob en páginas, Azure Files o Blob en bloques (Archivo).
    Contenedor o recurso compartido de destino Escriba el nombre del contenedor o el recurso compartido del cual desee cargar datos en la cuenta de almacenamiento de destino. El nombre puede ser un nombre de recurso compartido o de contenedor. Por ejemplo, use myshare o mycontainer. Además, puede escribir el nombre en el formato sharename\directory_name o containername\virtual_directory_name.
    Copiar los archivos que coincidan con el patrón Puede escribir el patrón de coincidencia de nombre de archivo de las siguientes dos maneras:
    • Uso de expresiones de caracteres comodín: En las expresiones de caracteres comodín solo se admiten * y ?. Por ejemplo, la expresión *.vhd coincide con todos los archivos que tienen la extensión .vhd. De forma similar, *.dl? coincide con todos los archivos con la extensión .dl o que empiezan por .dl, como .dll. Del mismo modo, *foo coincide con todos los archivos cuyos nombres terminan con foo.
      Puede especificar directamente la expresión de caracteres comodín en el campo. De forma predeterminada, el valor especificado en el campo se trata como expresión comodín.
    • Uso de expresiones regulares: se admiten expresiones regulares basadas en POSIX. Por ejemplo, la expresión regular .*\.vhd coincide con todos los archivos que tienen la extensión .vhd. Para la expresión regular, proporcione el <pattern> directamente como regex(<pattern>). Para más información sobre las expresiones regulares, vaya a Lenguaje de expresiones regulares - Referencia rápida.
      Optimización de archivos Cuando esta característica está habilitada, se empaquetan los archivos inferiores a 1 MB durante la ingesta. Esto acelera la copia de datos para archivos pequeños. También ahorra un tiempo importante cuando el número de archivos supera el número de directorios.
      Si usa la optimización de archivos:
      • Después de ejecutar la preparación para el envío, puede descargar un archivo de lista de materiales (BOM), que enumera los nombres de archivo originales, para ayudarle a asegurarse de que se copian todos los archivos correctos.
      • No elimine los archivos empaquetados, cuyos nombres de archivo comienzan por ADB_PACK_. Si elimina un archivo empaquetado, el archivo original no se cargará durante futuras copias de datos.
      • No copie con otros protocolos, como SMB, NFS o API REST, los mismos archivos que copia con el servicio de copia. El uso de protocolos diferentes puede provocar conflictos y errores durante las cargas de datos.
      • No se admite la optimización de archivos para Azure Files. Para ver qué marcas de tiempo, atributos de archivo y listas de control de acceso (ACL) se copian para un trabajo de copia de datos no optimizado, consulte el artículo metadatos transferidos.
    • Seleccione Inicio. Se validan las entradas y, si la validación es correcta, se inicia el trabajo. El trabajo puede tardar unos minutos en iniciarse.

      Captura de pantalla que muestra la ubicación del botón Inicio en el cuadro de diálogo

    • Se crea un trabajo con la configuración especificada. Los trabajos se pueden pausar, reanudar, cancelar o reiniciar. Seleccione la casilla situada junto al nombre del trabajo y seleccione el botón correspondiente.

      Captura de pantalla de la página Copiar datos que resalta la ubicación de la casilla usada para seleccionar un trabajo de copia.

      • Puede pausar un trabajo si está afectando a los recursos del dispositivo NAS durante las horas punta:

        Captura de pantalla de la página Copiar datos resaltando la ubicación del botón Pausar.

        Puede reanudar el trabajo durante las horas de poca actividad:

        Captura de pantalla de la página Copiar datos resaltando la ubicación del botón Reanudar.

      • Puede cancelar un trabajo en cualquier momento:

        Captura de pantalla de la página Copiar datos resaltando la ubicación del botón Cancelar. Cancelación de un trabajo en la página

        Al cancelar un trabajo se necesita confirmación:

        Captura de pantalla del mensaje de diálogo

        La cancelación de un trabajo de copia no elimina ningún dato ya copiado en el dispositivo durante un trabajo. Para eliminar los datos ya copiados en el dispositivo Data Box, restablezca el dispositivo.

        Captura de pantalla de la página Restablecer dispositivo, que se usa para eliminar todos los datos del dispositivo.

        Nota:

        Si cancela o pausa un trabajo, los archivos de gran tamaño podrían haberse copiado solo parcialmente. Estos archivos parcialmente copiados se cargan en el mismo estado en Azure. Al cancelar o pausar un trabajo, asegúrese de que los archivos se hayan copiado correctamente. Para validar los archivos, examine los recursos compartidos de SMB o descargue el archivo BOM.

      • Puede reiniciar un trabajo con errores que surja de un error transitorio, como un error de red. Sin embargo, no se puede reiniciar un trabajo después de que alcance un estado de terminal, como Correcto o Completado con errores. Se registran errores resultantes de problemas de nomenclatura de archivos o tamaño de archivo, pero el trabajo no se puede reiniciar después de que se complete.

        Captura de pantalla de la página Copiar datos resaltando la ubicación del botón Reiniciar.

        Si experimenta un error y no puede reiniciar el trabajo, descargue los registros de errores y busque el error subyacente. Después de corregir el problema, cree un nuevo trabajo para copiar los archivos. Como alternativa, también puede Copiar los archivos a través de SMB.

      • La versión actual no admite la eliminación de trabajos.

      • Puede crear un número ilimitado de trabajos, pero solo puede ejecutar un máximo de 10 trabajos en paralelo en un momento dado.

      • Si la Optimización de archivos está activada, los archivos pequeños se empaquetan en la ingesta y desempaquetados durante la carga para mejorar el rendimiento de la copia. Estos archivos empaquetados se denominan mediante un GUID. No elimine archivos empaquetados.

    • Los datos siguientes se presentan en la página Copiar datos mientras el trabajo está en curso:

      • La columna Estado muestra el estado del trabajo de copia. Entre los estados válidos se incluyen:
        • Ejecución
        • Erróneo
        • Correcto
        • Pausando
        • En pausa
        • Cancelando
        • Canceled
        • Completed with errors (Completado con errores)
      • La columna Archivos muestra el número y el tamaño total de los archivos que se copian.
      • La columna Procesado muestra el número y el tamaño total de los archivos que se procesan.
      • La Detalles del trabajo proporciona un vínculo para ver los detalles del trabajo.
      • La columna # Errores muestra el número de errores detectados durante el proceso de copia. Para descargar los registros de errores para solucionar problemas, seleccione el vínculo dentro de la columna Registro de errores correspondiente.

    Espere a que finalice el trabajo de copia. Dado que algunos errores solo se registran en la página Conectar y copiar, asegúrese de que el trabajo de copia está completo e informa de que no hay errores antes de avanzar al paso siguiente.

    Captura de pantalla de la página

    Para garantizar la integridad de los datos, la suma de comprobación se calcula a medida que los datos se copian. Una vez completada la copia, seleccione Ver panel para comprobar el espacio utilizado y el espacio disponible en el dispositivo.

    Captura de pantalla de la página Panel que muestra la cantidad de espacio libre y usado.

    Una vez finalizado el trabajo de copia, puede seleccionar Preparar para enviar.

    Nota

    Preparar para enviar no se puede ejecutar con trabajos de copia en curso.

    Pasos siguientes

    En el siguiente tutorial aprenderá a enviar el dispositivo Data Box a Microsoft.