Поделиться через


Руководство. Копирование данных на диск Microsoft Azure Data Box и проверка

Внимание

Azure Data Box теперь поддерживает назначение уровня доступа на уровне блоба. Действия, содержащиеся в этом руководстве, отражают обновленный процесс копирования данных и предназначены для блочных блобов.

Назначение уровня доступа не поддерживается при копировании данных с помощью Data Box Split Copy Tool. Если для вашего варианта использования требуется назначение уровня доступа, выполните действия, содержащиеся в разделе "Копирование данных на диски ", чтобы скопировать данные на соответствующий уровень доступа с помощью служебной программы Robocopy.

Сведения о том, как определить соответствующий уровень доступа для данных блочного BLOB-объекта, см. в разделе "Определение соответствующих уровней доступа для блочных BLOB-объектов".

Сведения, содержащиеся в этом разделе, относятся к заказам, размещенным после 1 апреля 2024 года.

Внимание

Эта статья ссылается на CentOS, дистрибутив Linux, поддержка которого прекращена. Пожалуйста, рассмотрите возможность использования и планирования соответствующим образом.

В этом руководстве описывается копирование данных с хост-компьютера и создание контрольных сумм с целью проверки целостности данных.

В этом руководстве описано следующее:

  • Определение соответствующих уровней доступа для блочных BLOB-объектов
  • Копирование данных на диск Data Box
  • Проверка данных

Предварительные условия

Перед тем как начать, убедитесь в следующем.

Определите подходящие уровни доступа для блобов блочного типа.

Внимание

Сведения, содержащиеся в этом разделе, относятся к заказам, размещенным после 1 апреля 2024 года.

Служба Azure Storage позволяет хранить данные блоковых BLOB-объектов на нескольких уровнях доступа в пределах одной и той же учетной записи хранения. Эта возможность позволяет упорядочивать и хранить данные более эффективно на основе частоты доступа. В следующей таблице содержатся сведения и рекомендации по уровням доступа Хранилища Azure.

Уровень Рекомендация Лучшие практики
Горячий Полезно для часто используемых или изменяемых данных в Интернете. Этот уровень имеет самые высокие затраты на хранение, но самые низкие затраты на доступ. Данные на этом уровне должны находиться в регулярном и активном использовании.
Круто Полезно для доступа к интернет-данным или редко изменяемых. Этот уровень имеет более низкие затраты на хранение и более высокие затраты на доступ, чем горячий уровень. Данные на этом уровне должны храниться не менее 30 дней.
Холодный Полезно для данных в интернете, к которым редко обращаются или которые иногда изменяют, но при этом требуется быстрое извлечение. Этот уровень имеет более низкие затраты на хранение и более высокие затраты на доступ, чем холодный уровень. Данные на этом уровне должны храниться не менее 90 дней.
Архив Полезно для офлайн-данных, которые редко используются и имеют низкие требования к задержке. Данные на этом уровне должны храниться не менее 180 дней. Данные, удаленные из архивного уровня в течение 180 дней, подлежат досрочному удалению.

Дополнительные сведения о уровнях доступа к BLOB-объектам см. в разделе "Уровни доступа" для данных BLOB-объектов. Для более подробных рекомендаций см. Лучшие практики использования уровней доступа к BLOB-объектам.

Данные блок-объектов можно переместить на соответствующий уровень доступа, скопировав их в соответствующую папку на диске Data Box. Этот процесс подробно рассматривается в разделе "Копирование данных на диски ".

Копирование данных на диски

Перед копированием данных на диски, ознакомьтесь со следующими рекомендациями.

  • Вы несете ответственность за копирование локальных данных в общую папку, соответствующую соответствующему формату данных. Например, скопируйте данные блочных BLOB-объектов в общую папку BlockBlob . Скопируйте VHD в хранилище PageBlob. Если локальный формат данных не соответствует соответствующей папке выбранного типа хранилища, передача данных в Azure завершается сбоем на следующем шаге.

  • Невозможно скопировать данные непосредственно в корневую папку общего ресурса. Вместо этого создайте папку в соответствующей общей папке и скопируйте в нее данные.

    • Папки, расположенные в корне общего ресурса PageBlob, соответствуют контейнерам в вашей учетной записи хранения. Новый контейнер создается для любой папки, имя которой не соответствует существующему контейнеру в вашей учетной записи хранения.

    • Папки, расположенные в корневом каталоге AzFile, соответствуют общим папкам Azure. Для любой папки создается новый файловый ресурс, имя которого не соответствует существующему файловому ресурсу в вашей учетной записи.

    • Корневой уровень общей папки BlockBlob содержит одну папку, соответствующую каждому уровню доступа. При копировании данных в общую папку BlockBlob создайте вложенную папку в папке верхнего уровня, соответствующую требуемому уровню доступа. Как и в общем ресурсе PageBlob , для любой папки создается новый контейнер, имя которого не соответствует существующему контейнеру. Данные в контейнере копируются на уровень иерархии, соответствующий главному родительскому элементу вложенной папки.

      Контейнер также создается для любой папки, размещенной в корневом каталоге общей папки BlockBlob, и данные, содержащиеся в нем, копируются на уровень доступа по умолчанию контейнера. Чтобы убедиться, что данные копируются на нужный уровень доступа, не создавайте папки на корневом уровне.

    Внимание

    Данные, загруженные в архивный уровень, остаются недоступными и их необходимо восстановить для чтения или изменения. Данные, скопированные на архивный уровень, должны оставаться не менее 180 дней или подлежат досрочному удалению. Уровень архива не поддерживается для учетных записей ZRS, GZRS или RA-GZRS.

  • При копировании данных убедитесь, что размер данных соответствует ограничениям размера, описанным в статье о хранилище Azure и ограничениях диска Data Box.

  • Не отключайте шифрование BitLocker на дисках Data Box. Отключение шифрования BitLocker приводит к сбою отправки после возврата дисков. Отключение BitLocker также оставляет диски в разблокированном состоянии, создавая проблемы безопасности.

  • Чтобы сохранить метаданные, такие как списки управления доступом, метки времени и атрибуты файлов при передаче данных в Azure Files, следуйте рекомендациям из статьи Сохранение списков управления доступом к файлам, атрибутов и меток времени с помощью Azure Data Box Disk.

  • Если вы одновременно используете и Диск Data Box, и другие приложения для отправки данных, это может привести к сбою заданий и повреждению данных.

    Внимание

    Если при создании заказа вы указали управляемые диски в качестве одного из назначений для хранения данных, то действуют условия, приведенные в следующем разделе.

  • Убедитесь, что виртуальные жесткие диски (VHD), отправленные в предварительно созданные папки, имеют уникальные имена в группах ресурсов. Управляемые диски должны иметь уникальные имена в пределах группы ресурсов и всех предварительно созданных папок на диске Data Box. Если вы используете несколько дисков Data Box, имена управляемых дисков должны быть уникальными для всех папок и дисков. При обнаружении виртуальных жестких дисков с повторяющимися именами только один преобразуется в управляемый диск с таким именем. Остальные виртуальные жесткие диски отправляются в качестве страничных блобов в учетную запись промежуточного хранилища.

  • Всегда копируйте VHD в одну из предварительно созданных папок. Виртуальные жесткие диски, размещенные вне этих папок или в папке, созданной вами, загружаются в учетные записи хранилища Azure в качестве страничных(blob) объектов вместо управляемых дисков.

  • Для создания управляемых дисков можно загружать только фиксированные виртуальные диски. Динамические виртуальные жесткие диски, разностные виртуальные жесткие диски и VHDX-файлы не поддерживаются.

  • Средства разделения копирования и проверки Data Box Disk, DataBoxDiskSplitCopy.exe и DataBoxDiskValidation.cmd, сообщают о сбоях при обработке длинных путей. Эти сбои часто возникают, если длинные пути не включены в клиенте, а пути копирования данных и имена файлов превышают 256 символов. Чтобы избежать этих сбоев, следуйте инструкциям в статье о включении длинных путей на клиенте Windows.

Внимание

Интегрированная среда сценариев PowerShell (ISE) не поддерживается для Data Box Disk Tools.

Выполните следующие действия для подключения и копирования данных с компьютера на диск Data Box.

  1. Просмотрите содержимое разблокированного диска. Список предварительно созданных папок и подпапок на накопителе зависит от параметров, которые вы выбираете при размещении заказа на диск Data Box. Создание дополнительных папок не допускается, так как копирование данных в созданную пользователем папку приводит к сбоям отправки.

    Выбранное целевое хранилище Тип учетной записи хранения Тип учетной записи промежуточного хранения Папки и вложенные папки
    учетная запись хранения GPv1 или GPv2 Неприменимо Блоб-блок (BlockBlob)
    • Архив
    • холод
    • Круто
    • горячий
    PageBlob
    AzureFile
    учетная запись хранения Учетная запись Blob-хранилища Неприменимо Блоб-блок (BlockBlob)
    • Архив
    • холод
    • Круто
    • горячий
    Управляемые диски Неприменимо GPv1 или GPv2 ManagedDisk
    • PremiumSSD
    • StandardSSD
    • StandardHDD
    учетная запись хранения
    Управляемые диски
    GPv1 или GPv2 GPv1 или GPv2 Блоб-блок (BlockBlob)
    • Архив
    • холод
    • Круто
    • горячий
    PageBlob
    AzureFile
    ManagedDisk
    • PremiumSSD
    • StandardSSD
    • StandardHDD
    Учетная запись хранения
    Управляемые диски
    Учетная запись хранения больших двоичных объектов GPv1 или GPv2 Блоб-блок (BlockBlob)
    • Архив
    • холод
    • Круто
    • горячий
    ManagedDisk
    • PremiumSSD
    • StandardSSD
    • StandardHDD

    На следующем снимка экрана показан порядок, в котором указана учетная запись хранения GPv2 и уровень архива:

    Снимок экрана: содержимое диска.

  2. Скопируйте данные VHD или VHDX в папку PageBlob . Все файлы, скопированные в папку PageBlob, перемещаются в контейнер по умолчанию $root в учетной записи службы хранения Azure. Контейнер создается для каждой подпапки в папке PageBlob в учетной записи хранения Azure.

    Скопируйте данные для размещения в файловых ресурсах Azure в подпапку в папке AzureFile. Все файлы, скопированные в папку AzureFile , копируются в виде файлов в контейнер типа databox-format-[GUID]по умолчанию, например databox-azurefile-7ee19cfb3304122d940461783e97bf7b4290a1d7.

    Невозможно скопировать файлы непосредственно в корневую папку BlockBlob. В корневой папке вы найдете вложенную папку, соответствующую каждому из доступных уровней доступа. Чтобы скопировать данные BLOB-объектов, сначала необходимо выбрать папку, соответствующую одному из уровней доступа. Затем создайте вложенную папку в папке этого уровня для хранения данных. Наконец, скопируйте данные в только что созданную вложенную папку. Новый вложенный каталог представляет собой контейнер, созданный в учетной записи хранения во время процесса приема. Ваши данные загружаются в этот контейнер в виде блобов. Как и в общем ресурсе AzureFile, создается новый контейнер хранилища BLOB-объектов для каждой вложенной папки, расположенной в корневой папке BlockBlob. Данные в этих папках сохраняются в соответствии с уровнем доступа учетной записи хранения по умолчанию.

    Прежде чем копировать данные, необходимо переместить все файлы и папки, существующие в корневом каталоге, в другую папку.

    Внимание

    Все контейнеры, большие двоичные объекты и названия файлов должны соответствовать соглашениям об именовании Azure. Если не следовать этим правилам, произойдет сбой передачи данных в Azure.

  3. При копировании файлов убедитесь, что файлы не превышают 4,7 ТиБ для блочных BLOB-объектов, 8 ТиБ для страничных BLOB-объектов и 1 ТиБ для Файлы Azure.

  4. Для копирования данных можно использовать функции перетаскивания в Проводнике. Также можно использовать любое средство SMB для копирования файлов, например Robocopy.

    Одним из преимуществ использования средства копирования файлов является возможность инициировать несколько заданий копирования, как в следующем примере с помощью средства Robocopy:

    Robocopy <source> <destination> * /MT:64 /E /R:1 /W:1 /NFL /NDL /FFT /Log:c:\RobocopyLog.txt

    Примечание.

    Параметры, используемые в этом примере, основаны на среде, используемой во время внутреннего тестирования. Ваши параметры и значения, скорее всего, отличаются.

    Параметры и опции для команды используются следующим образом:

    Параметры/Опции Описание
    Источник Указание пути к исходному каталогу.
    Назначение Укажите путь к целевому каталогу.
    /E Копирует подкаталоги, включая пустые каталоги.
    /MT[:n] Создает копии с несколькими потоками, используя n потоков, где n является целым числом от 1 до 128.
    Значение по умолчанию для n равно 8.
    /R: <n> Указание количества повторных попыток для неудавшихся копий.
    Значение n по умолчанию равно 1 000 000 повторных попыток.
    /W: <n> Указание времени ожидания между повторными попытками в секундах.
    Значение по умолчанию n равно 30 и эквивалентно времени ожидания 30 секунд.
    /NFL Указывает, что имена файлов не регистрируются.
    /NDL Указывает, что имена каталогов не регистрируются.
    /FFT Предполагает время FAT-файла с точностью разрешения в два секунды.
    /Log:<файл журнала> Записывает выходные данные состояния в файл журнала.
    Любой существующий файл журнала перезаписан.

    Можно использовать несколько дисков параллельно с несколькими заданиями, выполняемыми на каждом диске. Помните, что повторяющиеся имена файлов перезаписываются или приводят к ошибке копирования.

  5. Проверьте статус копирования, когда задание находится в процессе выполнения. Ниже приведен пример выходных данных команды Robocopy для копирования файлов на диск Data Box.

    
    C:\Users>robocopy
    -------------------------------------------------------------------------------
       ROBOCOPY     ::     Robust File Copy for Windows
    -------------------------------------------------------------------------------
    
       Started : Thursday, March 8, 2018 2:34:53 PM
          Simple Usage :: ROBOCOPY source destination /MIR
    
                source :: Source Directory (drive:\path or \\server\share\path).
           destination :: Destination Dir  (drive:\path or \\server\share\path).
                  /MIR :: Mirror a complete directory tree.
    
      For more usage information run ROBOCOPY /?    
    
      ****  /MIR can DELETE files as well as copy them !
    
    C:\Users>Robocopy C:\Repository\guides \\10.126.76.172\AzFileUL\templates /MT:64 /E /R:1 /W:1 /FFT 
    -------------------------------------------------------------------------------
       ROBOCOPY     ::     Robust File Copy for Windows
    -------------------------------------------------------------------------------
    
       Started : Thursday, March 8, 2018 2:34:58 PM
        Source : C:\Repository\guides\
          Dest : \\10.126.76.172\devicemanagertest1_AzFile\templates\
    
         Files : *.*
    
       Options : *.* /DCOPY:DA /COPY:DAT /MT:8 /R:1000000 /W:30
    
     ------------------------------------------------------------------------------
    
     100%    New File    206    C:\Repository\guides\article-metadata.md
     100%    New File    209    C:\Repository\guides\content-channel-guidance.md
     100%    New File    732    C:\Repository\guides\index.md
     100%    New File    199    C:\Repository\guides\pr-criteria.md
     100%    New File    178    C:\Repository\guides\pull-request-co.md
     100%    New File    250    C:\Repository\guides\pull-request-ete.md
     100%    New File    174    C:\Repository\guides\create-images-markdown.md
     100%    New File    197    C:\Repository\guides\create-links-markdown.md
     100%    New File    184    C:\Repository\guides\create-tables-markdown.md
     100%    New File    208    C:\Repository\guides\custom-markdown-extensions.md
     100%    New File    210    C:\Repository\guides\file-names-and-locations.md
     100%    New File    234    C:\Repository\guides\git-commands-for-master.md
     100%    New File    186    C:\Repository\guides\release-branches.md
     100%    New File    240    C:\Repository\guides\retire-or-rename-an-article.md
     100%    New File    215    C:\Repository\guides\style-and-voice.md
     100%    New File    212    C:\Repository\guides\syntax-highlighting-markdown.md
     100%    New File    207    C:\Repository\guides\tools-and-setup.md
     ------------------------------------------------------------------------------
    
                    Total    Copied   Skipped  Mismatch    FAILED    Extras
         Dirs :         1         1         1         0         0         0
        Files :        17        17         0         0         0         0
        Bytes :     3.9 k     3.9 k         0         0         0         0
        Times :   0:00:05   0:00:00                       0:00:00   0:00:00
    
        Speed :                5620 Bytes/sec.
        Speed :               0.321 MegaBytes/min.
        Ended : Thursday, August 31, 2023 2:34:59 PM
    
    

    Чтобы оптимизировать производительность, при копировании данных используйте указанные ниже параметры robocopy.

    Платформа В основном небольшие файлы < 512 КБ Главным образом файлы среднего размера (от 512 КБ до 1 МБ) В основном большие файлы > 1 МБ
    Диск Data Box 4 сеанса Robocopy*
    16 потоков на сеанс
    2 сеанса Robocopy*
    16 потоков на сеанс
    2 сеанса Robocopy*
    16 потоков на сеанс

    * Каждый сеанс Robocopy может иметь не более 7000 каталогов и 150 миллионов файлов.

    Дополнительные сведения о команде Robocopy см. в статье о Robocopy и нескольких примерах .

  6. Откройте целевую папку, а затем просмотрите и проверьте скопированные файлы. При наличии ошибок во время копирования скачайте файлы журналов для устранения неполадок. Выходные данные команды robocopy указывают расположение файлов журнала.

Разделение данных и их копирование на диски

Средство Data Box Split Copy помогает разделить и скопировать данные на несколько дисков Azure Data Box. Средство доступно только для использования на компьютере с Windows. Эта необязательная процедура полезна при наличии большого набора данных, который необходимо разделить и скопировать на несколько дисков.

Внимание

Инструмент "Data Box Split Copy" также может проверять ваши данные. Во время использования инструмента Data Box Split Copy для копирования данных вы можете пропустить шаг Проверка данных.

Назначение уровня доступа не поддерживается при копировании данных с помощью Data Box Split Copy Tool. Если для вашего варианта использования требуется назначение уровня доступа, выполните действия, содержащиеся в разделе "Копирование данных на диски ", чтобы скопировать данные на соответствующий уровень доступа с помощью служебной программы Robocopy.

Инструмент Data Box Split Copy не поддерживается с управляемыми дисками.

  1. Скачайте инструмент Data Box Split Copy на компьютер с Windows и извлеките его в локальную папку. Это средство входит в набор инструментов Data Box Disk для Windows.

  2. Откройте Проводник файлов. Запишите источник данных и буквы дисков, назначенные Диску Data Box.

    Снимок экрана: диск источника данных и буквы дисков, назначенные для Диска Data Box.

  3. Определите исходные данные для копирования. Так, в нашем примере:

    • Были идентифицированы следующие данные блочного BLOB-объекта.

      Снимок экрана: данные блочного BLOB-объекта, определенные для процесса копирования.

    • Были идентифицированы данные блоба страницы.

      Снимок экрана: данные большого двоичного объекта страницы, определенные для процесса копирования.

  4. Перейдите в папку, в которой извлекается программное обеспечение и найдите SampleConfig.json файл. Этот файл — это файл, доступный только для чтения, который можно изменить и сохранить.

    Снимок экрана: расположение примера файла конфигурации.

  5. Измените файл SampleConfig.json.

    • Укажите имя задания. Папка с этим именем создается на диске Data Box. Имя также используется для создания контейнера в учетной записи хранения Azure, связанной с этими дисками. Имя задания должно соответствовать соглашениям об именовании контейнеров Azure.

    • Укажите исходный путь, запишите формат пути в файле SampleConfigFile.json.

    • Введите буквы дисков, соответствующие целевым дискам. Данные взяты из исходного пути и копируются на нескольких дисках.

    • Укажите путь для файлов журналов. По умолчанию файлы журналов отправляются в каталог, где .exe находится файл.

    • Чтобы проверить формат этого файла, перейдите в JSONlint.

      Снимок экрана: содержимое примера файла конфигурации.

    • Сохраните файл как ConfigFile.json.

      Снимок экрана: расположение файла конфигурации замены.

  6. Запустите окно командной строки с повышенными привилегиями и выполните DataBoxDiskSplitCopy.exe, используя следующую команду.

    DataBoxDiskSplitCopy.exe PrepImport /config:ConfigFile.json
    
  7. При появлении запроса нажмите любую клавишу, чтобы продолжить работу средства.

    Снимок экрана: окно командной строки, в котором выполняется средство разделения копирования.

  8. После разделения и копирования набора данных отображается сводка инструмента Split Copy, как это показано в следующем примере выходных данных.

    Скриншот, показывающий сводку, предоставленную после успешного выполнения инструмента Split Copy.

  9. Убедитесь, что данные правильно разделены по целевым дискам.

    Снимок экрана, показывающий правильное разделение данных на первых двух целевых дисках.

    Снимок экрана, показывающий правильное разделение данных на второй из двух целевых дисков.

    Проверьте содержимое H: диска и убедитесь, что создаются две вложенные папки, соответствующие данным формата блочного BLOB-объекта и страничного BLOB-объекта.

    Снимок экрана: две вложенные папки, созданные в соответствии с данными формата блочных BLOB-объектов и страничных BLOB-объектов.

  10. Если сеанс копирования завершается сбоем, используйте следующую команду, чтобы восстановить и возобновить работу:

    DataBoxDiskSplitCopy.exe PrepImport /config:ConfigFile.json /ResumeSession

Если при использовании средства разделения копирования возникают ошибки, выполните действия, описанные в статье об ошибках средства разделения копирования .

Внимание

Инструмент Data Box Split Copy также проверяет ваши данные. Во время использования инструмента Data Box Split Copy для копирования данных вы можете пропустить шаг Проверка данных. Средство разделения копирования не поддерживается с управляемыми дисками.

Проверка данных

Если для копирования данных не использовалось средство разделения данных Data Box, необходимо проверить данные. Проверьте данные, выполнив следующие действия для каждого диска Data Box. Если во время проверки возникают ошибки, выполните действия, описанные в статье об устранении ошибок проверки.

  1. Выполните DataBoxDiskValidation.cmd проверку контрольной суммы в папке DataBoxDiskImport диска. Это средство доступно только для среды Windows. Пользователям Linux необходимо убедиться, что исходные данные, скопированные на диск, соответствуют предварительным требованиям Azure Data Box.

    Снимок экрана результатов инструмента проверки Data Box Disk.

  2. При появлении запроса выберите соответствующий параметр проверки. Мы рекомендуем всегда проверять файлы и создавать контрольные суммы с помощью варианта 2. Выйдите из командного окна после завершения скрипта. Время, необходимое для завершения проверки, зависит от размера данных. Средство уведомляет вас об ошибках, возникших во время проверки и создания контрольной суммы, и предоставляет ссылку на журналы ошибок.

    Снимок экрана: неудачная попытка выполнения и указание расположения соответствующего файла журнала.

    Совет

    • Сбросьте инструмент между двумя запусками.
    • Процесс контрольной суммы может занять больше времени, если у вас есть большой набор данных, содержащий множество файлов, которые занимают относительно мало емкости хранилища. Если вы проверяете файлы и пропускаете создание контрольной суммы, перед удалением любых копий следует независимо проверить целостность данных на диске Data Box. Эта проверка в идеале включает создание контрольных сумм.

Следующие шаги

В этом руководстве вы узнали, как выполнить следующие задачи с помощью диска Azure Data Box:

  • Копирование данных на диск Data Box
  • Проверка целостности данных

Перейдите к следующему руководству, чтобы узнать, как возвратить диск Data Box и проверить загрузку данных в Azure.