Оптимизация хранилища с помощью дедупликации и сжатия ReFS в Azure Stack HCI
Область применения: Azure Stack HCI версии 23H2
В этой статье описывается функция дедупликации и сжатия отказоустойчивой файловой системы (ReFS) и использование этой функции в Azure Stack HCI для оптимизации хранилища.
Что такое дедупликация и сжатие ReFS?
Дедупликация и сжатие ReFS — это функция оптимизации хранилища, предназначенная специально для активных рабочих нагрузок, таких как инфраструктура виртуальных рабочих столов Azure (VDI) в Azure Stack HCI. Эта функция помогает оптимизировать использование хранилища и сократить затраты на хранение.
Эта функция использует клонирование блоков ReFS для уменьшения перемещения данных и включения только операций с метаданными. Эта функция работает на уровне блока данных и использует фиксированный размер блока в зависимости от размера кластера. Модуль сжатия создает тепловую карту, чтобы определить, должен ли блок иметь право на сжатие, оптимизируя использование ЦП.
Дедупликация и сжатие ReFS можно выполнять как одноразовое задание или автоматизировать его с запланированными заданиями. Эта функция работает как со всеми вспышками, так и с гибридными системами и поддерживает различные параметры устойчивости, такие как двухсторонняя зеркальная, вложенная двухсторонняя зеркальная, трехсторонняя зеркальная и зеркальная ускоренная четность.
Льготы
Ниже приведены преимущества дедупликации и сжатия ReFS:
- Экономия хранилища для активных рабочих нагрузок. Предназначен для активных рабочих нагрузок, таких как VDI, обеспечивая эффективную производительность в требовательных средах.
- Несколько режимов. Работает в трех режимах: дедупликация только, сжатие только и дедупликация и сжатие (режим по умолчанию), что позволяет оптимизировать в зависимости от ваших потребностей.
- Добавочная дедупликация. Дедупликирует только новые или измененные данные в отличие от сканирования всего тома каждый раз, оптимизации длительности задания и снижения влияния на производительность системы.
Необходимые компоненты
Прежде чем начать, убедитесь, что выполнены следующие предварительные требования:
- У вас есть доступ к кластеру Azure Stack HCI, который развернут и зарегистрирован.
- В кластере создан общий том кластера (CSV) и у вас есть доступ к нему.
- В CSV-файле еще не включена функция дедупликации данных Windows.
Использование дедупликации и сжатия ReFS
Вы можете использовать дедупликацию и сжатие ReFS с помощью Центра администрирования Windows или PowerShell. PowerShell позволяет выполнять как вручную, так и автоматические задания, в то время как Windows Admin Center поддерживает только запланированные задания. Независимо от метода, можно настроить параметры задания и использовать отслеживание изменений файлов для более быстрых последующих запусков.
Включение и запуск дедупликации и сжатия ReFS
В Windows Admin Center можно создать расписание дедупликации и сжатия ReFS для запуска на существующем томе или новом томе во время создания тома.
Выполните следующие действия, чтобы включить дедупликацию и сжатие ReFS с помощью Центра администрирования Windows и задать расписание при выполнении:
Подключитесь к кластеру, а затем на панели "Сервис " слева выберите тома.
На странице "Тома" выберите вкладку "Инвентаризация", выберите соответствующий том, а затем выберите "Параметры". Чтобы включить дедупликацию и сжатие ReFS для нового тома, нажмите кнопку +Создать.
В области параметров тома справа в раскрывающемся списке "Дополнительные параметры" установите флажок "Использовать дедупликацию ReFS" и "Сжатие".
Выберите дни недели, когда дедупликация ReFS и сжатие должны выполняться, время запуска задания и максимальная длительность (по умолчанию не ограничено), а затем нажмите кнопку "Сохранить".
На следующем снимне экрана показано, что дедупликация и сжатие ReFS выполняются в пятницу и субботу в 10:40 с максимальной длительностью 2 часа, начиная с 9.22.2023. Если дата начала была изменена на 9.21.2023, первый запуск по-прежнему будет 9.22.2023 10:40 УТРА, так как это первая пятница после 9.21.2023.
Проверьте изменения в разделе "Свойства " тома. Расписание отображается в разделе "Свойства" и отображает разбивку экономии и следующее запланированное время выполнения. Эти экономии обновляются после каждого запуска, и вы можете наблюдать влияние производительности на диаграммах в разделе "Производительность ".
Приостановка запланированных заданий
Приостановка расписания отменяет все выполняемые задания и останавливает запланированные запуски в будущем. Этот параметр сохраняет дедупликацию ReFS и метаданные, связанные с сжатием, и продолжает отслеживать изменения файлов для оптимизированных будущих запусков. Вы можете возобновить расписание в любое время с сохраненными параметрами расписания.
Выполните следующие действия, чтобы приостановить запланированные задания с помощью Windows Admin Center:
Подключитесь к кластеру, а затем на панели "Сервис " слева выберите тома.
На странице "Тома" выберите вкладку "Инвентаризация", выберите соответствующий том, а затем выберите "Параметры".
В области параметров тома справа в раскрывающемся списке "Дополнительные параметры" установите флажок "Задать расписание" и нажмите кнопку "Сохранить".
Отключение дедупликации и сжатия ReFS на томе
Отключение дедупликации и сжатия ReFS на томе останавливает все выполняемые и отменяющие будущие запланированные задания. Кроме того, связанные метаданные тома не сохраняются, а отслеживание изменений файлов останавливается.
Если отключить эту функцию, она не отменяет дедупликацию или сжатие, так как все операции выполняются на уровне метаданных. С течением времени данные возвращаются в исходное состояние, так как том выполняет операции чтения и записи.
Примечание.
Вы можете выполнять операции распаковки с помощью ReFSUtil
.
Выполните следующие действия, чтобы отключить функцию с помощью Windows Admin Center:
Подключитесь к кластеру, а затем на панели "Сервис " слева выберите тома.
На странице "Тома" выберите вкладку "Инвентаризация", выберите соответствующий том, а затем выберите "Параметры".
В области параметров тома справа в раскрывающемся списке "Дополнительные параметры" отключите флажок "Использовать дедупликацию ReFS" и "Сжатие", а затем нажмите кнопку "Сохранить".
Часто задаваемые вопросы
В этом разделе приведены ответы на часто задаваемые вопросы о дедупликации и сжатия ReFS.
Отличается ли функция дедупликации и сжатия ReFS от дедупликации данных Windows?
Да, эта функция совершенно отличается от функции дедупликации данных Windows.
Внимание
Мы не поддерживаем одновременное включение дедупликации и сжатия ReFS и дедупликации данных Windows.
Дедупликация и сжатие ReFS предназначены для активных рабочих нагрузок, а также для минимизации влияния на производительность после оптимизации. В отличие от дедупликации данных Windows, дедупликация и сжатие ReFS не использует хранилище блоков для хранения дедупликированных данных и не участвует в перемещении физических данных. Эта функция использует клонирование блоков ReFS для включения операций только метаданных. Дедупликация данных Windows может обеспечить более высокую экономию хранилища из-за использования размеров блоков переменных, она также подходит для более широкого диапазона типов рабочих нагрузок, таких как файловые серверы общего назначения (GPFS), целевые объекты резервного копирования и многое другое.
Каковы этапы дедупликации и сжатия ReFS?
Процесс оптимизации состоит из следующих этапов, которые происходят последовательно и зависят от указанного режима. Если выполнение оптимизации достигает ограничения длительности, сжатие может не выполняться.
Инициализация. На этом этапе том хранилища проверяется, чтобы определить избыточные блоки данных.
Дедупликация данных. На этом этапе избыточные блоки являются одно экземплярами и отслеживаются с помощью клонирования блоков ReFS.
Сжатие. На этом этапе создается тепловая карта, чтобы определить, должен ли блок иметь право на сжатие. Параметры по умолчанию сжимают редко доступные или холодные данные, чтобы уменьшить их размер. Вы можете изменить уровни сжатия, чтобы настроить диапазон блоков, подходящих для сжатия.
Что происходит при достижении ограничения длительности до полной оптимизации тома?
Ограничение длительности не влияет на производительность рабочих нагрузок клиентов, вызванных заданием оптимизации в рабочие часы. Служба дедупликации отслеживает оптимизированные части тома и входящего изменения файлов. Эти данные используются в будущих заданиях для уменьшения времени оптимизации. Например, если том обрабатывается только на 30 % в первом запуске из-за ограничения длительности, последующий запуск обращается к оставшимся 70% и любым новым данным.
Известные проблемы
В следующем разделе перечислены известные проблемы, которые в настоящее время существуют с дедупликацией и сжатием ReFS.
Если сжатие включено, использование -FullRun
параметра в заданиях после первого запуска оптимизации может привести к взаимоблокировке в системе.
Состояние: открыть.
Избегайте использования -FullRun
в заданиях вручную, если это Type
не так Dedup
.
Выполните следующие действия в качестве временного обходного решения, чтобы устранить эту проблему:
Отключите дедупликацию и сжатие ReFS на томе:
Disable-ReFSDedup -Volume <path>
Распаковка тома с помощью
refsutil
:refsutil compression /c /f NONE <vol>
При необходимости повторно включите дедупликацию и сжатие ReFS с единственным режимом
Dedup
:Enable-ReFSDedup -Volume <path> -Type Dedup
Планирование заданий для одновременного выполнения на нескольких CSVs в одном кластере может активировать перемещения CSV и негативно повлиять на производительность.
Состояние: открыть.
Рекомендуется ошеломить время начала заданий, чтобы избежать перекрытия. Однако если все задания должны выполняться одновременно, настройте выделение ЦП на каждое задание во всех CSV, чтобы оно составило менее 50% от общего использования ЦП кластера. Помните, что применение ограничений ЦП может привести к более длительному времени выполнения задания.
Выполнено дедупликация reFS и задание сжатия (успешно или отменено), а экономия хранилища не указана в Get-ReFSDedupStatus
Windows Admin Center.
Состояние: разрешено.
Временное решение этой проблемы заключается в том, чтобы инициировать однократное задание и немедленно обновить результаты.
Start-ReFSDedupJob -Volume <path>
Отправка остановленного мониторинга событий трассировки событий для Windows (ETW) после отключения дедупликации и сжатия ReFS на томе.
Состояние: разрешено.
После отключения дедупликации и сжатия ReFS на томе канал ETW для журналов дедупликации ReFS повторялись остановленные события мониторинга. Тем не менее, мы не ожидаем значительного влияния на использование из-за этой проблемы.
Событие сбоя задания не регистрируется, если том перемещается на другой узел во время сжатия.
Состояние: разрешено.
Если CSV-файл перемещается на другой сервер кластера во время сжатия, событие сбоя задания не регистрируется в канале дедупликации ReFS. Тем не менее, мы не ожидаем значительного влияния на использование из-за этой проблемы.