Поделиться через


Рекомендации по производительности хранилища Azure NetApp Files с холодным доступом

Наборы данных не всегда активно используются. До 80% данных в наборе можно считать "неактивными", то есть в настоящее время они не используются или к ним не осуществлялся доступ в последнее время. При хранении данных в хранилище с высокой производительностью, таких как Azure NetApp Files, деньги, потраченные на использование емкости, по сути, расходуются, так как холодные данные не требуют высокого уровня производительности, пока не будет доступ к нему снова.

Хранилище Azure NetApp Files с холодным доступом предназначено для снижения затрат на облачное хранилище в Azure. Существуют рекомендации по производительности в конкретных случаях использования, которые необходимо учитывать.

Доступ к данным, перемещающимся на холодные уровни, вызывает большую задержку, особенно для случайных операций ввода-вывода. В наихудшем случае все получаемые данные могут находиться в холодном классе, поэтому каждому запросу необходима будет процедура извлечения данных. Это редкость, чтобы все данные в активно используемого массива были на холодном слое хранения, поэтому вряд ли можно наблюдать такую задержку.

Если выбрана политика извлечения доступа по умолчанию, последовательные операции чтения I/O обслуживаются непосредственно из холодного уровня и не переносятся в горячий уровень. Случайным образом считываемые данные заново записываются в горячий уровень, увеличивая производительность последующих операций чтения. Оптимизация для последовательных нагрузок часто снижает задержку, возникающую при получении данных из облака по сравнению со случайными считываниями, что в свою очередь повышает общую производительность.

В недавнем тесте, выполняемом с использованием хранилища уровня "Стандартный" с холодным доступом для Azure NetApp Files, были получены следующие результаты.

Замечание

Все опубликованные результаты предназначены только для ссылочных целей. Результаты не гарантируются, так как производительность рабочих нагрузок в рабочей среде может отличаться из-за многочисленных факторов.

100% последовательных чтений на горячем/холодном уровне (одно задание)

В следующем сценарии на томе 50-ТиБ Azure NetApp Files, используя уровень производительности Ultra, была выполнена одна задача на виртуальной машине D32_V5. Различные размеры блоков использовались для тестирования производительности на горячих и холодных уровнях.

Замечание

Максимальное значение для уровня обслуживания "Ультра" составляет 128 МиБ/с на тебибайт выделенной емкости. Стандартный том Azure NetApp Files может управлять пропускной способностью до примерно 5000 МиБ/с.

На следующем графике показана производительность уровня охлаждения для этого теста с использованием разных уровней глубины очереди. Максимальная пропускная способность для одной виртуальной машины составляет примерно 400 МиБ/с.

Диаграмма пропускной способности холодного уровня при различных размерах блоков.

Производительность горячего уровня была в 2,75 раза лучше, достигая примерно 1180 МиБ/с.

Диаграмма пропускной способности горячего уровня при различных размерах блоков.

На этом графике показано параллельное сравнение производительности холодного и горячего уровня с размером блока размером 256 КБ.

Диаграмма пропускной способности при различных

Что приводит к задержке на горячих и холодных уровнях?

Задержка на горячем уровне — это фактор самой системы хранения, где системные ресурсы исчерпаны при отправке большего количества операций ввода-вывода в службу, чем можно обрабатывать в любое время. В результате операции должны быть в очереди до тех пор, пока ранее отправленные операции не будут завершены.

Задержка на холодном уровне обычно наблюдается при операциях извлечения из облака: либо при сетевых запросах ввода-вывода в хранилище объектов (последовательные рабочие нагрузки), либо при восстановлении холодных блоков на горячем уровне (случайные рабочие нагрузки).

Сводка результатов

  • Если рабочая нагрузка составляет 100% последовательно, пропускная способность холодного уровня уменьшается примерно на 47% по сравнению с горячим уровнем (3330 МиБ/с по сравнению с 1742 МиБ/с).
  • Если рабочая нагрузка составляет 100% случайным образом, пропускная способность холодного уровня уменьшается примерно на 88% по сравнению с горячим уровнем (2479 МиБ/с по сравнению с 280 МиБ/с).
  • Снижение производительности для горячего уровня при выполнении 100% последовательных (3,330 МиБ/с) и 100% случайных рабочих нагрузок (2,479 МиБ/с) было примерно 25%. Снижение производительности для холодного уровня при выполнении 100% последовательно (1742 МиБ/с) и 100% случайных рабочих нагрузок (280 MiB/s) было примерно 88%.
  • Если рабочая нагрузка содержит любой процент случайных операций ввода-вывода, общая пропускная способность для холодного уровня ближе к 100% случайных операций ввода-вывода, чем к 100% последовательным.
  • Чтения из холодного уровня уменьшились примерно на 50% при переходе с 100% последовательных к смеси из 80% последовательных и 20% случайных.
  • Последовательный ввод-вывод может воспользоваться преимуществами кэша readahead в Azure NetApp Files, чем не могут случайные операции ввода-вывода. Это преимущество для последовательного ввода-вывода помогает сократить общие различия производительности между горячими и холодными уровнями.

Рекомендации и рекомендации

  • Если рабочая нагрузка часто изменяет шаблоны доступа непредсказуемым образом, холодный доступ может не быть идеальным из-за различий производительности между горячими и холодными уровнями.
  • Если рабочая нагрузка содержит какой-либо процент случайных операций ввода-вывода, следует соответствующим образом настроить ожидания производительности при доступе к данным на холодном уровне.
  • Настройте параметры прохладного режима и настройки получения данных из холодного хранилища, чтобы соответствовать шаблонам рабочей нагрузки и свести к минимуму извлечение из холодного уровня хранения.
  • Производительность от холодного доступа может отличаться в зависимости от набора данных и системной нагрузки, в которой работает приложение. Рекомендуется проводить соответствующие тесты с набором данных, чтобы понять и учитывать дисперсию производительности от холодного доступа.

Дальнейшие шаги