Поделиться через


Цены на Схема данных Microsoft Purview

В этом руководстве рассматриваются рекомендации по ценообразованию для карты данных на портале управления Microsoft Purview.

Полные сведения о ценах для Microsoft Purview (прежнее название — Azure Purview) см. в обзоре руководства по ценам.

Сведения о конкретных ценах см. на странице цен на Microsoft Purview (прежнее название — Azure Purview). В этой статье описаны функции и факторы, влияющие на цены на Схема данных Microsoft Purview.

Прямые затраты, влияющие на ценообразование для Схема данных Microsoft Purview, основаны на следующих трех измерениях:

Карта эластичных данных

  • Карта данных является основой архитектуры портала управления Microsoft Purview и поэтому должна быть обновлена с информацией об ресурсах в пространстве данных в любой точке.

  • Плата за карту данных взимается в единицах емкости (CU). Карта данных подготавливается в одном CU, если в каталоге хранится до 10 ГБ хранилища метаданных и обслуживается до 25 операций карты данных в секунду.

  • При первом создании учетной записи карта данных всегда подготавливается в одном CU.

  • Однако карта данных автоматически масштабируется между минимальными и максимальными ограничениями этого окна эластичности, чтобы удовлетворить изменения в карте данных в отношении двух ключевых факторов: пропускной способности операций и хранилища метаданных.

Пропускная способность операции

  • Фактор, управляемый событиями, основанный на операциях создания, чтения, обновления, удаления, выполненных на карте данных.
  • Ниже приведены некоторые примеры операций карты данных:
    • Создание ресурса в схеме данных
    • Добавление связи к ресурсу, такому как владелец, стюард, родитель, происхождение
    • Изменение ресурса для добавления бизнес-метаданных, таких как описание, термин глоссария
    • Поиск по ключевым словам, возвращающий результаты на страницу результатов поиска
    • Импорт или экспорт сведений с помощью API
  • Если на карте данных выполняется несколько запросов, количество операций ввода-вывода также увеличивается, что приводит к увеличению масштаба карты данных.
  • Число одновременно работающих пользователей также формирует фактор, определяющий единицу емкости карты данных.
  • Другие факторы, которые следует учитывать, это тип поискового запроса, взаимодействие с API, рабочие процессы, утверждения и т. д.
  • Уровень ускорения данных
    • Если требуется больше пропускной способности операций в секунду, карта данных может автомасштабироваться в окне эластичности для удовлетворения измененной нагрузки.
    • Это составляет характеристику всплеска , которая должна быть оценена и запланирована
    • Характеристика всплеска состоит из уровня всплеска и длительности всплеска , для которого существует всплеск.
      • Уровень всплеска является мультипликативным индексом ожидаемой последовательной эластичности в устойчивом состоянии
      • Длительность всплеска — это процент месяца, в который ожидаются такие всплески (в эластичности) из-за увеличения метаданных или большего числа операций на карте данных.

Хранилище метаданных

  • Если количество ресурсов уменьшается в пространстве данных, а затем удаляется в схеме данных путем последующих добавочных проверок, компонент хранилища автоматически уменьшается и, таким образом, масштаб карты данных уменьшается.

Автоматическое сканирование, классификация и прием

Существует два основных автоматизированных процесса, которые могут активировать прием метаданных в Схема данных Microsoft Purview:

  • Автоматическое сканирование с помощью собственных соединителей. Этот процесс включает в себя три main шага:

    • Проверка метаданных
    • Автоматическая классификация
    • Прием метаданных в Схема данных Microsoft Purview
  • Автоматический прием с использованием конвейеров Фабрика данных Azure и (или) Azure Synapse. Этот процесс включает:

    • Прием метаданных и происхождения в Схема данных Microsoft Purview, если учетная запись подключена к каким-либо конвейерам Фабрика данных Azure или Azure Synapse.

Автоматическое сканирование с помощью собственных соединителей

  • Полная проверка обрабатывает все ресурсы в выбранном область источника данных, в то время как добавочное сканирование обнаруживает и обрабатывает ресурсы, которые были созданы, изменены или удалены с момента предыдущего успешного сканирования.

  • Все проверки (полные или добавочные) будут собирать обновленные, измененные или удаленные ресурсы.

  • Важно учитывать и избегать сценариев, когда несколько людей или групп, принадлежащих к разным отделам, настраивают проверки для одного и того же источника данных, что приводит к более расценкам на повторную проверку.

  • Запланируйте частые добавочные проверки после первоначальной полной проверки в соответствии с изменениями в пространстве данных. Это обеспечит постоянную актуальность карты данных, а добавочные проверки потребляют меньше времени работы виртуальных ядер по сравнению с полной проверкой.

  • Ссылка "Просмотреть сведения" для источника данных позволит пользователям выполнять полную проверку. Однако рекомендуется выполнять добавочные проверки после полной проверки для оптимизированного сканирования, за исключением случаев изменения набора правил сканирования (классификации или типы файлов).

  • Регистрация источника данных в родительской коллекции и проверка области в дочерней коллекции с различными элементами управления доступом, чтобы гарантировать отсутствие повторяющихся затрат на сканирование

  • Сократите количество пользователей, которым разрешено регистрировать источники данных для сканирования с помощью детального управления доступом и роли администратора источника данных с помощью авторизации коллекции. Это обеспечит возможность регистрации только допустимых источников данных и контроля времени сканирования виртуальных ядер, что приведет к снижению затрат на сканирование.

  • Учитывайте, что тип источника данных и количество проверяемых ресурсов влияют на длительность сканирования.

  • Создание настраиваемых наборов правил сканирования , включающих только подмножество типов файлов , доступных в вашем пространстве данных, и классификации , соответствующие бизнес-требованиям, чтобы обеспечить оптимальное использование сканеров.

  • Создавая новое сканирование для источника данных, следуйте порядку подготовки, рекомендуемой перед фактическим выполнением сканирования. Сюда входит сбор требований к бизнес-классификациям и типам файлов (для учетных записей хранения), чтобы можно было определить соответствующие наборы правил проверки, чтобы избежать нескольких проверок и контролировать ненужные затраты на несколько проверок с учетом пропущенных требований.

  • Согласование расписаний сканирования с размером виртуальных машин Self-Hosted Integration Runtime (SHIR) (Виртуальные машины), чтобы избежать дополнительных затрат, связанных с виртуальными машинами

Автоматический прием с использованием конвейеров Фабрика данных Azure и (или) Azure Synapse

  • Метаданные и данные происхождения помечаются из конвейеров Фабрика данных Azure или Azure Synapse каждый раз, когда конвейеры выполняются в исходной системе.

Расширенные наборы ресурсов

  • Схема данных Microsoft Purview использует наборы ресурсов для решения задачи сопоставления большого количества ресурсов данных с одним логическим ресурсом, предоставляя возможность сканировать все файлы в озере данных и находить шаблоны (GUID, шаблоны локализации и т. д.), чтобы сгруппировать их как один ресурс в схеме данных.

  • Расширенный набор ресурсов — это необязательная функция, которая позволяет клиентам получать расширенные сведения о наборе ресурсов, такие как общий размер, количество секций и т. д., а также позволяет настраивать группирование наборов ресурсов с помощью правил шаблонов. Если функция Расширенного набора ресурсов не включена, каталог данных по-прежнему будет содержать ресурсы набора ресурсов, но без агрегированных свойств. В этом случае клиенту не выставляется счет за использование счетчика "Набор ресурсов".

  • Используйте базовую функцию набора ресурсов, прежде чем переключаться на расширенные наборы ресурсов в Схема данных Microsoft Purview, чтобы проверить, выполнены ли требования.

  • Рассмотрите возможность включения расширенных наборов ресурсов, если:

    • Схема озера данных постоянно меняется, и вы ищете больше значений, помимо базовой функции набора ресурсов, чтобы Схема данных Microsoft Purview вычислили параметры, такие как #partitions, размер хранилища данных и т. д., как услуга.
    • Необходимо настроить группирование ресурсов.
  • Важно отметить, что выставление счетов для расширенных наборов ресурсов основано на вычислениях, используемых автономным уровнем для агрегирования сведений о наборе ресурсов, и зависит от размера или количества наборов ресурсов в каталоге.

Дальнейшие действия