Поделиться через


Обнаружение функций и отслеживание происхождения признаков

С помощью Хранилища компонентов Databricks вы можете:

  • Поиск таблиц признаков по имени, признаку, источнику данных или тегу.
  • Управление доступом к таблицам признаков.
  • Определение источников данных, используемых для создания таблицы признаков.
  • Определение моделей, использующих определенный признак.
  • Добавление тега в таблицу признаков.
  • Проверка актуальность признаков.

Чтобы получить доступ к пользовательскому интерфейсу Магазина компонентов, на боковой панели выберите Машинное обучение > Хранилище компонентов. Пользовательский интерфейс Хранилища компонентов перечисляет все доступные таблицы компонентов, а также функции в таблице и следующие метаданные:

  • Создатель таблицы признаков.
  • Источники данных, применяемые для расчета таблицы признаков.
  • Онлайн-хранилища, в которых была опубликована таблица признаков.
  • Запланированные задания, которые вычисляют признаки в таблице признаков.
  • Последнее время, когда записная книжка или задание были записаны в таблицу признаков.

Feature store page

Поиск и просмотр таблиц признаков

Для поиска таблиц признаков используйте поле поиска. Можно ввести имя или часть имени таблицы признаков, признака или источника данных, используемых для вычисления признаков. Можно также ввести весь ключ или значение тега либо их часть. В тексте поиска регистр не учитывается.

Feature search example

Управление доступом к таблицам признаков

Дополнительные сведения см. в статье Управление доступом к таблицам признаков

Отслеживание происхождения и актуальности признаков

В пользовательском интерфейсе можно отслеживать, как был создан признак и где он используется. Например, можно отформатировать необработанные источники данных, записные книжки и задания, которые использовались для вычислений признаков. Вы также можете отслеживать онлайн-хранилища, в которых опубликован признак, обученные с его использованием модели, обслуживающие конечные точки, которые к нему обращаются, а также записные книжки и задания, которые его считывают.

В пользовательском интерфейсе хранилища признаков щелкните имя любой таблицы признаков, чтобы отобразить страницу таблицы признаков.

На странице таблицы признаков в таблице Производители содержатся сведения обо всех записных книжках и заданиях, записывающих данные в эту таблицу признаков, что позволяет легко проверять состояние запланированных заданий и актуальность таблицы.

producers table

В таблице Признаки перечислены все признаки в таблице и приведены ссылки на модели, конечные точки, задания и записные книжки, использующие данный признак.

features table

Чтобы вернуться на основную страницу пользовательского интерфейса хранилища признаков, щелкните Хранилище признаков в верхней части страницы.

Добавление тега в таблицу признаков

Теги — это пары "ключ-значение", которые можно создать и использовать для поиска таблиц признаков.

  1. На странице таблицы компонентов щелкните Tag icon , если он еще не открыт. Отобразится таблица тегов.

    tag table

  2. Щелкните поля Имя и Значение и введите ключ и значение для тега.

  3. Нажмите кнопку Добавить.

    add tag

Изменение или удаление тега

Чтобы изменить или удалить существующий тег, используйте значки в столбце Действия.

tag actions