Поделиться через


Создание хранилища знаний для более надежных пространств Genie

Хранилище знаний Genie позволяет курировать и улучшать пространство с помощью локализованных метаданных, сопоставления запросов и структурированных инструкций SQL. Эти функции помогают Genie понимать данные и создавать более точные и соответствующие ответы.

Что такое хранилище знаний?

Хранилище знаний — это коллекция курируемых семантических определений, которые повышают понимание данных Genie и повышают точность отклика.

Хранилище знаний состоит из следующих элементов:

  • Настройка метаданных уровня пространства: описания, специфичные для пространства, для таблиц, столбцов и бизнес-терминов и синонимов.
  • Настройка данных на уровне пространства: упрощенные, ориентированные наборы данных без изменения базовых таблиц каталога Unity.
  • Сопоставление запросов: примеры, которые помогают Genie сопоставлять значения, наиболее релевантные для вопроса пользователя и исправлять проблемы орфографии в запросах пользователей. Это включает помощь в формате и сопоставление сущностей.
  • Связи соединения: определенные связи таблиц для точных JOIN инструкций.
  • Выражения SQL: структурированные определения мер, фильтров и измерений, которые фиксируют бизнес-логику.

Все конфигурации хранилища знаний ограничены пространством Genie и не влияют на метаданные каталога Unity или другие ресурсы Azure Databricks.

Управление метаданными хранилища знаний

Обучите Genie данным в вашем пространстве, предоставляя описания локальных таблиц и столбцов, а также добавляя синонимы столбцов, которые соответствуют распространённым бизнес-терминам. Упростите наборы данных, скрывая ненужные или дублирующиеся столбцы, чтобы Genie оставался сосредоточенным.

Эти методики повышают удобство использования для пользователей, у которых нет прямых разрешений на базовые таблицы, и они также поддерживают более быстрые итерации при обновлении версий инструкций.

Чтобы получить доступ к метаданным уровня пространства, в пространстве Genie щелкните "Настроить данные>" . Затем щелкните имя таблицы, чтобы просмотреть ее метаданные и столбцы.

Просмотр столбцов

Щелкните имя таблицы, чтобы просмотреть общие сведения о названиях столбцов и их подробностях. В следующем примере показан пример из таблицы с именем accounts.

Обзор таблицы с описанием метаданных и сведениями о столбцах, как описано ниже.

  • Описание: Genie использует метаданные для понимания данных и создания точных ответов. В описании таблицы по умолчанию показаны метаданные каталога Unity, связанные с ресурсом данных. Измените это описание, чтобы добавить конкретные указания, которые помогут Генни создавать SQL для вашего пространства. Нажмите кнопку "Сброс" , чтобы восстановить описание каталога Unity.

  • Столбцы: Имена столбцов и описания включены в список столбцов. Каждый столбец помечен тегами, которые показывают, включена ли поддержка формата или сопоставление сущностей. См. общие сведения о сопоставлении запросов.

Скрытие или отображение соответствующих столбцов

Столбцами можно управлять по отдельности или массово. Используйте следующие инструкции, чтобы скрыть или показать столбцы.

  • Скрыть один столбец: щелкните значок " рядом с именем столбца.
  • Скрытие нескольких столбцов:
    • Установите флажки для столбцов, которые нужно скрыть.
    • В меню "Действия" выберите "Скрыть выбранные столбцы".
  • Отмена изменений. Повторите те же действия, чтобы показать скрытый столбец.

Изменение метаданных столбца

Для каждого столбца можно настроить следующее:

  • Описание: описания столбцов для конкретного пространства, которые улучшают понимание Genie.
  • Синонимы: бизнес-термины и ключевые слова, которые помогают сопоставить язык пользователя с именами столбцов.
  • Дополнительные настройки: параметры сопоставления запросов.
    • Поддержка формата: включить или отключить выборку репрезентативных значений.
    • Сопоставление сущностей: включение или отключение сопоставления сущностей для категориальных столбцов.

Чтобы изменить метаданные столбца, выполните приведенные действия.

  1. Щелкните значок карандаша рядом с именем столбца.
  2. Измените описание и синонимы для столбца.
  3. При необходимости нажмите "Дополнительные параметры", чтобы открыть управление соответствием подсказок.
  4. Нажмите кнопку "Сохранить", чтобы сохранить изменения и закрыть диалоговое окно.

Общие сведения о сопоставлении запросов

Сопоставление запросов позволяет Genie сопоставлять столбцы и значения, наиболее релевантные вопросу пользователя, и исправлять проблемы орфографии в запросах пользователей. Это повышает точность Genie и помогает создавать более надежные запросы SQL.

Когда пользователь задает вопрос в Genie, постановка часто носит разговорный характер и может включать ошибки, например, опечатки. В таких случаях значения в запросе могут не совпадать со структурой или значениями данных. Это может привести к тому, что система Genie неправильно интерпретирует вопрос и создает неправильный SQL.

Example

Просмотрите следующий пример:

"Показать мне продажи автомобилей во Флориде для Q1".

Если данные используют сокращенные состояния (например FL), и Genie не может получить доступ к значениям для этого столбца, Genie может создать SQL, который включает ILIKE '%Florida%', что не возвращает результатов.

Включение сопоставления сущностей в столбце state позволяет Genie получать доступ к репрезентативным значениям. В этом контексте Genie может распознать, что FL соответствует "Флориде" и создавать более точный SQL.

Без сопоставления сущностей С использованием сопоставления сущностей
WHERE state ILIKE '%Florida%' WHERE state = 'FL'

Компоненты сопоставления с запросом

  • Помощь в формате: помощь в форматировании предоставляет репрезентативные значения для всех подходящих столбцов, помогая Genie понять типы данных и шаблоны форматирования. Для сопоставления prompt-запросов создаются репрезентативные значения с использованием разрешений на доступ к данным автора. Эти значения становятся частью общего контекста пространства и помогают Genie интерпретировать запросы пользователей более точно для всех участников пространства.
  • Сопоставление сущностей: сопоставление сущностей предоставляет проверенные списки уникальных значений для до 120 столбцов, где пользователи, скорее всего, ссылаются на определенные записи, такие как состояния и категории продуктов. Это помогает Genie сопоставлять терминологию пользователей с фактическими значениями данных. Каждый столбец может содержать до 1024 различных значений, каждая из которых составляет до 127 символов. Данные сопоставления сущностей хранятся в контейнере хранилища рабочей области.

Genie автоматически предоставляет помощь в форматировании и сопоставление сущностей для подходящих столбцов при добавлении таблиц в пространство. Таблицы с фильтрами строк или масками столбцов исключаются из сопоставления запросов.

Управление сопоставлением запросов

Контроль над тем, какие столбцы предоставляют помощь с форматированием и сопоставление сущностей для оптимизации того, как Genie понимает ваши данные. Сопоставление запросов по умолчанию включено для всех пространств Genie.

Управление поддержкой по настройке форматов

Поддержка форматирования автоматически применяется при добавлении таблиц в пространство Genie.

Чтобы отключить помощь в формате для столбца:

  1. Щелкните "Настроить > данные " в пространстве Genie.
  2. Щелкните имя таблицы, чтобы просмотреть его столбцы.
  3. Щелкните значок карандаша рядом с именем столбца.
  4. Нажмите кнопку "Дополнительно".
  5. Отключение поддержки форматирования .

Это действие также автоматически отключает сопоставление сущностей для этого столбца. При необходимости используйте этот параметр для включения помощи с форматированием.

Настройка сопоставления сущностей

Genie генерирует ответы с помощью вашего запроса, релевантных метаданных таблицы, возможностей соответствия запросов, сигналов ошибок и любого введенного кода или запроса. Если в столбце включено сопоставление сущностей, Genie использует сохраненные в столбце значения для более точного сопоставления пользовательских запросов с фактическими данными. Это создает более надежные запросы SQL. Сопоставление сущностей значительно повышает точность Genie, особенно при сочетании с четкими примерами запросов и хорошо созданных инструкций. Дополнительные рекомендации см. в разделе о создании эффективного пространства Genie.

Genie запрещает включение сопоставления сущностей в таблицах с фильтрами строк или масками столбцов. Однако авторы пространства должны отключить сопоставление сущностей для представлений, которые ссылаются на таблицы с фильтрами строк или масками столбцов или динамическими представлениями.

Сопоставление сущностей поддерживает только строковые столбцы. В следующем списке приведены примеры типов данных, которые хорошо работают с сопоставлением сущностей:

  • Коды штата или страны
  • Категории продуктов
  • Коды состояния
  • Имена отделов

Чтобы включить сопоставление сущностей, необходимо включить помощь форматирования. После этого выполните следующие действия:

  1. Щелкните "Настроить > данные " в пространстве Genie.
  2. Щелкните имя таблицы, чтобы просмотреть его столбцы.
  3. Щелкните значок карандаша рядом с именем столбца.
  4. Нажмите кнопку "Дополнительно".
  5. Включите сопоставление сущностей .
  6. Чтобы отключить сопоставление сущностей для столбца, отключите сопоставление сущностей .

Строковый столбец с кнопкой словаря значений справа.

Обновите или удалите данные, соответствующие запросу

Обновление запроса, соответствующего данным, обновляет сохраненные значения столбца. Обновите значения, если:

  • В столбец добавлены новые значения.
  • Формат существующих значений изменился.

Чтобы обновить соответствие данных запроса, щелкните значок меню Kebab в режиме представления столбцов, а затем обновите соответствие запроса.

Обновление значений или удаление параметров в пользовательском интерфейсе

Определение связей соединения

Помогите Genie создать точные JOIN утверждения, определяя связи таблиц:

  1. Нажмите кнопку "Присоединиться".
  2. Нажмите кнопку "Добавить".
  3. Выберите левую и правую таблицы в раскрывающихся меню.
  4. Введите условие соединения (например, accounts.id = opportunity.accountid)
    • Для более сложных условий соединения нажмите кнопку "Использовать выражение SQL ", а затем запишите условие соединения в виде выражения SQL.
  5. Выберите тип связи:
    • Многие к одному: Несколько левых строк сопоставляется с одной правой строкой
    • Один ко многим: одна строка слева соответствует нескольким строкам справа
    • Один к одному: одна левая строка сопоставляется не более чем с одной правой строкой

Инструкции по присоединению, показывающие одну определяемую связь соединения

Замечание

Если используются несколько соединений между одинаковыми таблицами или самосоединениями, Genie автоматически создает псевдонимы для правой таблицы, чтобы избежать неоднозначности.

Получите предложения из обратной связи

Когда пользователи щелкают пальцем на сообщении, которое присоединяет таблицы или использует выражения SQL, или когда они скачивают результаты запроса, Genie анализирует ответ и может предложить новые фрагменты КОДА SQL (например, меры, соединения или фильтры), чтобы авторы пространства могли просматривать и добавлять в хранилище знаний. Genie не обучается автоматически и не изменяет свое поведение на основе обратной связи.

Определение выражений SQL

Интерфейс выражений SQL, показывающий меры, фильтры и измерения

Выражения SQL предоставляют структурированный, управляемый способ обучения Genie общим бизнес-терминам, таким как ключевые показатели эффективности, атрибуты и условия. Затем Genie использует эти определения, когда пользователь спрашивает об этих бизнес-терминах.

Выражения SQL дополняют примеры запросов SQL, указанных в инструкциях. Выражения SQL определяют многократно используемые бизнес-понятия, но примеры запросов SQL более полезны для обучения Genie, как подходить к общим форматам запросов пользователей. Например, если пользователи часто запрашивают "разбивку производительности", пример SQL-запроса может показать, что это означает закрытые продажи по регионам, представителям продаж и менеджеру.

Выражения SQL лучше всего работают при необходимости:

  • Предоставление структурированных определений для ключевых показателей эффективности и метрик, таких как прибыль или коэффициент преобразования
  • Дайте Genie чёткий контекст для вычисления важных значений
  • Определение дополнительных измерений для набора данных, например месяца или сегмента клиента
  • Настройка фильтров Genie для бизнес-условий, таких как большие заказы или заказы до определенного времени.

Типы выражений SQL

Можно определить следующие типы выражений SQL:

  • Меры: ключевые показатели эффективности (ключевые показатели эффективности) и метрики. Определите имя, вычисление SQL и синонимы.
  • Фильтры: распространенные условия фильтрации. Определите имя, логику фильтра SQL и синонимы.
  • Измерения: атрибуты для группировки и анализа данных. Определите имя, выражение SQL и синонимы.

Используйте следующие инструкции для определения выражений SQL:

  1. Щелкните Настройка>Руководства>SQL-выражения
  2. Нажмите кнопку "Добавить". Выберите фильтр, меру или измерение.
  3. В поле "Имя" введите имя выражения.
  4. В поле "Код" введите выражение SQL.
  • Выражения фильтра должны оцениваться логическим условием.
  • Выражения мер должны вычислять агрегирование по нескольким строкам в таблице.
  • Выражения измерения должны изменять значение каждой строки из существующих данных.
  1. В поле "Синонимы" введите распространенные способы, которыми пользователи могут ссылаться на выражения.
  2. В поле "Инструкции" введите конкретные инструкции, которые сообщают Genie, что такое выражение и как работать с ним.

Дальнейшие шаги

Чтобы продолжить сборку пространства Genie, воспользуйтесь приведенными ниже ссылками.