Поделиться через


Организовать эффективное пространство Genie

Цель курирования пространства Genie — создать среду, в которой бизнес-пользователи могут задавать вопросы на естественном языке и получать точные, согласованные ответы на основе своих данных. Genie spaces использует расширенные модели, которые создают сложные запросы и понимают общие знания о мире.

Большинство бизнес-вопросов являются предметными, поэтому роль куратора пространства заключается в том, чтобы преодолеть разрыв между общими мировыми знаниями и специализированным языком, используемым в определенном домене или определенной компанией. Кураторы используют метаданные и инструкции, чтобы Генни точно интерпретировала и отвечала на вопросы бизнес-пользователей. В этой статье описаны рекомендации и принципы разработки успешного пространства.

Рекомендации по определению нового пространства

Имейте в виду эти руководящие принципы, так как вы создаете пространство Genie:

  • Укажите краткие, целевые наборы данных: разрешите неоднозначность столбцов и предварительно присоедините или денормализуйте таблицы с помощью представлений или представлений метрик. Упрощенные наборы данных повышают способность Гени точно отвечать на вопросы о данных.
  • Ставьте выражения SQL и примеры SQL выше текстовых инструкций: используйте выражения SQL для определения таких бизнес-семантических структур, как метрики и фильтры. Используйте пример SQL, чтобы научить Genie обрабатывать распространенные неоднозначные запросы. Зарезервируйте текстовые инструкции для общих рекомендаций, которые не соответствуют структурированным определениям.
  • Напишите четкие, конкретные текстовые инструкции: избегайте расплывчатых инструкций. Например, вместо "Задать вопросы о продажах", напишите "Когда пользователи спрашивают о метриках продаж без указания имени продукта или канала продаж, попросите: Чтобы продолжить анализ продаж, укажите название продукта и канал продаж".
  • Избегайте конфликтов инструкций. Обеспечение согласованности для всех типов инструкций. Например, если текстовые инструкции указывают округление десятичных знаков до двух цифр, примеры запросов SQL также должны округлиться до двух цифр.

В следующих разделах приведены подробные рекомендации по созданию пространств и устранению проблем с точностью.

Начало с малого

Обработка пространства Genie — это итеративный процесс. При создании нового пространства начните как можно меньше, с минимальными инструкциями и ограниченным набором вопросов для ответа. Затем вы можете добавлять элементы по мере итерации на основе отзывов и мониторинга. Этот подход помогает упростить создание и обслуживание пространства и позволяет эффективно управлять им в ответ на реальные потребности пользователей.

Используйте следующие рекомендации, чтобы создать небольшое пространство Genie:

  • Оставайтесь сосредоточенными: включите только таблицы, необходимые для ответа на вопросы, которые должно обрабатывать пространство. Нацелитесь на пять или меньше таблиц. Чем более сфокусирован ваш выбор, тем лучше. Сужение фокуса на небольшом количестве данных — оптимальный подход, поэтому ограничьте количество столбцов в используемых таблицах.
  • Работайте в пределах лимита в 25 таблиц: Пространства Genie поддерживают до 25 таблиц или представлений. Если для раздела данных требуется более 25 таблиц, перед добавлением их в пространство объединяйте связанные таблицы в представления, или представления метрик. Представления метрик особенно эффективны для пространств Genie, так как они предварительно определяют метрики, измерения и агрегаты. Этот подход помогает оставаться в пределах предела, упрощает модель данных и может повысить точность отклика Genie. Дополнительные сведения о добавлении объектов данных в пространство см. в статье "Управление объектами данных ".
  • Планирование итерации. Начните с минимальной настройки пространства, фокусируясь на основных таблицах и основных инструкциях. Добавьте более подробные рекомендации и примеры по мере того, как вы уточняете пространство с течением времени, а не стремитесь к совершенству изначально.
  • Основывайтесь на хорошо аннотированных таблицах: Genie использует имена столбцов и описания Unity Catalog для создания ответов. Очистка имен и описаний столбцов помогает создавать высококачественные ответы. Описания столбцов должны предлагать точные контекстные сведения. Избегайте неоднозначных или ненужных подробностей. Проверьте все описания, созданные ИИ, для точности и ясности, и используйте их только в том случае, если они соответствуют тому, что вы будете предоставлять вручную.

Пусть эксперт в области определит пространство

Эффективный создатель пространства должен понять данные и аналитические сведения, которые можно извлечь из него. Аналитики данных, знающие SQL, как правило, обладают необходимыми знаниями и навыками для курирования пространства.

Определение цели пространства

Определение конкретной аудитории и цели вашего пространства помогает решить, какие данные, инструкции и тестовые вопросы следует использовать. Пространство должно отвечать на вопросы для конкретной темы и аудитории, а не общие вопросы в различных доменах. Вы можете упростить наборы данных, предварительно присоединив таблицы и удалив ненужные столбцы перед добавлением данных в пространство. При добавлении данных в пространство, сосредоточьтесь на его определенной цели. Скрытие любых столбцов, которые могут быть запутаны или неприменимы. См. раздел "Скрыть" или показать соответствующие столбцы.

Добавление метаданных и синонимов

Синонимы столбцов и пользовательские описания можно добавить в данные в пространстве Genie. Эти метаданные ограничены пространством Genie и не перезаписывают метаданные, хранящиеся в каталоге Unity. Качественные описания столбцов и синонимы помогают Genie лучше понять столбец, выбрать его для соответствующих вопросов и написать более точный SQL. См. раздел "Изменить метаданные столбца".

Использование выборки данных Genie

Выборка данных улучшает точность работы Genie, извлекая значения из наборов данных в соответствующем пространстве, что помогает ему лучше сопоставлять пользовательские запросы с правильными столбцами и значениями. Genie автоматически сэмплирует значения из таблиц во время создания пространства. Вы можете управлять выбором столбцов, для которых собираются данные. См. статью "Управление объектами данных " и создание хранилища знаний для более надежных пространств Genie.

Укажите ориентированные примеры и инструкции

Пространства Genie работают наиболее эффективно с ограниченным, нацеленным набором инструкций. Databricks рекомендует использовать примеры SQL-запросов для предоставления инструкций в вашем контексте. Примеры запросов SQL позволяют Genie сопоставлять запросы пользователей с проверенными запросами SQL и учиться на примерах, чтобы ответить на связанные вопросы. Смотрите примеры запросов и функций SQL.

Для контекста, который следует применять глобально в пространстве Genie, небольшой, хорошо упорядоченный набор инструкций обычного текста также может помочь поддерживать релевантность и повысить качество отклика. Слишком много инструкций может снизить эффективность, особенно в более длительных беседах, потому что Genie может бороться с приоритетом наиболее важных рекомендаций. Дополнительные сведения см. в разделе "Указание инструкций".

Выбор подходящего типа инструкции

Используйте следующие рекомендации для выбора между выражениями SQL и примерами запросов SQL:

  • Используйте выражения SQL для распространенных бизнес-терминов: при определении часто используемых метрик, фильтров или измерений, представляющих стандартные бизнес-понятия, используйте выражения SQL в хранилище знаний. Выражения SQL являются эффективными и многократно используемыми определениями, которые помогают Genie понять бизнес-логику. Примеры: валовая маржа, последние продажи и коэффициент преобразования. См. раздел "Определение выражений SQL".
  • Используйте примеры запросов SQL для сложных вопросов: при решении трудных для понимания или многокомпонентных вопросов предоставьте полный пример запроса SQL. В этих примерах показано Genie, как обрабатывать сложные шаблоны запросов и многошаговую логику. Например, вы можете создавать запросы SQL для запросов, таких как "разбивка производительности моей команды" или "Для клиентов, которые только присоединились в последнее время, какие продукты делают лучшие?". Смотрите примеры запросов и функций SQL.

Попросите Гени задать вопросы о уточнении

Чтобы побудить Genie задавать вопросы для уточнения в определенных сценариях, ясно указать, когда следует запрашивать пояснения и как действовать дальше. Используйте четкие инструкции, определяющие как условия активации, так и ожидаемое поведение уточнения.

Например, добавьте в пространство следующий тип инструкции:

Когда пользователи спрашивают о разбивке по производительности продаж, но не включают диапазон времени, канал продаж или ключевые показатели эффективности в запросе, необходимо сначала задать вопрос о уточнении, чтобы собрать необходимые сведения. Например: "Укажите диапазон времени и нужный канал продаж".

Структурируйте инструкции по уточнению с помощью следующих компонентов:

  • Условие триггера: определите, какие темы или сценарии требуют уточнения (например, когда пользователи спрашивают о X-разделе...")
  • Отсутствующие сведения: укажите, какие сведения должны присутствовать (например, "... но не включать сведения о Y...")
  • Обязательное действие: укажите, что Genie должен запросить уточнение (например, "... Сначала необходимо задать вопрос о уточнении...")
  • Пример уточнения: укажите конкретный вопрос Джини(например, "Укажите...")

Добавьте инструкции для уточнения вопросов в конце общих инструкций, чтобы помочь Genie приоритизировать это поведение при ответе на неоднозначные вопросы.

Тестирование и настройка

Вы должны быть первым пользователем вашего пространства. После создания нового пространства начните задавать вопросы. Внимательно изучите SQL, созданный в ответ на ваши вопросы. Если Genie неправильно интерпретирует данные, вопросы или бизнес-jargon, можно вмешаться, изменив созданный SQL или предоставив другие конкретные инструкции. Продолжайте тестирование и редактирование, пока не получите надежные ответы.

После того как вы рассмотрели вопрос, вы можете добавить его в качестве эталонного вопроса, который можно использовать для систематического тестирования и оценки вашего пространства на общую точность. Вы можете использовать варианты и различные выражения вопросов для тестирования ответов Genie. См. использование бенчмарков в пространстве Genie.

Идеи об устранении ошибочных ответов см. в разделе "Устранение неполадок пространств Genie".

Проведение тестирования пользователей

После проверки качества ответа с помощью тестирования набирайте бизнес-пользователя, чтобы попробовать пространство Genie. Используйте следующие рекомендации для обеспечения плавного взаимодействия пользователей и сбора отзывов о текущем улучшении:

  • Установите ожидания, что их работа заключается в том, чтобы помочь организовать пространство.
  • Попросите их сосредоточить тестирование на конкретной теме и вопросах, для которых предназначено это пространство.
  • Если они получают неправильный ответ, рекомендуем пользователям добавлять дополнительные инструкции и уточнения в чате, чтобы уточнить ответ. Если указан правильный ответ, он должен изменить окончательный запрос, чтобы свести к минимуму аналогичные ошибки в будущих взаимодействиях.
  • Сообщите пользователям, чтобы они увеличивали или уменьшали рейтинг ответов, используя встроенный механизм обратной связи.
  • Пригласите пользователей поделиться дополнительными отзывами и неразрешенными вопросами непосредственно с авторами пространства. Авторы и редакторы могут использовать отзывы для уточнения инструкций, примеров и доверенных ресурсов.

Рекомендуется предоставлять учебные материалы или письменный документ с рекомендациями по тестированию пространства и предоставлению отзывов. Направьте бизнес-пользователей к использованию пространства Genie для изучения бизнес-данных, чтобы помочь им начать работу с новым пространством Genie.

Как бизнес-пользователи тестируют пространство, пользователи с разрешениями CAN MANAGE могут видеть вопросы, которые они задавали на вкладке "Мониторинг ". Продолжайте добавлять контекст, чтобы помочь Genie правильно интерпретировать вопросы и данные, чтобы предоставить точные ответы. Дополнительные сведения о мониторинге пространств Genie см. в разделе "Мониторинг пространства". Журналы аудита также можно использовать для мониторинга отзывов и обзора запросов в пространстве Genie. См. статью "Мониторинг использования ИИ и бизнес-аналитики" с журналами аудита и оповещениями.

Note

Бизнес-пользователи должны быть членами исходной рабочей области для доступа к вашему пространству. Ознакомьтесь с необходимыми разрешениями , чтобы узнать, как предоставить соответствующие разрешения для взаимодействия с пространством.

Сведения об устранении распространенных проблем с пространствами Genie см. в разделе "Устранение неполадок пространств Genie".