Рекомендации по оптимизации Q&A в Power BI

Это эффективно, чтобы использовать распространенные фразы и естественный язык, чтобы задать вопросы о ваших данных. Это еще более эффективно, когда ваши данные отвечают, что такое функция Q&A в Power BI.

Чтобы обеспечить успешное интерпретацию большого набора вопросов, на которые он может отвечать, Q&A делает предположения о модели. Если структура модели не соответствует одному или нескольким из этих предположений, необходимо настроить модель. Эти корректировки для Q&A являются одинаковыми рекомендациями по оптимизации для любой модели в Power BI независимо от того, используете ли вы Q&A.

Использование средств Q&A для устранения ваших вопросов

В следующих разделах описано, как настроить модель, чтобы она хорошо работала с Q&A в Power BI. С помощью инструментов Q&A вы обучаете основные бизнес-термины для Q&A и исправляете вопросы, которые задают конечные пользователи. Иногда вопросы по-прежнему не удается устранить, так как данные неправильно сформированы или отсутствуют данные. В этом случае ознакомьтесь со следующими разделами, которые помогут оптимизировать Q&A. Дополнительные сведения см. в разделе "Введение в средства Q&A".

Добавление отсутствующих связей

Если в модели отсутствуют связи между таблицами, отчеты Power BI и Q&A не могут интерпретировать, как объединить эти таблицы. Отношения являются краеугольным камнем хорошей модели. Например, вы не можете запросить "общий объем продаж для клиентов Сиэтла", если связь между таблицей заказов и таблицей клиентов отсутствует. На следующих изображениях показана модель, которая нуждается в работе и модели, готовой для Q&A.

Необходимые трудоемкие задачи

На первом изображении нет связей между таблицами "Клиенты", "Продажи" и "Продукты".

Screenshot showing Customers, Sales, and Products tables with no connected relationships.

Подготовка к работе с Q&A

На втором изображении связи определяются между таблицами.

Screenshot showing Customers, Sales, and Products tables with interconnected relationships.

Переименование таблиц и столбцов

Выбор таблиц и столбцов важен для Q&A. Например, предположим, что у вас есть таблица с именем CustomerSummary , содержащая список клиентов. Вам потребуется задать вопрос, например "Список сводок клиентов в Чикаго", а не "Список клиентов в Чикаго".

Хотя Q&A может сделать некоторые основные слова критического и обнаружения множественного числа, Q&A предполагает, что имена таблиц и столбцов точно отражают их содержимое.

Другой пример может быть, если у вас есть таблица с именем Headcount , которая содержит имена и фамилии и номера сотрудников. У вас есть другая таблица "Сотрудники" , содержащая номера сотрудников, номера заданий и даты начала. Люди знакомый с моделью может понять эту структуру. Кто-то другой, который просит "подсчет сотрудников" собирается получить количество строк из таблицы "Сотрудники". Этот результат, вероятно, не то, что они имели в виду, потому что это количество каждой работы каждый сотрудник когда-либо имел. Было бы лучше переименовать эти таблицы, чтобы действительно отразить то, что они содержат.

Необходимые трудоемкие задачи

Для таких имен таблиц, как StoreInfo и список продуктов, требуется работа.

Screenshot showing examples of table names that aren't optimal for Q and A.

Подготовка к работе с Q&A

Таблицы с именем Store и Products работают лучше.

Screenshot showing examples of table names that are optimal for Q and A.

Исправление неправильных типов данных

Импортированные данные могут иметь неправильные типы данных. В частности, столбцы дат и чисел, импортируемые в виде строк, не интерпретируются В&A в виде дат и чисел. Выберите правильный тип данных в модели Power BI.

Screenshot showing the Formatting panel with the Data type and Date time format selected.

Изменение параметров столбца года и идентификатора

Power BI агрегирует числовые столбцы по умолчанию, поэтому такие вопросы, как "общий объем продаж по году", иногда могут привести к большому общей сумме продаж вместе с большим объемом лет. Если у вас есть определенные столбцы, в которых не требуется, чтобы Power BI не отображает это поведение, задайте для столбца свойство суммирования по умолчанию, чтобы не суммировать. Учитывайте столбцы Year, Month, Day и ID, так как эти столбцы являются наиболее частыми проблемами. Другие столбцы, которые не являются разумными для суммирования, например Age, также могут воспользоваться параметром "Сводка по умолчанию" значение "Не суммировать" или "Среднее". Этот параметр находится в разделе "Свойства " после выбора столбца.

Screenshot showing the Summarization field with Don't summarize selected.

Выбор категории данных для каждого столбца даты и географического столбца

Категория данных предоставляет знания о содержимом столбца за его типом данных. Например, можно пометить целый столбец как zip-код или строковый столбец как город, страна или регион. Q&A использует эти сведения двумя важными способами, для выбора визуализации и для предвзятости языка.

Во-первых, В&A используются сведения о категории данных, которые помогут выбрать тип визуального отображения, который следует использовать. Например, он распознает, что столбцы с категориями данных даты или времени являются хорошим выбором для горизонтальной оси графики или оси воспроизведения пузырьковой диаграммы. Предполагается, что результаты, содержащие столбцы с географическими категориями данных, могут выглядеть хорошо на карте.

Во-вторых, Q&A делает некоторые образованные предположения о том, как пользователи, скорее всего, говорят о дате и географических столбцах, чтобы помочь ему понять определенные типы вопросов. Например, "когда" в "Когда был нанят Джон Смит?" почти наверняка сопоставляется с столбцом дат, и "Браун" в "Подсчет клиентов в Брауне" скорее всего, будет городом, чем цвет волос.

Screenshot showing the Data category field with Uncategorized selected.

Выбор столбца сортировки по соответствующим столбцам

Свойство "Сортировка по столбцам" позволяет сортировке в одном столбце автоматически отсортировать другой столбец. Например, при запросе "сортировка клиентов по размеру шляпы", вероятно, нужно, чтобы столбец "Размер шляпы" сортировать по базовому номеру размера (XS, S, M, L, XL), а не по алфавиту (L, M, S, XL, XS).

Screenshot showing the Sort by column dropdown with Hat Size ID selected.

Нормализация модели

Вам не нужно переделать всю модель. Однако некоторые структуры настолько трудны, что Q&A не обрабатывает их хорошо. При выполнении некоторой базовой нормализации структуры модели удобство использования отчетов Power BI значительно увеличивается вместе с точностью результатов Q&A.

Следуйте этому общему правилу: каждое уникальное "вещь", о которую пользователь говорит, должен быть представлен ровно одним объектом модели (таблица или столбец). Таким образом, если пользователи говорят о клиентах, должен быть один объект клиента . Если пользователи говорят о продажах, должен быть один объект продаж . В Редактор запросов доступны широкие возможности формирования данных. Более простые преобразования можно настроить с помощью вычислений в модели Power BI.

В следующих разделах содержатся некоторые распространенные преобразования, которые может потребоваться выполнить. Дополнительные сведения о нормализации модели см . в статье "Нормализация и денормализация " в статье "Общие сведения о схеме звезды" и важности Power BI .

Создание таблиц для сущностей с несколькими столбцами

Если у вас несколько столбцов, которые действуют как отдельная единица в более крупной таблице, эти столбцы должны быть разделены на собственную таблицу. Например, предположим, что у вас есть имя контакта, название контакта и столбец "Телефон Контакт" в таблице "Компании". Лучше всего создать отдельную таблицу "Контакты", чтобы содержать имя, название и Телефон, а также ссылку на таблицу "Компании". Это упрощает задавать вопросы о контактах независимо от вопросов о компаниях, для которых они контакт, и повышает гибкость отображения.

Необходимые трудоемкие задачи

Screenshot showing a Suppliers table that includes contact information.

Подготовка к работе с Q&A

Screenshot showing two tables, one for Suppliers and one for Contacts.

Сводка для устранения пакетов свойств

Если в модели есть пакеты свойств, они должны быть переструктуризированы, чтобы иметь один столбец для каждого свойства. Пакеты свойств, удобные для управления большим количеством свойств, имеют встроенные ограничения, которые отчеты Power BI и Q&A не предназначены для работы.

Например, рассмотрим таблицу CustomerDemographics с столбцами CustomerID, Property и Value, где каждая строка представляет собой другое свойство клиента (например, возраст, семейное состояние или город). Перегрузив значение столбца Value на основе содержимого столбца свойства, невозможно интерпретировать большинство запросов, ссылающихся на него. Простой вопрос, такой как "показать возраст каждого клиента", может произойти с работой, так как он может быть интерпретирован как "показать клиентам и клиентам демографические данные, где свойство является возрастом". Однако структура модели не поддерживает более сложные вопросы, такие как "средний возраст клиентов в Чикаго". Хотя пользователи, которые непосредственно создает отчеты Power BI, иногда могут найти умные способы получения данных, которые они ищут, Q&A работает только тогда, когда каждый столбец имеет одно значение.

Необходимые трудоемкие задачи

Screenshot showing three columns with the headings Customer ID, Property, and Value.

Подготовка к работе с Q&A

Screenshot showing three columns with the headings Customer ID, Age, Hat Size, and City.

Объединение для устранения секционирования

Если вы секционировали данные по нескольким таблицам или имели сводные значения по нескольким столбцам, некоторые распространенные операции являются трудными или невозможными для достижения пользователей. Сначала рассмотрим типичную секционирование таблиц: таблицу Sales2000-2010 и таблицу Sales2011-2020 . Если все важные отчеты ограничены определенным десятилетием, возможно, вы можете оставить его таким образом для отчетов Power BI. Однако гибкость Q&A позволяет пользователям ожидать ответы на такие вопросы, как "общий объем продаж по году". Для работы этого запроса необходимо объединить данные в одну таблицу моделей Power BI.

Аналогичным образом рассмотрим типичный столбец сводных значений: таблица BookTour , содержащая столбцы Author, Book1, City2 и City3. С такой структурой даже простые вопросы, такие как "подсчет книг по городу", не могут быть интерпретироваться правильно. Для работы этого запроса создайте отдельную таблицу BookTourCities , которая объединяет значения города в один столбец.

Необходимые трудоемкие задачи

Screenshot showing a table with pivoted value columns, City 1, City 2, and City 3.

Подготовка к работе с Q&A

Screenshot showing two tables, one with book and author information for tours and one with cities associated with the tours.

Разделение отформатированных столбцов

Если источник, из которого вы импортируете данные, содержит отформатированные столбцы, отчеты Power BI (и Q&A) не достигают внутри столбца, чтобы проанализировать его содержимое. Таким образом, если у вас есть, например, столбец "Полный адрес ", содержащий адрес, город и страну или регион, вы также должны разделить его на столбцы Address, City и CountryRegion, чтобы пользователи могли запрашивать их по отдельности.

Необходимые трудоемкие задачи

Screenshot showing a table with two columns, Customer and Full Address.

Подготовка к работе с Q&A

Screenshot showing a table with five columns, Customer, Full address, Address, City, and Country or Region.

Аналогичным образом, если у вас есть столбцы полного имени для человека, добавьте столбцы имени и фамилии , просто если кто-то хочет задать вопросы с использованием частичных имен.

Создание таблиц для столбцов с несколькими значениями

Кроме того, аналогичная ситуация, если источник, из которого вы импортируете данные, содержит столбцы с несколькими значениями, отчеты Power BI (и Q&A) не могут достичь внутри столбца, чтобы проанализировать содержимое. Таким образом, если у вас есть, например, столбец Composer, содержащий имена нескольких композиторов для песни, разделите его на несколько строк в отдельной таблице Composers .

Необходимые трудоемкие задачи

Screenshot showing a table with four columns, ID, Name, Genre, and Composers.

Подготовка к работе с Q&A

Screenshot showing two tables, one with ID, Name, and Genre and one with ID and Composer.

Денормализация для устранения неактивных связей

Одно исключение из правила "нормализация лучше" возникает при наличии нескольких путей для получения из одной таблицы в другую. Например, предположим, что у вас есть таблица "Рейсы " с столбцами SourceCityID и DestinationCityID, каждая из которых связана с таблицей "Города ". Одна из этих связей должна быть помечена как неактивная. Так как Q&A может использовать только активные связи, вы не можете задавать вопросы о источнике или назначении в зависимости от выбранного вами варианта. Если вместо этого денормализировать столбцы названия города в таблицу "Рейсы ", можно задать такие вопросы, как "список рейсов завтра с исходным городом Сиэтла и целевым городом Сан-Франциско".

Необходимые трудоемкие задачи

Screenshot showing two tables, Flights and Airports.

Подготовка к работе с Q&A

Screenshot showing one table named Flights. The columns from the Airports table are added to the Flights table.

Добавление синонимов в таблицы и столбцы

Этот шаг применяется специально к Q&A (а не к отчетам Power BI в целом). У пользователей часто есть много терминов, которые они используют, чтобы ссылаться на то же самое, например общий объем продаж, чистые продажи и общий чистый объем продаж. Эти синонимы можно добавить в таблицы и столбцы в модели Power BI.

Этот шаг может быть важным. Даже с простыми именами таблиц и столбцов пользователи Q&A задают вопросы с помощью словаря, который сначала приходит к ним. Они не выбираются из предопределенного списка столбцов. Чем более разумными синонимами вы добавляете, тем лучше взаимодействие пользователя с отчетом. Чтобы добавить синонимы, в Power BI Desktop перейдите в представление модели, выбрав вкладку "Модель", а затем выберите поле или таблицу. В области "Свойства" отображается поле "Синонимы ", где можно добавить синонимы.

Screenshot showing the Q&A Properties pane with the Synonyms field highlighted.

Помните, что добавление одного синонима к нескольким столбцам или таблицам представляет неоднозначность. Q&A использует контекст, где можно выбрать между неоднозначными синонимами, но не все вопросы имеют достаточный контекст. Например, когда пользователь просит "подсчитать клиентов", если у вас есть три вещи с синонимом "customer" в модели, пользователь может не получить ответ, который он ищет. В таких случаях сделайте основной синоним уникальным, так как этот синоним является тем, что используется в переборе. Он может предупредить пользователя о неоднозначности (например, повторение "показать количество архивированных записей клиентов"), что указывает, что они могут попросить его по-другому.