Подключаемый модуль basket
Подключаемый basket
модуль находит частые шаблоны атрибутов в данных и возвращает шаблоны, которые передают порог частоты в этих данных. Шаблон представляет подмножество строк, имеющих одинаковое значение в одном или нескольких столбцах. Подключаемый basket
модуль основан на алгоритме Apriori , изначально разработанном для анализа данных корзины.
Синтаксис
T | evaluate
basket
(
[ Пороговое значение,
WeightColumn,
MaxDimensions,
CustomWildcard,
CustomWildcard,
... ])
Дополнительные сведения о соглашениях о синтаксисе.
Параметры
Имя | Тип | Обязательно | Описание |
---|---|---|---|
Пороговое значение. | long |
Объект double в диапазоне от 0,015 до 1, который задает минимальное соотношение строк, которые будут считаться частыми. Шаблоны с меньшим соотношением не возвращаются. Значение по умолчанию — 0,05. Чтобы использовать значение по умолчанию, введите тильду: ~ .Пример: T | evaluate basket(0.02) |
|
WeightColumn | string |
Имя столбца, используемое для рассмотрения каждой строки во входных данных в соответствии с заданным весом. Должно быть именем столбца числового типа, например int , long , real . По умолчанию вес каждой строки — 1. Чтобы использовать значение по умолчанию, введите тильду: ~ . Как правило, при использовании столбца с весовым коэффициентом следует учитывать выборку, группирование или агрегирование данных, внедренных в каждой строке.Пример: T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
Задает максимальное количество нескоррелых измерений на корзину, ограниченное по умолчанию, чтобы свести к минимуму среду выполнения запроса. Значение по умолчанию — 5. Чтобы использовать значение по умолчанию, введите тильду: ~ .Пример: T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
Задает подстановочный знак для определенного типа в таблице результатов, который укажет, что текущий шаблон не имеет ограничения по этому столбцу. Значение по умолчанию за null исключением строковых столбцов, значение по умолчанию которых — пустая строка. Если значение по умолчанию является хорошим в данных, следует использовать другое подстановочное значение, например * . Чтобы использовать значение по умолчанию, введите тильду: ~ .Пример: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
Примечание
Чтобы указать необязательный параметр, следующий за необязательным параметром, обязательно укажите значение для предыдущего необязательного параметра. Дополнительные сведения см. в разделе Работа с необязательными параметрами.
Возвращаемое значение
Подключаемый basket
модуль возвращает частые шаблоны, которые проходят пороговое значение соотношения. Пороговое значение по умолчанию — 0,05.
В результатах каждый шаблон соответствует строке. Первый столбец — это идентификатор сегмента. Следующие два столбца — это количество и процент строк из исходного запроса, которые соответствуют шаблону. Остальные столбцы связаны с исходным запросом с определенным значением из столбца или подстановочными знаками, которое по умолчанию равно NULL, то есть переменное значение.
Примечание
Алгоритм использует выборку для определения начальных частых значений. Таким образом, результаты могут немного отличаться между несколькими запусками для шаблонов, частота которых близка к пороговой.
Пример
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
Выходные данные
Идентификатор сегмента | Count | Процент | Состояние | EventType | Ущерб | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | NO | 0 | ||
1 | 2278 | 38,7 | Град | NO | 0 | |
2 | 5675 | 96,4 | 0 | |||
3 | 2371 | 40,3 | Град | 0 | ||
4 | 1279 | 21,7 | Шквалистый ветер | 0 | ||
5 | 2468 | 41,9 | Град | |||
6 | 1310 | 22,3 | YES | |||
7 | 1291 | 21,9 | Шквалистый ветер |
Примеры с пользовательскими подстановочными знаками
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
Выходные данные
Идентификатор сегмента | Count | Процент | Состояние | EventType | Ущерб | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | * | * | NO | 0 |
1 | 2278 | 38,7 | * | Град | NO | 0 |
2 | 5675 | 96,4 | * | * | * | 0 |
3 | 2371 | 40,3 | * | Град | * | 0 |
4 | 1279 | 21,7 | * | Шквалистый ветер | * | 0 |
5 | 2468 | 41,9 | * | Град | * | -1 |
6 | 1310 | 22,3 | * | * | YES | -1 |
7 | 1291 | 21,9 | * | Шквалистый ветер | * | -1 |
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по