Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Область применения: ✅Microsoft Fabric✅Azure Data Explorer
Эта функция kmeans_fl()
представляет собой определяемую пользователем функцию (определяемую пользователем функцию), которая кластеризует набор данных с помощью алгоритма k-средних.
Необходимые компоненты
- Подключаемый модуль Python должен быть включен в кластере. Это необходимо для встроенного Python, используемого в функции.
- Подключаемый модуль Python должен быть включен в базе данных. Это необходимо для встроенного Python, используемого в функции.
Синтаксис
T | invoke kmeans_fl(
Функции,
k cluster_col,
)
Дополнительные сведения о соглашениях синтаксиса.
Параметры
Имя (название) | Type | Обязательно | Описание |
---|---|---|---|
k | int |
✔️ | Количество кластеров. |
features | dynamic |
✔️ | Массив, содержащий имена столбцов компонентов, используемых для кластеризации. |
cluster_col | string |
✔️ | Имя столбца для хранения идентификатора выходного кластера для каждой записи. |
Определение функции
Вы можете определить функцию, внедрив код как определяемую запросом функцию или создав ее в качестве хранимой функции в базе данных следующим образом:
Определите функцию с помощью следующей инструкции let. Разрешения не требуются.
Внимание
Инструкция let не может выполняться самостоятельно. За ним следует оператор табличного выражения. Пример выполнения рабочего примера kmeans_fl()
см. в разделе "Пример".
let kmeans_fl=(tbl:(*), k:int, features:dynamic, cluster_col:string)
{
let kwargs = bag_pack('k', k, 'features', features, 'cluster_col', cluster_col);
let code = ```if 1:
from sklearn.cluster import KMeans
k = kargs["k"]
features = kargs["features"]
cluster_col = kargs["cluster_col"]
km = KMeans(n_clusters=k)
df1 = df[features]
km.fit(df1)
result = df
result[cluster_col] = km.labels_
```;
tbl
| evaluate python(typeof(*), code, kwargs)
};
// Write your query to use the function here.
Пример
В следующем примере для запуска функции используется оператор вызова.
Кластеризация искусственного набора данных с тремя кластерами
Чтобы использовать определяемую запросом функцию, вызовите ее после внедренного определения функции.
let kmeans_fl=(tbl:(*), k:int, features:dynamic, cluster_col:string)
{
let kwargs = bag_pack('k', k, 'features', features, 'cluster_col', cluster_col);
let code = ```if 1:
from sklearn.cluster import KMeans
k = kargs["k"]
features = kargs["features"]
cluster_col = kargs["cluster_col"]
km = KMeans(n_clusters=k)
df1 = df[features]
km.fit(df1)
result = df
result[cluster_col] = km.labels_
```;
tbl
| evaluate python(typeof(*), code, kwargs)
};
union
(range x from 1 to 100 step 1 | extend x=rand()+3, y=rand()+2),
(range x from 101 to 200 step 1 | extend x=rand()+1, y=rand()+4),
(range x from 201 to 300 step 1 | extend x=rand()+2, y=rand()+6)
| invoke kmeans_fl(3, bag_pack("x", "y"), "cluster_id")
| render scatterchart with(series=cluster_id)