Share via


群集模組

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

本文說明機器學習 Studio 中的模組 (傳統) 支援建立叢集模型。

注意

適用于僅限機器學習 Studio (傳統)

Azure Machine Learning 設計工具中提供類似的拖放模組。

何謂叢集?

在機器學習服務中,叢集是將資料點分組成類似叢集的方法。 也稱為「 分割」。

多年來,開發了許多群集演算法。 幾乎所有的群集演算法都會使用個別專案的功能來尋找類似的專案。 例如,您可以套用叢集以依人口統計來尋找類似的人員。 您可以使用具有文字分析的叢集,將句子與類似的主題或情感分組。

叢集稱為非監督式學習技術,因為它可以用於未標記的資料。 事實上,群集是探索新模式的好用第一個步驟,而且幾乎不需要事先瞭解資料的結構或專案的關聯方式。 叢集通常用來在分析之前用其他更多預測演算法來探索資料。

如何建立群集模型

在機器學習 Studio (傳統) 中,您可以使用已加上標籤或未標記資料的群集。

  • 在未標記的資料中,群集演算法會決定最接近的資料點,並在中央點(或距心)周圍建立群集。 然後,您可以使用叢集識別碼作為資料群組的暫存標籤。

  • 如果資料有標籤,您可以使用標籤來驅動叢集數目,或使用標籤做為另一項功能。

設定群集演算法之後,您可以使用「 定型群集模型 」或「 整理 叢集」模組,對資料進行定型。

當模型定型時,請使用它來預測新資料點的叢集成員資格。 例如,如果您已使用叢集來依購買行為將客戶分組,您可以使用模型來預測新客戶的購買行為。

模組清單

群集類別包含此模組:

若要使用不同的群集演算法,或使用 R 建立自訂的群集模型,請參閱下列主題:

範例

如需實際執行叢集的範例,請參閱 Azure AI 資源庫

請參閱下列文章,以取得選擇演算法的協助:

另請參閱