Microsoft羅吉斯回歸演算法

2024-07-05

適用於： SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦，現在已在 SQL Server 2022 Analysis Services 中停止。檔不會更新為已淘汰和已停止的功能。若要深入瞭解，請參閱 Analysis Services 回溯相容性。

羅吉斯回歸是一種已知的統計技術，用於模型化二進制結果。

在統計數據研究中使用不同的學習技術，羅吉斯回歸有各種實作。 Microsoft羅吉斯回歸演算法已使用Microsoft類神經網路演算法的變化來實作。此演算法會共用神經網路的許多品質，但更容易定型。

羅吉斯回歸的其中一個優點是演算法具有高度彈性，採用任何類型的輸入，並支持數個不同的分析工作：

使用人口統計來預測結果，例如特定疾病的風險。
探索並加權造成結果的因素。例如，尋找影響客戶重複造訪商店的因素。
分類具有許多屬性的文件、電子郵件或其他物件。

例

請考慮一群共享類似人口統計數據的人員，以及從 Adventure Works 公司購買產品的人員。藉由模型化與特定結果相關的數據，例如購買目標產品，您可以看到人口統計資訊如何促成某人購買目標產品的可能性。

演算法的運作方式

羅吉斯回歸是一種已知的統計方法，可用來判斷多個因素對一組結果的貢獻。 Microsoft實作會使用已修改的類神經網路來模型化輸入和輸出之間的關聯性。會測量每個輸入對輸出的影響，而且完成的模型中會加權各種輸入。名稱羅吉斯回歸來自於使用羅吉斯轉換來壓縮數據曲線的事實，以將極端值的效果降到最低。如需實作的詳細資訊，以及如何自定義演算法，請參閱 Microsoft 羅吉斯回歸演算法技術參考。

羅吉斯回歸模型所需的數據

當您準備數據以用於定型羅吉斯回歸模型時，您應該瞭解特定演算法的需求，包括需要多少數據，以及如何使用數據。

羅吉斯回歸模型的需求如下：

單一索引鍵數據行 每個模型必須包含一個可唯一識別每筆記錄的數值或文字數據行。不允許複合索引鍵。

輸入數據行 每個模型至少必須包含一個輸入數據行，其中包含做為分析因數的值。您可以視所需的輸入數據行數目而定，但視每個數據行中的值數目而定，新增額外的數據行會增加定型模型所需的時間。

至少一個可預測的數據行 模型必須至少包含任何數據類型的一個可預測數據行，包括連續數值數據。可預測數據行的值也可以視為模型的輸入，也可以指定它只用於預測。不可預測數據行使用巢狀數據表，但可作為輸入。

如需羅吉斯回歸模型所支援內容類型和數據類型的詳細資訊，請參閱羅吉斯回歸演算法技術參考 Microsoft 的需求一節，。

檢視羅吉斯回歸模型

若要探索模型，您可以使用Microsoft類神經網路查看器，或Microsoft一般內容樹視圖器。

當您使用Microsoft類神經網路查看器來檢視模型時，Analysis Services 會顯示影響特定結果的因素，並依其重要性進行排名。您可以選擇要比較的屬性和值。如需詳細資訊，請參閱使用Microsoft類神經網路查看器流覽模型。

如果您想要深入瞭解，您可以使用Microsoft一般內容樹視圖器來流覽模型詳細數據。羅吉斯回歸模型的模型內容包含一個臨界節點，其中會顯示模型所使用的所有輸入，以及可預測屬性的子網。如需詳細資訊，請參閱羅吉斯回歸模型的採礦模型內容（Analysis Services - 資料採礦）。

建立預測

定型模型之後，您可以針對模型內容建立查詢，以取得回歸係數和其他詳細數據，也可以使用模型進行預測。

如需如何針對數據採礦模型建立查詢的一般資訊，請參閱數據採礦查詢。
如需羅吉斯回歸模型的查詢範例，請參閱叢集模型查詢範例。

言論

不支持鑽研。這是因為採礦模型中的節點結構不一定直接對應至基礎數據。
不支援建立數據採礦維度。
支援使用 OLAP 採礦模型。
不支援使用預測模型標記語言（PMML）來建立採礦模型。

另請參閱

羅吉斯回歸模型（Analysis Services - 數據採礦）的採礦模型內容
 Microsoft 羅吉斯回歸演算法技術參考
 羅吉斯回歸模型查詢範例