共用方式為


Microsoft羅吉斯回歸演算法

適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性

羅吉斯回歸是一種已知的統計技術,用於模型化二進制結果。

在統計數據研究中使用不同的學習技術,羅吉斯回歸有各種實作。 Microsoft羅吉斯回歸演算法已使用Microsoft類神經網路演算法的變化來實作。 此演算法會共用神經網路的許多品質,但更容易定型。

羅吉斯回歸的其中一個優點是演算法具有高度彈性,採用任何類型的輸入,並支持數個不同的分析工作:

  • 使用人口統計來預測結果,例如特定疾病的風險。

  • 探索並加權造成結果的因素。 例如,尋找影響客戶重複造訪商店的因素。

  • 分類具有許多屬性的文件、電子郵件或其他物件。

請考慮一群共享類似人口統計數據的人員,以及從 Adventure Works 公司購買產品的人員。 藉由模型化與特定結果相關的數據,例如購買目標產品,您可以看到人口統計資訊如何促成某人購買目標產品的可能性。

演算法的運作方式

羅吉斯回歸是一種已知的統計方法,可用來判斷多個因素對一組結果的貢獻。 Microsoft實作會使用已修改的類神經網路來模型化輸入和輸出之間的關聯性。 會測量每個輸入對輸出的影響,而且完成的模型中會加權各種輸入。 名稱羅吉斯回歸來自於使用羅吉斯轉換來壓縮數據曲線的事實,以將極端值的效果降到最低。 如需實作的詳細資訊,以及如何自定義演算法,請參閱 Microsoft 羅吉斯回歸演算法技術參考

羅吉斯回歸模型所需的數據

當您準備數據以用於定型羅吉斯回歸模型時,您應該瞭解特定演算法的需求,包括需要多少數據,以及如何使用數據。

羅吉斯回歸模型的需求如下:

單一索引鍵數據行 每個模型必須包含一個可唯一識別每筆記錄的數值或文字數據行。 不允許複合索引鍵。

輸入數據行 每個模型至少必須包含一個輸入數據行,其中包含做為分析因數的值。 您可以視所需的輸入數據行數目而定,但視每個數據行中的值數目而定,新增額外的數據行會增加定型模型所需的時間。

至少一個可預測的數據行 模型必須至少包含任何數據類型的一個可預測數據行,包括連續數值數據。 可預測數據行的值也可以視為模型的輸入,也可以指定它只用於預測。 不可預測數據行使用巢狀數據表,但可作為輸入。

如需羅吉斯回歸模型所支援內容類型和數據類型的詳細資訊,請參閱羅吉斯回歸演算法技術參考 Microsoft 的需求一節,

檢視羅吉斯回歸模型

若要探索模型,您可以使用Microsoft類神經網路查看器,或Microsoft一般內容樹視圖器。

當您使用Microsoft類神經網路查看器來檢視模型時,Analysis Services 會顯示影響特定結果的因素,並依其重要性進行排名。 您可以選擇要比較的屬性和值。 如需詳細資訊,請參閱 使用Microsoft類神經網路查看器流覽模型

如果您想要深入瞭解,您可以使用Microsoft一般內容樹視圖器來流覽模型詳細數據。 羅吉斯回歸模型的模型內容包含一個臨界節點,其中會顯示模型所使用的所有輸入,以及可預測屬性的子網。 如需詳細資訊,請參閱羅吉斯回歸模型的 採礦模型內容(Analysis Services - 資料採礦)

建立預測

定型模型之後,您可以針對模型內容建立查詢,以取得回歸係數和其他詳細數據,也可以使用模型進行預測。

言論

  • 不支持鑽研。 這是因為採礦模型中的節點結構不一定直接對應至基礎數據。

  • 不支援建立數據採礦維度。

  • 支援使用 OLAP 採礦模型。

  • 不支援使用預測模型標記語言 (PMML) 來建立採礦模型。

另請參閱

羅吉斯回歸模型 (Analysis Services - 數據採礦) 的採礦模型內容
Microsoft 羅吉斯回歸演算法技術參考
羅吉斯回歸模型查詢範例