羅吉斯回歸是一種已知的統計技術,用於模型化二進制結果。
在統計學研究中,邏輯迴歸有各種實作,並使用不同的學習技術。 Microsoft羅吉斯回歸演算法已使用Microsoft類神經網路演算法的變化來實作。 此演算法會共用神經網路的許多品質,但更容易定型。
羅吉斯回歸的其中一個優點是演算法具有高度彈性,採用任何類型的輸入,並支持數個不同的分析工作:
使用人口統計來預測結果,例如特定疾病的風險。
探索並加權造成結果的因素。 例如,尋找影響客戶重複造訪商店的因素。
分類具有許多屬性的文件、電子郵件或其他物件。
範例
請考慮一群共享類似人口統計數據的人員,以及從 Adventure Works 公司購買產品的人員。 藉由模型化與特定結果相關的數據,例如購買目標產品,您可以看到人口統計資訊如何促成某人購買目標產品的可能性。
演算法的運作方式
羅吉斯回歸是一種已知的統計方法,可用來判斷多個因素對一組結果的貢獻。 Microsoft實作會使用已修改的類神經網路來模型化輸入和輸出之間的關聯性。 會測量每個輸入對輸出的影響,而且完成的模型中會加權各種輸入。 名稱羅吉斯回歸來自於使用羅吉斯轉換來壓縮數據曲線的事實,以將極端值的效果降到最低。 如需實作的詳細資訊,以及如何自定義演算法,請參閱 Microsoft羅吉斯回歸演算法技術參考。
羅吉斯回歸模型所需的數據
當您準備數據以用於定型羅吉斯回歸模型時,您應該瞭解特定演算法的需求,包括需要多少數據,以及如何使用數據。
羅吉斯回歸模型的需求如下:
單一索引鍵數據行 每個模型都必須包含一個可唯一識別每個記錄的數值或文字數據行。 不允許使用複合索引鍵。
輸入數據行 每個模型都必須包含至少一個輸入數據行,其中包含用來作為分析因素的值。 您可以視所需的輸入數據行數目而定,但視每個數據行中的值數目而定,新增額外的數據行會增加定型模型所需的時間。
至少一個可預測的數據行 模型必須至少包含任何數據類型的一個可預測數據行,包括連續數值數據。 可預測數據行的值也可以視為模型的輸入,也可以指定它只用於預測。 巢狀數據表不能用於可預測的欄位,但可以用作輸入。
如需羅吉斯回歸模型所支援內容類型和數據類型的詳細資訊,請參閱 Microsoft羅吉斯回歸演算法技術參考的需求一節。
檢視羅吉斯回歸模型
若要探索模型,您可以使用Microsoft類神經網路查看器,或Microsoft一般內容樹視圖器。
當您使用Microsoft類神經網路查看器來檢視模型時,Analysis Services 會顯示影響特定結果的因素,並依其重要性進行排名。 您可以選擇要比較的屬性和值。 如需詳細資訊,請參閱 使用Microsoft類神經網路查看器流覽模型。
如果您想要深入瞭解,您可以使用Microsoft一般內容樹視圖器來流覽模型詳細數據。 羅吉斯回歸模型的模型內容包含一個臨界節點,其中會顯示模型所使用的所有輸入,以及可預測屬性的子網。 如需詳細資訊,請參閱羅吉斯回歸模型的採礦模型內容(Analysis Services - 數據採礦)。
建立預測
定型模型之後,您可以針對模型內容建立查詢,以取得回歸係數和其他詳細數據,也可以使用模型進行預測。
備註
不支持向下鑽取。 這是因為採礦模型中的節點結構不一定直接對應至基礎數據。
不支援建立數據採礦維度。
支援使用 OLAP 採礦模型。
不支援使用預測模型標記語言 (PMML) 來建立採礦模型。
另請參閱
羅吉斯回歸模型的採礦模型內容 (Analysis Services - 數據採礦)
Microsoft羅吉斯回歸演算法技術參考
羅吉斯回歸模型查詢範例