使用資料分析工作編輯器的設定檔請求頁面來選擇並設定您想要計算的剖析設定。 在單一數據剖析任務中,您可以為多個欄位或多個資料表或檢視中的欄位組合計算多個剖析報告。
如需如何使用數據分析工作的詳細資訊,請參閱 設定數據分析工作。 如需如何使用數據配置檔查看器來分析數據分析工作的輸出的詳細資訊,請參閱 數據配置檔查看器。
開啟資料剖析工作編輯器的 [剖析要求] 頁面
在 SQL Server Data Tools (SSDT) 中,開啟具有數據分析工作的 Integration Services 套件。
在控制流程索引標籤上,雙擊資料剖析工作。
在 資料概要分析任務編輯器 中,點擊 概要分析要求。
使用請求窗格
要求窗格是出現在頁面頂端的窗格。 此窗格會列出已針對目前數據分析工作設定的所有配置檔。 如果未設定任何配置檔,要求窗格會是空的。 若要新增配置檔,請按兩下 [ 設定檔類型 ] 資料行底下的空白區域,然後從清單中選取設定檔類型。 若要設定設定檔,請在要求窗格中選取配置檔,然後在 [ 要求屬性 ] 窗格中設定設定檔的屬性。
要求面板選項
要求窗格有下列選項:
視圖
選取是否要檢視已針對工作設定的所有配置檔,或只檢視其中一個配置檔。
要求窗格中的欄位會根據您選取的 檢視 進行變更。 如需有關這些欄的更多資訊,請參閱下一節「請求面板欄」。
要求窗格欄
要求窗格顯示的欄位視您所選取的 檢視 而定:
如果您選擇查看 所有要求,要求分頁有兩欄:配置檔類型和 要求標識符。
如果您選取檢視五個欄位配置檔的其中一個,請求窗格將有四個欄位:配置檔類型、表或檢視、欄位和請求 ID。
如果您選取檢視候選鍵配置檔,請求窗格有四個欄:配置檔類型、表或檢視、鍵欄和請求 ID。
如果您選擇檢視功能相依性設定檔,要求窗格會顯示五個欄位:設定檔類型、資料表或檢視、決定因素欄、相依欄和請求 ID。
如果您選擇檢視值包含配置檔,要求窗格有六個欄位:配置檔類型、子集側邊數據表或檢視、超集側表或檢視、子集側欄、超集側欄和請求ID。
下列各節說明每一個欄位。
所有檢視共用的欄位
配置檔類型
從下列選項中選擇一個資料設定檔:
| 價值觀 | 說明 |
|---|---|
| 候選金鑰設定檔要求 | 計算候選鍵概況。 此設定檔此設定檔會報告所選取資料表的數據行或數據行集是索引鍵或近似索引鍵。 此分析檔案也可以協助您識別數據中的問題,例如潛在鍵欄位中的重複值。 |
| 欄位長度分布配置檔要求 | 計算欄長度分佈概況。 欄位長度分佈配置檔會報告所選欄位中字串值的所有不同長度,以及每個長度在數據表中所代表的列百分比。 此設定檔可協助您識別數據中的問題,例如無效的值。 例如,您可以剖析一欄包含兩個字元的美國州代碼,並發現超過兩個字元的值。 |
| 欄位 Null 比例資料設定請求 | 計算欄位 Null 比例分析。 數據行 Null 比例設定檔會報告所選數據行中 Null 值的百分比。 此資料概況檔案可協助您識別資料中的問題,例如在欄位中存在空值的非預期高比率。 舉例來說,您分析了「郵遞區號」資料行並發現遺漏郵遞區號的百分比過高。 |
| 列模式概況請求 | 計算欄位模式概況。 數據行模式配置檔會報告一組正則表達式,其中涵蓋字串數據行中指定之值的百分比。 此配置可協助您識別數據中的問題,例如無效的字串。 這個設定檔也可以建議未來可用於驗證新值的規則運算式。 例如,郵遞區號/郵遞區號編碼欄位的模式設定可能會產生正則表示式:\d{5}-\d{4}、\d{5} 和 \d{9}。 如果您看見其他規則運算式,表示資料可能包含無效或格式錯誤的值。 |
| 列統計資料分析請求 | 選取此選項,即可使用所選取資料表或檢視中所有適用資料行的預設設定來計算數據行統計數據設定檔。 列統計概要會報告數位列的最小值、最大值、平均值和標準差,以及 datetime列的最小值和最大值。 此資料剖析可協助您識別數據中的問題,例如無效的日期。 舉例來說,您分析了歷程記錄日期的資料行,並發現屬於未來的最大日期。 |
| 列值分布檔案請求 | 計算欄位值分佈概況。 欄位值分佈分析檔案會報告所選欄位中的所有相異值,以及表格中各值所代表的列數百分比。 此設定檔也可以報告代表數據表中超過指定百分比的值。 此設定檔可協助您識別數據中的問題,例如數據行中不正確的相異值數目。 例如,您可以分析包含美國狀態的數據行,並探索超過 50 個相異值。 |
| 功能相依性設定檔要求 | 計算功能相依性配置檔。 功能相依性概要會報告一欄(相依欄)中的值依賴於另一欄或一組欄(行列式欄)中的值的程度。 此設定檔也可以協助您識別數據中的問題,例如不合法的數值。 例如,您會分析美國郵遞區編碼數據行和美國中各州的數據行之間的相依性。 相同的郵遞區號應該永遠具有相同的州名,但是此設定檔卻發現了這個相依性的違規。 |
| 值包含配置檔要求 | 計算值包含概況。 值包含配置檔會計算兩個數據行或一組數據行之間的值重疊。 此設定檔也可以判斷數據行或一組數據行是否適合做為所選取資料表之間的外鍵。 此分析檔案也可以協助您辨識資料中的問題,例如不符合規範的值。 舉例來說,您分析了 Sales 資料表的 ProductID 資料行,並發現此資料行包含在 Products 資料表之 ProductID 資料行中找不到的值。 |
RequestID
顯示要求的標識碼。 一般而言,您不需要變更自動產生的值。
所有個人資料檔共用的欄位
連接管理員
顯示連線至源資料庫的 ADO.NET 連接管理員。
要求識別碼
顯示要求的標識碼。 一般而言,您不需要變更自動產生的值。
五個獨立欄配置通用的欄目
資料表或檢視
顯示包含所選欄位的資料表或檢視表。
欄
顯示選取用於分析的數據行。
候選鍵配置檔特有的欄位
資料表或檢視
顯示包含所選欄位的資料表或檢視畫面。
關鍵欄
顯示選取用於分析的數據行。
功能相依性檔案特定欄位
資料表或檢視
顯示包含所選取資料行的數據表或檢視表。
行列子數據行
將選取用於基準化分析的數據欄顯示為關鍵數據欄。 在美國郵遞區編碼用來判斷所在州的範例中,決定因素的欄位是郵遞區編碼欄位。
相依數據行
顯示選取的資料行作為相依數據行。 在美國郵遞區編碼判斷美國州/地區的範例中,相依數據行是狀態數據行。
值包含配置檔的特定數據行
子集側邊數據表或檢視
顯示包含選取為子集側列之欄的資料表或檢視表。
超集側邊數據表或檢視
顯示包含選取為超集側欄之數據行的數據表或檢視表。
子集側邊欄
將選取的數據行或數據行顯示為子集端數據行來進行分析。 在範例中,如果您想確認在美國州名稱欄位中的值存在於兩個字母的州代碼參考表中,那麼子集欄位即是來源資料表中的州欄位。
超集側邊數據行
將選取的欄或欄位顯示為分析用的超集側欄。 在您想要確認美國州代碼列中的值位於兩個字母的美國州代碼的參考數據表中時,超集列是參考數據表中的州代碼列。
使用要求屬性窗格
[要求屬性] 窗格會出現在 [要求] 窗格下方。 此窗格會顯示您在請求窗格中選取的設定檔選項。
備註
選取 設定檔類型之後,您必須選取 [ 要求識別符 ] 字段,才能在 [ 要求屬性 ] 窗格中查看配置檔要求的屬性。
這些選項會根據選取的配置檔而有所不同。 如需個別配置檔類型選項的相關信息,請參閱下列主題: