Data Quality Services (DQS) 中的數據質量專案是一種使用知識庫,藉由執行 數據清理 和數據 比 對活動來改善源數據品質的方法,然後將產生的數據匯出至 SQL Server 資料庫或 .csv 檔案。 您可以將資料質量專案建立為清理專案或比對專案,以執行個別的活動。 清理和比對專案可以使用相同的知識庫來執行,因為數據清理和比對的知識可以內建到相同的知識庫中。
資料質量專案具有下列優點:
可讓您使用 DQS 知識庫中的知識,對源數據執行數據清理。
可讓您使用知識庫中的比對原則,對源數據執行數據比對。
提供精靈來引導您完成清理和比對活動,並根據您的選擇將數據匯出至 SQL Server 資料庫或 .csv 檔案。 數據管理人可以使用數據品質專案來執行和控制計算機輔助/互動式清理和數據比對步驟。
數據質量專案:清理活動
清理數據質量專案可讓您根據知識庫清理源數據。 在 DQS 中的數據清理流程是兩步驟程序:
計算機輔助的數據清理程式,會根據知識庫中的知識分析源數據,並提出變更。 已處理的數據會依 DQS 分類(建議的、新增、無效、修正過和正確),顯示給用戶以進行進一步處理。
互動式清理程式,可讓數據管理人核准、拒絕或修改計算機輔助數據清理程式提議的數據。
如需數據質量專案中清理活動的詳細資訊,請參閱 數據清理。
數據質量專案:比對活動
比對數據質量專案可讓您根據知識庫中的比對原則執行比對活動,藉由識別確切和近似的相符專案來防止數據重複,進而讓您移除重複的數據。 建議您先清理數據,再對它執行比對。 要達成這個目標:
建立數據品質項目、選取 [ 清理 ] 活動、完成源數據上的數據清理活動,然後將它匯出至 SQL Server 資料庫中的數據表。
以使用包含比對原則的知識庫來建立另一個資料質量專案,選取比對活動,然後在對應頁面中,選取您在步驟 1 中匯出清理後資料的資料庫和資料表。
在清理後的數據上完成比對活動。
如需資料品質專案中配對活動的詳細資訊,請參閱 資料配對。
數據分析和通知
在數據質量項目中執行清理和比對活動時,您可以看到 DQS 正在處理之數據的即時統計數據和資訊。 數據分析可協助您評估清理和比對程式的有效性,而且您可以判斷數據清理或比對有助於改善數據品質的程度。 DQS 分析提供兩個數據質量維度: 完整性 (數據存在的程度)和 精確度 (數據可用於其預定用途的程度)。 此外,根據數據分析資訊,使用者會收到通知,告知可採取哪些行動來增強數據清理和數據比對作業。 如需數據分析和通知的詳細資訊,請參閱 DQS 中的數據分析和通知。
相關工作
| 工作描述 | 主題 |
|---|---|
| 描述如何建立數據質量專案。 | 建立數據質量專案 |
| 描述如何管理資料品質專案(開啟、解除鎖定、重新命名和刪除)。 | 管理 (開啟、解除鎖定、重新命名和刪除) 資料質量專案 |
| 描述如何在 Data Quality Client 中開啟 Integration Services 專案。 | 在 Data Quality Client 中開啟 Integration Services 專案 |