變更定義域值

適用於:SQL Server

本主題介紹如何變更及增加 Data Quality Services (DQS) 知識庫內的中繼資料。 在您藉由知識探索產生知識、將知識匯入知識庫或定義域,或是讓知識庫根據另一個知識庫之後,您可以互動方式變更資料值。 知識庫產生不但會利用電腦輔助程序,也會提供您使用自己知識的方式,依照以下方式驗證資料值並加以變更:

  • 將定義域值加入至值清單中,或是從清單中選取值並加以刪除。

  • 變更 DQS 探索程序所指定的定義域值狀態,將它變更為正確、錯誤或無效

  • 針對錯誤或無效的值輸入取代值。 如果某個值不屬於定義域,則是無效的值;例如,如果該值不符合定義域資料類型或是未能通過定義域規則。 如果某個值屬於定義域但是有語法錯誤,則是錯誤的值。

  • 將兩個或多個值設為同義字以及變更探索程序所設定的前置值,結果是前置值將會取代同義字值,但前提是您在建立定義域時已設定 [使用前置值] 屬性。

  • 從 Excel 檔案匯入定義域值

開始之前

必要條件

若要變更定義域值,您必須已在 [定義域管理] 活動中開啟知識庫和定義域。

安全性

權限

您必須擁有 DQS_MAIN 資料庫的 dqs_kb_editor 角色或 dqs_administrator 角色,才能變更定義域值。

變更定義域值

[值] 資料表會顯示針對單一定義域加入至知識庫的知識。 您可以隨時在定義域清單中選取不同的定義域,以顯示該定義域的值。 欄位中的資料行如下:

  • [值] 資料行會顯示探索程序從資料取樣的欄位加入至選定定義域的所有值。 預計錯誤的任何值都將會顯示為預計正確之值的同義字。

  • [類型] 資料行會顯示此值的狀態,這是由探索程序所決定。 綠色核取符號表示此值正確或已更正,紅色十字符號表示此值錯誤,含驚嘆號的橘色三角形表示此值無效。 無效的值不符合定義域的資料需求。 錯誤的值可以是有效的值,但是因為資料原因所以不是正確的值。

  • [更正為] 資料行會顯示標示為錯誤或無效的原始值將會變更成為的正確值。 DQS 可將正確的值提議為探索程序的結果。

若要變更值,請依照以下方式繼續進行:

  1. 啟動 Data Quality Client。 如需這樣做的詳細資訊,請參閱執行 Data Quality Client 應用程式

  2. 在 Data Quality Client 首頁畫面上開啟或建立知識庫。 選取 [定義域管理] 當做活動,然後按一下 [開啟][建立]。 如需相關資訊,請參閱 建立知識庫開啟知識庫

    注意

    定義域管理會在 Data Quality Services 用戶端的頁面上執行,該頁面包含個別定義域管理作業所適用的五個索引標籤。 這不是精靈驅動的程序,任何管理作業都可以個別執行。

  3. [定義域管理] 頁面的 [定義域清單] 中,選取您想要變更值的定義域或是建立新的定義域。 如果您必須建立新的定義域,請參閱< 建立定義域>。 按一下 [定義域值] 索引標籤。

  4. [值] 資料表中顯示您需要修改的值。 如需詳細資訊,請參閱以下的< 如何顯示適當的值 >。

  5. 若要變更值的狀態,請依照以下方式繼續進行:

    • 將選取的定義域值設為更正:若要將值的狀態從錯誤或無效變更為更正,請選取值,然後從圖示列的向下箭號或是從 [類型] 下拉式清單按一下 [將選取的定義域值設為更正] \(核取)。 如果錯誤或無效值與更正值群組在一起,請在作業之後刪除該值。

    • 將選取的定義域值設為錯誤:若要將值的狀態從更正或無效變更為錯誤,請選取值,然後從圖示列的向下箭號或是從 [類型] 下拉式清單按一下 [將選取的定義域值設為錯誤] \(十字符號) 圖示。 您可以在 [更正為] 資料行中輸入更正,或是將它保留空白。

    • 將選取的定義域值設為無效:若要將值的狀態從更正或錯誤變更為無效,請選取值,然後從圖示列的向下箭號或是從 [類型] 下拉式清單按一下 [將選取的定義域值設為無效] \(三角形) 圖示。 您可以在 [更正為] 資料行中輸入更正,或是將它保留空白。

    • 更正為:將值設定為錯誤或無效之後,請在 [更正為] 資料行中輸入新的值。 DQS 將會為取代值新增資料列、將它指定為正確的值,然後將兩個值群組在一起。 新的值將會顯示為前置值,前置值會以粗體顯示,而錯誤或無效的值則縮排。

  6. 若要將值指定為一組同義字,請選取多個正確值,然後依照以下方式繼續進行:

    • 將選取的定義域值設為同義字:若要設定同義字,請選取多個正確值,然後按一下 [將選取的定義域值設為同義字] 圖示。 DQS 會將這些值群組在一起,並將其中一個值指定為將用來取代其他值的前置值。 請注意,如果兩個值群組在一起,但是其中一個群組錯誤或無效,則這些值不是同義字。

      注意

      如果您選取群組中的兩個或多個值以及群組外的另一個值,然後將這些值設定為同義字,您會得到不正確的錯誤訊息。 在關閉錯誤訊息快顯視窗之後,這些值將會正確設定為同義字。

    • 中斷選取的同義字之間的關聯:若要復原兩個或多個值的同義字指定,請選取這些值,然後按一下 [中斷選取的同義字之間的關聯] 圖示。 這些值必須群組在一起,而且必須是正確的,取消群組同義字才有效。

    • 將選取的定義域值設為群組的前置值:若要變更群組的前置值,請在群組中選取未指定為前置值的某個值,然後按一下 [將選取的定義域值設為群組的前置值] 按鈕。 這樣會將前置值設定為其他值的取代值。 只有在您已經設定兩個或多個群組在一起的值,而且要變更 DQS 所指定的前置值時,才能執行這項作業。 請注意,前置值是由藍色資料列中的粗體值所指定。

  7. 拼字檢查:如果某個值有波浪式紅色底線,則表示拼字檢查建議此值的更正。 以滑鼠右鍵按一下有底線的值,然後選取適用的更正。 值類型會變成 (或維持) 錯誤,而且更正將會加入至 [更正為] 資料行。 按一下向下箭號,以查看其他建議的更正。 手動輸入更正,將其加入至拼字檢查字典,而且能夠將其選取為更正。 如需相關資訊,請參閱 使用 DQS 拼字檢查設置域屬性

    注意

    若要使用拼字檢查,您可以在 [定義域屬性] 頁面中啟用此功能,或者如果 [定義域屬性] 頁面中已停用此功能,您可以按一下 [定義域值] 頁面上的 [啟用/停用拼字檢查] 圖示,在此頁面上啟用此功能。

  8. 加入新的定義域值:按一下此選項,在資料表結尾加入資料列。 在您輸入值之後,此資料列將會依字母順序重新定位,而且前面會有星號將其識別為新的項目。

  9. 從 Excel 匯入定義域值:若要從 Excel 試算表加入新的值,請按一下 [匯入值] 圖示的向下箭號,然後選取 [從 Excel 匯入定義域值]。 輸入檔案名稱,並在適當情況下選取 [使用第一個資料列做為標頭] ,然後按一下 [確定]。 如需詳細資訊,請參閱 將 Excel 檔案中的值匯入定義域中

  10. 匯入專案值:若要從資料品質專案加入新的值,請按一下 [匯入值] 圖示的向下箭號,然後選取 [匯入專案值]。 輸入檔案名稱,並在適當情況下選取 [使用第一個資料列做為標頭] ,然後按一下 [確定]。 選取要匯入的值來自於哪一個專案,然後按一下 [確定]。 隨即顯示匯入的值。 按一下 [完成] 。 如需詳細資訊,請參閱<將專案值匯入定義域>。

  11. 刪除選取的定義域值:若要從定義域中移除一個或多個現有的值,請選取 [值] 資料表中的值,然後按一下 [刪除選取的定義域值] 圖示。 DQS_NULL 的項目無法刪除,所以如果您選擇多個要刪除的值,而且 DQS_NULL 的項目是其中一個,此作業將會失敗。

  12. 按一下 [完成] ,完成定義域管理活動,如< 結束定義域管理活動>中所述。

後續操作:在變更定義域值之後

在您變更定義域值之後,您可以針對定義域執行其他定義域管理工作、執行知識探索來將知識加入至定義域,或者將比對原則加入至定義域。 如需詳細資訊,請參閱執行知識探索管理定義域建立比對原則

正確值、錯誤值和無效值的意義

[定義域值] 頁面上 [值] 資料表中的每一個值都會被指派 [正確][錯誤][無效][類型]設定。 值的類型最初是由知識探索活動所產生,之後您可以適當地加以變更。 根據探索和互動式變更的最終類型則是由清理活動產生。 這些設定具有以下意義:

  • 正確: 這個值屬於定義域,而且沒有任何語法錯誤。 例如,"Chicago" 在城市定義域中是正確的。

  • 錯誤: 這個值屬於定義域,但不是正確的值。 例如,"Shicago" (而非 "Chicago") 在城市定義域中是錯誤的。 DQS 如果在探索程序中偵測到某個值有語法錯誤和關聯的更正,則會將此值指定為錯誤。 語法錯誤包括拼字錯誤。

  • 無效: 這個值不屬於定義域,而且沒有更正。 例如,"12345" 值在城市定義域中是無效的。 當某個值未通過定義域規則時,DQS 會將它指定為無效的值。

您可以手動將值的類型變更為其他兩個值的任何一個。 DQS 不會針對手動作業強制執行有效性和錯誤語意。 您可以輸入無效值的更正,而不需變更其狀態。 您可以將某個值指定為無效,即使它已通過定義域規則。 您可以將某個值指定為錯誤,即使探索程序並未指出它有語法錯誤。 您也可以移除錯誤值的更正 (標示為 [正確]),而不需變更其狀態。

當您在 [清理] 活動的 [管理和檢視結果] 頁面中執行互動式資料清理時,無效和錯誤的值都會包含在 [管理和檢視結果] 頁面的 [無效] 索引標籤上。

How to Display the Appropriate Values

您可以依照以下方式修改顯示:

  • 選取[篩選] 下拉式清單中的狀態,在資料表中 [篩選] 您想要的結果 (根據結果的狀態)。

  • [尋找] 文字方塊中輸入要搜尋的一個或多個字,以 [尋找] 您想要檢查或修改的資料。 如此一來,當任何顯示的值中出現這些字時,就會反白顯示這些字。

  • 按一下 [只顯示新值] ,資料表中顯示的值將僅限為目前工作階段已探索的值,而不是之前工作階段已探索的值。

  • 按一下 [全部展開] 按鈕,在目前狀態摺疊時顯示任何同義字群組中的所有值。

  • 按一下 [全部摺疊] 按鈕,在目前狀態展開時隱藏任何同義字群組中前置值以外的所有值。

  • 按一下 [顯示\隱藏定義域值變更記錄面板] 按鈕,在值資料表的底部顯示預覽快顯視窗,該資料表會顯示定義域值集合的最近變更。

如何處理 Null 對應項目

[定義域值] 索引標籤中的每一個值資料表都包含 DQS_NULL 值。 資料來源中的 null 將會以 SQL_NULL 形式出現在值資料表中。 您可以將一個或多個 null 對應項目設定為 DQS_NULL 的同義字。 當您這樣做時,所有 null 和 null 對應項目都將會處理為 DQS_NULL。