共用方式為


模糊群組轉換編輯器 (資料行索引標籤)

使用 [模糊群組轉換編輯器] 對話方塊的 [資料行] 索引標籤,即可指定用於將具有重複值之資料列分組的資料行。

若要進一步瞭解模糊群組轉換,請參閱<模糊群組轉換>。

選項

  • 可用的輸入資料行
    從清單中選取輸入資料行,即可依據該資料行將具有重複值的資料列分組。

  • 名稱
    檢視可用之輸入資料行的名稱。

  • 通過
    選取轉換的輸出是否包含輸入資料行。用來分組的所有資料行,都會自動複製到輸出。您可以核取此資料行來包含其他資料行。

  • 輸入資料行
    選取先前在 [可用的輸入資料行] 清單中選取的其中一個輸入資料行。

  • 輸出別名
    輸入對應之輸出資料行的描述性名稱。依預設,輸出資料行的名稱會與輸入資料行的名稱相同。

  • 群組輸出別名
    輸入資料行的描述性名稱,資料行包含已分組重複項目的標準值。此輸出資料行的預設名稱,是輸入資料行的名稱後面附加「_clean」。

  • 比對類型
    選取模糊相符或完全相符。如果資料列在具有模糊比對類型的所有資料行之間非常相似,資料列才會被視為重複項目。如果您同時在特定資料行上指定完全相符,則只有當需要完全相符之資料行中的資料列值完全相同時,資料列才會被視為可能重複的項目。因此,如果您知道特定資料行不會有錯誤或不一致的情形,就可以在該資料行上指定完全相符,以提高其他資料行的模糊比對精確度。

  • 最小相似度
    使用滑桿設定聯結層級的相似度臨界值。此值越接近 1,查閱值與來源值的相似度必須越接近才能認定為相符。增加臨界值可改善比對速度,因為需要考慮的候選記錄越少。

  • 相似度輸出別名
    指定新輸出資料行的名稱,此資料行包含所選取聯結的相似度分數。如果您將此值保留空白,就不會建立輸出資料行。

  • 數字
    指定比較資料行資料時,開頭和尾端數字的顯著性。例如,假設開頭數字屬於顯著,則 "123 Main Street" 和 "456 Main Street" 將不會被分到相同的群組中。

    描述

    兩者皆非

    開頭和尾端數字皆屬於不顯著。

    開頭

    僅開頭數字屬於顯著。

    尾端

    僅尾端數字屬於顯著。

    LeadingAndTrailing

    開頭和尾端數字皆屬於顯著。

  • 比較旗標
    如需有關字串比較選項的資訊,請參閱<比較字串資料>。