値を Excel ファイルからドメインへインポートする
適用対象: SQL Server
このトピックでは、Data Quality Services (DQS) で Excel ファイルからドメインにデータをインポートする方法について説明します。 Excel ファイルを使用して Data Quality Client アプリケーションにドメイン値をインポートすることで、ナレッジの生成処理を簡略化し、時間と労力を節約します。 この処理では、有効なデータ値の一覧が保存された Excel ファイルまたはテキスト ファイルを使用して、それらの値をドメインにインポートすることができます。 Excel ファイルからドメインにドメイン値をインポートしたり、ナレッジ ベースにドメインをインポートしたりできます (ナレッジ ベースへのドメインのインポートについて詳しくは、「ナレッジ検出でドメインを Excel ファイルからインポートする」をご覧ください) Excel ファイルへのエクスポートはサポートされていません。
データ値は、次の 2 とおりの方法でインポートできます。
新しいドメインを作成し、Excel ファイルからそのドメインに値をインポートします。この場合、すべての値がドメインに追加されます。
値が含まれている既存のドメインに値をインポートします。この場合、新しい値だけがインポートされます。 既に含まれている値はインポートされません。
始める前に
前提条件
Excel ファイルからドメイン値または完全なドメインをインポートするには、Data Quality Client アプリケーションがインストールされているコンピューターに Excel がインストールされていること、ドメイン値を含む Excel ファイルが作成されていること (「How the import works」を参照)、およびドメインをインポートするナレッジ ベースが作成されていて開いていることが必要です。
セキュリティ
アクセス許可
Excel ファイルからドメイン値をインポートするには、DQS_MAIN データベースの dqs_kb_editor ロールまたは dqs_administrator ロールが必要です。
値を Excel ファイルからドメインへインポートする
Data Quality クライアントを開始します。 これを行う方法の詳細については、「Data Quality Client アプリケーションの実行」を参照してください。
Data Quality Client のホーム画面で、ドメイン管理アクティビティ内のナレッジ ベースを開きます。
新しいドメインに値を追加する場合は、 [ドメインの作成] アイコンを使用して新しいドメインを作成し、ドメイン リストで新しいドメインを選択します。
既存のドメインに値を追加する場合は、ドメイン リストでドメインを選択します。
[ドメイン値] タブをクリックし、アイコン バーの [値をインポートします] アイコンをクリックし、 [Excel から有効な値をインポートします]をクリックします。
[ドメイン値のインポート] ダイアログ ボックスで、 [参照]をクリックします。
[ファイルを選択します] ダイアログ ボックスで、ドメイン値のインポート元の Excel ファイルが格納されているフォルダーに移動し、ファイル (拡張子が .xlsx、.xls、または .csv のファイル) を選択して [開く]をクリックします。 選択するファイルは、DQS を実行しているクライアント上のファイルか、ユーザーがアクセスできる共有ファイルでなければなりません。
[ワークシート] ボックスの一覧で、インポートするワークシートを選択します。
ワークシートの先頭の行がドメイン名を表し、残りのすべての行が有効なドメイン値を表す場合は、 [先頭の行を見出しとして使用] をオンにします。
OK をクリックします。 進行状況バーに、正常にインポートされた値の数、インポートされなかった値の数、および値の総数が表示されます。 処理を取り消すには、 [キャンセル] ボタンをクリックします。
[ドメイン値のインポート] ダイアログ ボックスに "インポート完了" と表示されていることを確認します。 このダイアログ ボックスで、正常にインポートされた値とインポートされなかった値を確認します。 ファイルの名前とパス、処理の完了状態、正常にインポートされた値の数、インポートされなかった値の数、および処理された値の総数が表示されます。
正常にインポートされなかった値について、[ログ] をクリックして [ドメイン値のインポート - 問題のある失敗] ダイアログ ボックスを表示し、インポート操作が失敗した理由を確認します。 [問題のある値] 列に、Excel ファイルからドメインにインポートできなかった値が表示され、 [理由] 列に、インポートが失敗した理由が表示されます。 [クリップボードにコピー] をクリックすると、 [問題のある値] のテーブルをクリップボードにコピーし、Excel のワークシートやメモ帳のファイルなど、別のプログラムにコピーできます。 [OK] をクリックして [問題のある値] ダイアログ ボックスを閉じます。
[OK] をクリックしてインポート操作を完了し、ダイアログ ボックスを閉じます。 インポートが正常に完了すると、 [ドメイン値] ページのドメイン値の一覧が更新され、インポートされた新しい値が表示されます。 フィルターが [すべての値] に変わり、 [新規のみ表示] が選択されます。 インポート操作の完了後に [新規のみ表示] を選択すると、Excel ファイルからインポートされた値だけが表示されます。
[完了] をクリックしてナレッジ ベースに値を追加します。
補足情報: Excel ファイルからドメインに値をインポートした後
ドメインに値をインポートした後、ドメインで他のドメイン管理タスクを実行したり、ナレッジ検出を実行してナレッジをドメインに追加したり、照合ポリシーをドメインに追加することができます。 詳しくは、「ナレッジ検出の実行」、「ドメインの管理」、または「照合ポリシーの作成」をご覧ください。
シノニムのインポート
シノニムのインポートの動作は次のとおりです。
先にすべての値がインポートされてから、シノニムの関連付けが確立されます。
シノニムの値を関連付けることができない場合、ログ画面にエラーが表示されます。 ファイル内の先頭の値とシノニムをドメインにインポートしても、シノニムとして設定されない場合があります。
シノニムの関連付けを設定するプロセスに関しては、次の点に注意してください。
Excel ファイルの先頭の値が別の値のシノニムとして既にドメインに存在する場合 (たとえば、Excel ファイルで値 B の先頭の値として想定している値 A が、ドメインで値 C のシノニムになっている場合)、シノニムを手動で設定する必要があります。 インポートの完了後にシノニムを手動で設定する方法のほかに、現在シノニムとして設定されている値の関連付け (たとえば、上記の値 A と値 C の関連付け) を解除してからファイルをインポートすることもできます。
シノニムが既に別の先頭の値に関連付けられている場合、シノニムを手動で設定する必要があります。
アプリケーションで何かの理由により手動で値を関連付けることができない場合、インポート操作で適用されません。
How the import works
インポート操作でインポートされる値を次に示します。
DQS のインポート操作では、Excel ファイルからのインポートが次のように実行されます。
正しい値と新しい値がインポートされます。 インポートされたドメイン値が既に 1 つ以上存在する場合、その値はインポートされません。
ドメイン ルールと矛盾する値は、無効な値としてインポートされます。
値がドメインのデータ型と異なる場合や null である場合、その値はファイルからインポートされません。
値はファイル内と同じ順序でインポートされます。
各行はドメイン値を表します。
先頭の行は、 [先頭の行を見出しとして使用] チェック ボックスの設定に応じて、ドメインを表すか、最初のデータ値またはレコードになる .xslx ファイルまたは .xls ファイルを使用する場合に [先頭の行を見出しとして使用] をオンにすると、null の列名は自動的に Fnに変換され、重複する列には番号が付加されます。
インポート操作を完了前に取り消した場合、操作がロールバックされ、データはインポートされません。
最初の列の値はドメインにインポートされます。 最初の列のほかに 1 つ以上の列を追加する場合、それらの列の値はシノニムとして追加されます (「 シノニムのインポート」を参照してください)。
最初の列が先頭の値と見なされ、2 列目以降はシノニムと見なされます。
シノニムが複数ある場合、1 つの行でインポートすることも、複数の行に分けてインポートすることもできます。 たとえば、"NYC" と "New York City" を "New York" のシノニムとしてインポートする場合、1 列目が "New York"、2 列目が "NYC"、3 列目が "New York City" の 1 つの行をインポートできます。また、2 行に分けて、1 列目が "New York" で 2 列目が "NYC" の行と、1 列名が "New York" で 2 列目が "New York City" の行をインポートすることもできます。 値 "New York" がドメインに既に存在する場合は、シノニムだけが追加されることに注意してください。インポート処理中に、値が既に存在することを示すエラーは表示されません。 最初の値が存在しない場合はドメインに追加されます。
インポートに使用する Excel ファイルには、次のルールが適用されます。
Excel ファイルの拡張子は、.xlsx、.xls、または .csv です。 ドメイン値または完全なドメインをインポートするには、Data Quality Client アプリケーションがインストールされているコンピューターに Microsoft Excel がインストールされている必要があります。 Excel Version 2003 以降がサポートされます。 64 ビット バージョンの Excel を使用する場合は、Excel 2003 ファイルのみがサポートされます。Excel 2007 または 2010 ファイルはサポートされません。
64 ビットの Excel では、Excel ファイル タイプ .xlsx はサポートされません。 64 ビットの Excel を使用している場合は、スプレッドシート ファイルを .xls ファイルまたは .csv ファイルとして保存するか、32 ビットの Excel をインストールしてください。
.xlsx および .xls ファイルでは、列のデータ型は最初の 8 行に基づいて決定されます。 最初の 8 行に列のデータ型が複数混在している場合、その列のデータ型は文字列になります。 9 行目以降のセルがそのデータ型に従っていない場合、セルの値は null になります。
.csv ファイルでは、データ型は最初の 8 行で最も多く使用されているデータ型によって決定されます。
Excel ファイルの形式が正しくないか、Excel ファイルが破損している場合は、インポート操作でエラーが発生します。