カスタム ドキュメント パーサー
ドキュメントに関連付けられているメタデータを管理することは、Windows SharePoint Services 3.0 にエンタープライズ コンテンツを保存する最も強力な利点の 1 つです。ただし、ドキュメント ライブラリ レベルとドキュメント自体との間でその情報の同期を保持することは難しい問題です。Windows SharePoint Services 3.0 が提供するドキュメント パーサー インフラストラクチャを使用すると、カスタム ドキュメント パーサーを作成してインストールすることができます。また、ユーザー設定のファイルの種類の解析、ドキュメント ライブラリ レベルで加えられた変更を反映したファイルの更新、またはその逆のドキュメント ライブラリの更新を行うこともできます。ユーザー設定のファイルの種類にドキュメント パーサーを使用すると、常にドキュメント メタデータを最新に保ち、ドキュメント ライブラリとドキュメント自体の間の同期を取る助けとなります。
ドキュメント パーサーはカスタム COM アセンブリで、Windows SharePoint Services 3.0 ドキュメント パーサー インターフェイスを実装することによって、Windows SharePoint Services 3.0 に呼び出されると以下を実行します。
特定のファイルの種類のドキュメントからドキュメント プロパティの値を抽出し、それらのプロパティ値をドキュメント ライブラリのプロパティ列に昇格するために Windows SharePoint Services に渡します。
ドキュメントのプロパティを受け取り、それらのプロパティの値をドキュメント自体に降格します。
ユーザーは、この機能を使用して、ドキュメント自体でドキュメント プロパティを編集し、変更した内容を反映させるためにドキュメント ライブラリのプロパティ値を自動的に更新させることができます。同じように、ユーザーはドキュメント ライブラリ レベルでプロパティ値を更新し、それらの変更内容を自動的にドキュメントに書き込ませることもできます。
Windows SharePoint Services がドキュメント パーサーを起動する方法、パーサーがドキュメント メタデータをプロモーション/デモーションする方法の詳細については、「ドキュメント パーサーの処理」を参照してください。
パーサーの要件
Windows SharePoint Services がカスタム ドキュメント パーサーを使用するには、ドキュメント パーサーは次の条件を満たす必要があります。
ドキュメント パーサーは、ドキュメント パーサー インターフェイスを実装する COM アセンブリである。
詳細については、「ドキュメント パーサー インターフェイスの概要」を参照してください。
ドキュメント パーサー アセンブリは、Windows SharePoint Services インスールで各フロントエンド Web サーバーにインストールおよび登録されている。
ドキュメント パーサーのエントリが、DOCPARSE.XML という、ドキュメント パーサーとそのパーサーに関連付けられているファイルの種類の一覧が含まれているファイルに追加されている。
詳細については、「ドキュメント パーサー定義スキーマの概要」を参照してください。
パーサーの関連付け
Windows SharePoint Services は、解析対象のドキュメントのファイルの種類に基づいて、起動するドキュメント パーサーを選択します。指定されたドキュメント パーサーを複数のファイルの種類に関連付けることはできますが、指定されたファイルの種類に関連付けることができるパーサーは 1 つだけです。
カスタム ドキュメント パーサーが解析できるファイルの種類を指定するには、ノードを Docparse.XML ファイルに追加します。このドキュメント内の各ノードはドキュメント パーサー アセンブリを識別し、そのアセンブリが使用されるファイルの種類を指定します。ファイルの種類は、ファイル拡張子またはプログラム ID で指定できます。
同じファイルの種類に対して複数のドキュメント パーサーを指定すると、Windows SharePoint Services はそのファイルの種類に関連付けられているリストの最初にあるドキュメント パーサーを呼び出します。
Windows SharePoint Services 3.0 には、次のファイルの種類が組み込まれているドキュメント パーサーに含まれています。
OLE : DOC ファイル形式、XLS ファイル形式、PPT ファイル形式、MSG ファイル形式、および PUB ファイル形式
Office 2007 XML 形式 : DOCX ファイル形式、DOCM ファイル形式、PPTX ファイル形式、PPTM ファイル形式、XLSX ファイル形式、および XLSM ファイル形式
XML
HTM : HTM ファイル形式、HTML ファイル形式、MHT ファイル形式、MHTM ファイル形式、および ASPX ファイル形式
これらのファイルの種類については、カスタム ドキュメント パーサーを作成することができません。組み込みの XML パーサーを使用して XML ファイルのドキュメント プロパティをレベル上げおよびレベル下げする方法の詳細については、「XML ドキュメント プロパティの昇格と降格」を参照してください。
カスタム ドキュメント パーサーを定義する方法の詳細については、「ドキュメント パーサー定義スキーマの概要」を参照してください。
パーサーの展開
Windows SharePoint Services が必要に応じていつでも指定されたパーサーを呼び出せることを保証するには、Windows SharePoint Services インストールで各フロントエンド Web サーバーに各パーサー アセンブリをインストールする必要があります。そのため、Windows SharePoint Services インストール全体で特定されたファイルの種類に対して指定できるパーサーは 1 つだけです。
ドキュメント パーサー インフラストラクチャには、Windows SharePoint Services のフィーチャーの一部としてカスタム ドキュメント パーサーをパッケージ化して展開する機能は含まれません。