データ マイニングの操作
データ マイニングを使用すると、難しいビジネス問題について適切な意志決定を行うために必要な情報にアクセスできます。Microsoft SQL Server 2005 Analysis Services (SSAS) では、データ内のルールやパターンを識別できるデータ マイニング用のツールが用意されており、問題の発生原因を特定したり、将来発生する問題を予測したりできます。Analysis Services でデータ マイニング ソリューションを作成する場合は、ビジネス問題について説明するモデルを作成した後、データの数学的モデルを生成するアルゴリズムを使用してデータを実行します。このプロセスは、モデルのトレーニングと呼ばれます。その後、マイニング モデルの視覚的な調査またはマイニング モデルに対する予測クエリの作成を行うことができます。Analysis Services では、リレーショナル データベースと OLAP データベースの両方からデータセットを使用でき、データを調査するためのさまざまなアルゴリズムが用意されています。データ マイニング プロセスの概要については、「データ マイニングの概念」を参照してください。
SQL Server 2005 では、データ マイニングに使用できるさまざまな環境とツールが提供されています。次のセクションでは、データ マイニング ソリューションを作成するための一般的なプロセスについて説明し、各ステップで使用するリソースを確認します。
Analysis Services プロジェクトの作成
データ マイニング ソリューションを作成するには、新しい Analysis Services プロジェクトを作成した後、プロジェクトのデータ ソースおよびデータ ソース ビューを追加して構成する必要があります。データ ソースでは、マイニング モデルの基になるデータ ソースに接続するための接続文字列および認証情報を定義します。データ ソース ビューでは、データ ソースの概容が提供されます。この概容を使用すると、プロジェクトとの関連性を高めるためにデータの構造を変更できます。
詳細については、「Analysis Services プロジェクトの定義」、「データ ソース ウィザードを使用したデータ ソースの定義」、および「データ ソース ビュー ウィザードを使用したデータ ソース ビューの定義」を参照してください。
Analysis Services プロジェクトへのマイニング構造の追加
Analysis Services プロジェクトを作成した後、マイニング構造と、各構造に基づいた 1 つまたは複数のマイニング モデルを追加できます。テーブルや列などのマイニング構造は、プロジェクトの既存のデータ ソース ビューまたは OLAP キューブから取得されます。新しいマイニング構造を追加すると、データ マイニング ウィザードが起動されます。このウィザードを使用して、構造を定義し、その構造に基づいた初期モデルの作成に使用するアルゴリズムおよびトレーニング データを指定できます。
詳細情報 : 「新しいマイニング構造の作成」、「データ マイニング アルゴリズム」、「データ マイニング ウィザード」
データ マイニング デザイナの [マイニング構造] タブを使用して、列や入れ子になったテーブルの追加など、既存のマイニング構造を変更できます。
詳細情報 : 「データ マイニング デザイナ」
データ マイニング モデルの操作
定義したマイニング モデルを使用する前に、Analysis Services がトレーニング データをアルゴリズム経由で渡してモデルに入力できるように、マイニング モデルを処理する必要があります。Analysis Services では、処理するオブジェクトやオブジェクトの処理方法を制御する機能など、マイニング モデル オブジェクトを処理するためのいくつかのオプションが提供されています。
詳細情報 : 「Analysis Services での処理」、「データ マイニング オブジェクトの処理」
モデルを処理した後、結果を調査して、最もパフォーマンスの良いモデルを決定できます。Analysis Services では、データ マイニング デザイナの [マイニング モデル ビューア] タブ内でマイニング モデルの種類ごとのビューアが提供されており、そのビューアを使用してマイニング モデルを調べることができます。また、Analysis Services では、データ マイニング デザイナの [マイニング精度チャート] タブで、マイニング モデルを直接比較したり、目的に最適なマイニング モデルを選択したりできるツールも提供されています。これらのツールには、リフト チャート、利益チャート、および分類マトリックスが含まれます。
詳細情報 : 「データ マイニング モデルの表示」、「データ マイニング モデルの検証」
予測の作成
ほとんどのデータ マイニング プロジェクトの主な目的は、マイニング モデルを使用して予測を作成することです。マイニング モデルを調査して比較した後、いずれかのツールを使用して予測を作成できます。Analysis Services では、予測作成の基になるデータ マイニング拡張機能 (DMX) というクエリ言語が提供されています。DMX の予測クエリを作成しやすくするために、SQL Server では、SQL Server Management Studio および Business Intelligence Development Studio で使用できるクエリ ビルダと、Management Studio のクエリ エディタ用の DMX テンプレートが提供されています。BI Development Studio 内では、データ マイニング デザイナの [マイニング モデル予測] タブからクエリ ビルダにアクセスします。
詳細情報 : 「DMX 予測クエリの作成」、「データ マイニング拡張機能 (DMX) ステートメント リファレンス」
SQL Server Management Studio
BI Development Studio を使用してデータ マイニング プロジェクト用のマイニング モデルを作成した後、Management Studio でモデルを管理および操作したり、予測を作成したりできます。
詳細情報 : 「SQL Server Management Studio でのデータ マイニング」
SQL Server Reporting Services
マイニング モデルを作成した後、結果を多数の対象者に配布する場合があります。Microsoft SQL Server 2005 Reporting Services (SSRS) のレポート デザイナを使用して、マイニング モデルに含まれている情報を表示するためのレポートを作成します。DMX クエリの結果をレポートのベースとして使用し、Reporting Services で提供されているパラメータ化およびフォーマット化の機能を利用できます。
詳細情報 : 「レポート デザイナを使用した作業」、「Analysis Services DMX クエリ デザイナの使用」
プログラムによるデータ マイニングの操作
Analysis Services では、データ マイニングをプログラムで操作するためのいくつかのツールが提供されています。データ マイニング拡張機能 (DMX) 言語には、データ マイニング モデルを作成、トレーニング、および使用するためのステートメントがあります。また、これらの作業は、XML for Analysis (XMLA) と Analysis Services スクリプト言語 (ASSL) の組み合わせ、または分析管理オブジェクト (AMO) を使用して実行することもできます。
データ マイニングのスキーマ行セットを使用して、データ マイニングに関連付けられているすべてのメタデータにアクセスできます。たとえば、スキーマ行セットを使用して、アルゴリズムでサポートされているデータ型やデータベース内に存在するモデル名を調べることができます。
詳細情報 : 「データ マイニング拡張機能 (DMX) リファレンス」、「データ マイニング スキーマ行セット」、「Analysis Services 管理プログラミング (SSAS)」、「Analysis Services での XML for Analysis の使用 (XMLA)」
参照
概念
Analysis Services ソリューションおよびプロジェクトの開発
データ マイニングの概念
マイニング構造 (Analysis Services)
SQL Server Analysis Services
その他の技術情報
データ マイニング拡張機能 (DMX) リファレンス
Business Intelligence Development Studio の紹介
SQL Server Management Studio および Business Intelligence Development Studio