論理アーキテクチャ (Analysis Services - データマイニング)

[アーティクル]
07/30/2013

データマイニングは、複数のコンポーネントの相互作用を伴うプロセスです。

SQL Server データベース内のデータのソースまたはその他のデータソースにアクセスし、トレーニング、テスト、または予測に使用します。
データマイニング構造とデータマイニングモデルは、SQL Server データツール (SSDT) または Visual Studio を使用して定義します。
データマイニングオブジェクトの管理および予測やクエリの作成には、SQL Server Management Studio を使用します。
ソリューションが完成したら、Analysis Services のインスタンスにそのソリューションを配置します。

これらのソリューションオブジェクトを作成するプロセスについては、既に他の場所で説明しています。詳細については、「データマイニングソリューション」を参照してください。

次のセクションでは、データマイニングソリューション内のオブジェクトの論理アーキテクチャについて説明します。

データマイニングソースデータ

マイニング構造

マイニングモデル

カスタムデータマイニングオブジェクト

データマイニングソースデータ

データマイニングで使用するデータは、データマイニングソリューションに格納されません。バインドのみが格納されます。データは前のバージョンの SQL Server、CRM システム、またはフラットファイルで作成されたデータベースにも存在する場合があります。処理によって構造またはモデルをトレーニングすると、データの統計サマリーが作成され、キャッシュに格納されます。そのサマリーは、後の操作で使用するために保持することも、処理後に削除することもできます。詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

Analysis Services データソースビュー (DSV) オブジェクト内のさまざまなデータを組み合わせることで、データソースの上に抽象化レイヤーが提供されます。テーブル間の結合を指定できます。また、多対一のリレーションシップを持つテーブルを追加して、入れ子になったテーブル列を作成することができます。これらのオブジェクト (データソースおよびデータソースビュー) の定義は、*.ds および *.dsv というファイル名拡張子でソリューション内に保存されます。 Analysis Services データソースおよびデータソースビューの作成と使用の詳細については、「サポートされるデータソースの種類 (SSAS 多次元)」を参照してください。

AMO または XMLA を使用して、データソースおよびデータソースビューを定義および変更することもできます。プログラムによってこれらのオブジェクトを操作する方法の詳細については、「論理アーキテクチャの概要 (Analysis Services - 多次元データ)」を参照してください。

トップに戻る

マイニング構造

データマイニング構造は、マイニングモデルの作成元のデータドメインを定義する論理データコンテナーです。 1 つのマイニング構造で複数のマイニングモデルをサポートできます。

データマイニングソリューションでデータを使用する必要がある場合、Analysis Services ではソースからデータを読み込み、集計およびその他の情報のキャッシュを生成します。既定では、トレーニングデータを再利用して追加のモデルをサポートできるように、このキャッシュは保持されます。キャッシュを削除する必要がある場合は、マイニング構造オブジェクトの CacheMode プロパティを値 ClearAfterProcessing に変更します。詳細については、「AMO データマイニングクラス」を参照してください。

SQL Server 2012 Analysis Services (SSAS) には、データをトレーニングおよびテストデータセットに分割する機能もあります。この機能を使用して、代表的な、ランダムに選択したデータのセットでマイニングモデルをテストできます。データは、実際には別々に格納されません。構造キャッシュ内のケースデータには、その特定のケースがトレーニングに使用されるかテストに使用されるかを示すプロパティが設定されます。キャッシュを削除すると、その情報を取得できなくなります。

詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

データマイニング構造には、入れ子になったテーブルを含めることができます。入れ子になったテーブルは、プライマリデータテーブルでモデル化されているケースに関する追加の詳細情報を提供します。詳細については、「入れ子になったテーブル (Analysis Services - データマイニング)」を参照してください。

トップに戻る

マイニングモデル

処理前のデータマイニングモデルは、メタデータのプロパティの組み合わせにすぎません。これらのプロパティでは、マイニング構造とデータマイニングアルゴリズムを指定し、データの処理方法に影響するパラメーターとフィルター設定のコレクションを定義します。詳細については、「マイニングモデル (Analysis Services - データマイニング)」を参照してください。

モデルを処理すると、マイニング構造のキャッシュに格納されたトレーニングデータを使用して、データの統計プロパティと、アルゴリズムおよびそのパラメーターによって定義されたヒューリスティックの両方に基づいたパターンが生成されます。これは、モデルのトレーニングと呼ばれます。

トレーニングの結果は、見つかったパターンを表し、予測を生成するルールを提供する一連の概要データで、モデルコンテンツに格納されます。詳細については、「マイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

限られた状況では、標準形式である Predictive Model Markup Language (PMML) に従ってモデルの数式とデータバインドを表すファイルにモデルの論理構造をエクスポートすることもできます。 PMML を使用する他のシステムにこの論理構造をインポートし、そのモデルを予測に使用することができます。詳細については、「選択ステートメント (DMX) について」を参照してください。

トップに戻る

カスタムデータマイニングオブジェクト

精度チャート、予測クエリなど、データマイニングプロジェクトのコンテキストで使用するその他のオブジェクトは、ソリューション内に保存されませんが、ASSL を使用してスクリプト化することや、AMO を使用して作成することができます。

また、これらのカスタムオブジェクトを追加することで、Analysis Services のインスタンスで利用可能なサービスと機能を拡張することもできます。

カスタムアセンブリ
.NET アセンブリは、CLR または COM に準拠した任意の言語を使用して定義した後、SQL Server のインスタンスに登録できます。アセンブリファイルは、アプリケーションで定義された場所から読み込まれ、コピーは、データと共にサーバーに保存されます。アセンブリファイルのコピーは、サービスが開始されるたびにアセンブリを読み込むために使用されます。

詳細については、「多次元モデルのアセンブリの管理」を参照してください。
カスタムストアドプロシージャ
Analysis Services のデータマイニングでは、ストアドプロシージャを使用して、データマイニングオブジェクトを操作できます。独自のストアドプロシージャを作成して、機能を拡張し、予測クエリおよびコンテンツクエリから返されるデータをより簡単に操作できます。

ストアドプロシージャの定義

次のストアドプロシージャを使用して、クロス検証を実行できます。

データマイニングのストアドプロシージャ (Analysis Services - データマイニング)

また、Analysis Services には、内部でデータマイニングに使用されるシステムストアドプロシージャが多数用意されています。システムストアドプロシージャは内部で使用するためのものですが、それらを応用することもできます。これらのストアドプロシージャは、マイクロソフトによって随時変更される場合があります。そのため、実際の運用では、DMX、AMO、または XMLA を使用してクエリを作成することをお勧めします。
カスタムプラグインアルゴリズム
Analysis Services には、独自のアルゴリズムを作成し、そのアルゴリズムを新しいデータマイニングサービスとしてサーバーインスタンスに追加するためのメカニズムが用意されています。

Analysis Services では、COM インターフェイスを使用して、プラグインアルゴリズムと通信します。新しいアルゴリズムの実装方法の詳細については、「プラグインアルゴリズム」を参照してください。

新しいアルゴリズムはそれぞれ使用する前に登録する必要があります。アルゴリズムを登録するには、Analysis Services インスタンスの .ini ファイルにアルゴリズムに必要なメタデータを追加します。新しいアルゴリズムを使用する各インスタンスに情報を追加する必要があります。アルゴリズムを追加したら、インスタンスを再起動し、MINING_SERVICES スキーマ行セットを使用して、新しいアルゴリズムを表示し、そのアルゴリズムでサポートされているオプション、プロバイダーなどを確認できます。

トップに戻る

次の方法で共有

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソースデータ

マイニング構造

マイニングモデル

カスタムデータマイニングオブジェクト

関連項目

参照

概念

その他のリソース

次の方法で共有

論理アーキテクチャ (Analysis Services - データ マイニング)

データ マイニング ソース データ

マイニング構造

マイニング モデル

カスタム データ マイニング オブジェクト

関連項目

参照

概念

その他のリソース

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソースデータ

マイニングモデル

カスタムデータマイニングオブジェクト