論理アーキテクチャ (Analysis Services - データマイニング)

[アーティクル]
12/23/2023

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データマイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。非推奨および停止された機能については、ドキュメントの更新は行われません。詳細については、「Analysis Services 下位互換性」を参照してください。

データマイニングは、複数のコンポーネントの相互作用を伴うプロセスです。

SQL Server データベース内のデータのソースまたはその他のデータソースにアクセスし、トレーニング、テスト、または予測に使用します。
SQL Server Data Toolsまたは Visual Studio を使用して、データマイニング構造とモデルを定義します。
データマイニングオブジェクトを管理し、SQL Server Management Studioを使用して予測とクエリを作成します。
ソリューションが完了したら、SQL Server Analysis Servicesのインスタンスにデプロイします。

これらのソリューションオブジェクトを作成するプロセスについては、既に他の場所で説明しています。詳細については、「データマイニングソリューション」を参照してください。

次のセクションでは、データマイニングソリューション内のオブジェクトの論理アーキテクチャについて説明します。

データマイニングソースデータ

データマイニングで使用するデータは、データマイニングソリューションに格納されません。バインドのみが格納されます。データは前のバージョンの SQL Server、CRM システム、またはフラットファイルで作成されたデータベースにも存在する場合があります。処理によって構造またはモデルをトレーニングすると、データの統計サマリーが作成され、キャッシュに格納されます。そのサマリーは、後の操作で使用するために保持することも、処理後に削除することもできます。詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

SQL Server Analysis Services データソースビュー (DSV) オブジェクト内で異なるデータを結合します。これにより、データソースの上に抽象化レイヤーが提供されます。テーブル間の結合を指定できます。また、多対一のリレーションシップを持つテーブルを追加して、入れ子になったテーブル列を作成することができます。これらのオブジェクト (データソースおよびデータソースビュー) の定義は、*.ds および *.dsv というファイル名拡張子でソリューション内に保存されます。 SQL Server Analysis Services データソースとデータソースビューの作成と使用の詳細については、「サポートされているデータソース (SSAS - 多次元)」を参照してください。

AMO または XMLA を使用して、データソースおよびデータソースビューを定義および変更することもできます。これらのオブジェクトをプログラムで操作する方法の詳細については、「論理アーキテクチャの概要 (Analysis Services - 多次元データ)」を参照してください。

マイニング構造

データマイニング構造は、マイニングモデルの作成元のデータドメインを定義する論理データコンテナーです。 1 つのマイニング構造で複数のマイニングモデルをサポートできます。

データマイニングソリューションでデータを使用する必要がある場合、Analysis Services ではソースからデータを読み込み、集計およびその他の情報のキャッシュを生成します。既定では、トレーニングデータを再利用して追加のモデルをサポートできるように、このキャッシュは保持されます。キャッシュを削除する必要がある場合は、マイニング構造オブジェクトの CacheMode プロパティを値 ClearAfterProcessingに変更します。詳細については、「 AMO データマイニングクラス」を参照してください。

Analysis Services では、データをトレーニングデータセットとテストデータセットに分離して、代表的なランダムに選択されたデータセットでマイニングモデルをテストすることもできます。データは、実際には別々に格納されません。構造キャッシュ内のケースデータには、その特定のケースがトレーニングに使用されるかテストに使用されるかを示すプロパティが設定されます。キャッシュを削除すると、その情報を取得できなくなります。

詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

データマイニング構造には、入れ子になったテーブルを含めることができます。入れ子になったテーブルは、プライマリデータテーブルでモデル化されているケースに関する追加の詳細情報を提供します。詳細については、「入れ子になったテーブル (Analysis Services - データマイニング)」を参照してください。

[マイニングモデル]

処理前のデータマイニングモデルは、メタデータのプロパティの組み合わせにすぎません。これらのプロパティでは、マイニング構造とデータマイニングアルゴリズムを指定し、データの処理方法に影響するパラメーターとフィルター設定のコレクションを定義します。詳細については、「マイニングモデル (Analysis Services - データマイニング)」を参照してください。

モデルを処理すると、マイニング構造のキャッシュに格納されたトレーニングデータを使用して、データの統計プロパティと、アルゴリズムおよびそのパラメーターによって定義されたヒューリスティックの両方に基づいたパターンが生成されます。これは、モデルの トレーニング と呼ばれます。

トレーニングの結果は、見つかったパターンを表し、予測を生成するルールを提供する一連の概要データで、 モデルコンテンツに格納されます。詳細については、「マイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

限られた状況では、標準形式である Predictive Model Markup Language (PMML) に従ってモデルの数式とデータバインドを表すファイルにモデルの論理構造をエクスポートすることもできます。 PMML を使用する他のシステムにこの論理構造をインポートし、そのモデルを予測に使用することができます。詳細については、「 DMX 選択ステートメントについて」を参照してください。

カスタムデータマイニングオブジェクト

精度チャート、予測クエリなど、データマイニングプロジェクトのコンテキストで使用するその他のオブジェクトは、ソリューション内に保存されませんが、ASSL を使用してスクリプト化することや、AMO を使用して作成することができます。

さらに、次のカスタムオブジェクトを追加することで、SQL Server Analysis Servicesのインスタンスで使用できるサービスと機能を拡張できます。

カスタムアセンブリ
.NET アセンブリは、CLR または COM に準拠した任意の言語を使用して定義した後、SQL Server のインスタンスに登録できます。アセンブリファイルは、アプリケーションで定義された場所から読み込まれ、コピーは、データと共にサーバーに保存されます。アセンブリファイルのコピーは、サービスが開始されるたびにアセンブリを読み込むために使用されます。

詳細については、「多次元モデルのアセンブリの管理」を参照してください。

カスタムストアドプロシージャ
SQL Server Analysis Services データマイニングでは、ストアドプロシージャを使用してデータマイニングオブジェクトを操作できます。独自のストアドプロシージャを作成して、機能を拡張し、予測クエリおよびコンテンツクエリから返されるデータをより簡単に操作できます。

ストアドプロシージャの定義

次のストアドプロシージャを使用して、クロス検証を実行できます。

データマイニングのストアドプロシージャ (Analysis Services - データマイニング)

さらに、SQL Server Analysis Servicesには、データマイニングに内部的に使用される多くのシステムストアドプロシージャが含まれています。システムストアドプロシージャは内部で使用するためのものですが、それらを応用することもできます。これらのストアドプロシージャは、マイクロソフトによって随時変更される場合があります。そのため、実際の運用では、DMX、AMO、または XMLA を使用してクエリを作成することをお勧めします。

カスタムプラグインアルゴリズム
SQL Server Analysis Servicesは、独自のアルゴリズムを作成し、新しいデータマイニングサービスとしてアルゴリズムをサーバーインスタンスに追加するためのメカニズムを提供します。

Analysis Services では、COM インターフェイスを使用して、プラグインアルゴリズムと通信します。新しいアルゴリズムの実装方法の詳細については、「プラグインアルゴリズム」を参照してください。

新しいアルゴリズムはそれぞれ使用する前に登録する必要があります。アルゴリズムを登録するには、アルゴリズムに必要なメタデータを SQL Server Analysis Services のインスタンスの .ini ファイルに追加します。新しいアルゴリズムを使用する各インスタンスに情報を追加する必要があります。アルゴリズムを追加したら、インスタンスを再起動し、MINING_SERVICES スキーマ行セットを使用して、新しいアルゴリズムを表示し、そのアルゴリズムでサポートされているオプション、プロバイダーなどを確認できます。

参照

多次元モデルの処理 (Analysis Services)
データマイニング拡張機能 (DMX) リファレンス

次の方法で共有

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソースデータ

マイニング構造

[マイニングモデル]

カスタムデータマイニングオブジェクト

参照

フィードバック

フィードバック

その他のリソース

次の方法で共有

論理アーキテクチャ (Analysis Services - データ マイニング)

データ マイニング ソース データ

マイニング構造

[マイニング モデル]

カスタム データ マイニング オブジェクト

参照

フィードバック

フィードバック

その他のリソース

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソースデータ

[マイニングモデル]

カスタムデータマイニングオブジェクト