次の方法で共有


論理アーキテクチャ (Analysis Services - データ マイニング)

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データ マイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。 非推奨および停止された機能については、ドキュメントの更新は行われません。 詳細については、「Analysis Services 下位互換性」を参照してください。

データ マイニングは、複数のコンポーネントの相互作用を伴うプロセスです。

  • SQL Server データベース内のデータのソースまたはその他のデータ ソースにアクセスし、トレーニング、テスト、または予測に使用します。

  • SQL Server Data Toolsまたは Visual Studio を使用して、データ マイニング構造とモデルを定義します。

  • データ マイニング オブジェクトを管理し、SQL Server Management Studioを使用して予測とクエリを作成します。

  • ソリューションが完了したら、SQL Server Analysis Servicesのインスタンスにデプロイします。

これらのソリューション オブジェクトを作成するプロセスについては、既に他の場所で説明しています。 詳細については、「 データ マイニング ソリューション」を参照してください。

次のセクションでは、データ マイニング ソリューション内のオブジェクトの論理アーキテクチャについて説明します。

データ マイニング ソース データ

マイニング構造

マイニング モデル

カスタム データ マイニング オブジェクト

データ マイニング ソース データ

データ マイニングで使用するデータは、データ マイニング ソリューションに格納されません。バインドのみが格納されます。 データは前のバージョンの SQL Server、CRM システム、またはフラット ファイルで作成されたデータベースにも存在する場合があります。 処理によって構造またはモデルをトレーニングすると、データの統計サマリーが作成され、キャッシュに格納されます。そのサマリーは、後の操作で使用するために保持することも、処理後に削除することもできます。 詳細については、「 マイニング構造 (Analysis Services - データ マイニング)」を参照してください。

SQL Server Analysis Services データ ソース ビュー (DSV) オブジェクト内で異なるデータを結合します。これにより、データ ソースの上に抽象化レイヤーが提供されます。 テーブル間の結合を指定できます。また、多対一のリレーションシップを持つテーブルを追加して、入れ子になったテーブル列を作成することができます。 これらのオブジェクト (データ ソースおよびデータ ソース ビュー) の定義は、*.ds および *.dsv というファイル名拡張子でソリューション内に保存されます。 SQL Server Analysis Services データ ソースとデータ ソース ビューの作成と使用の詳細については、「サポートされているデータ ソース (SSAS - 多次元)」を参照してください。

AMO または XMLA を使用して、データ ソースおよびデータ ソース ビューを定義および変更することもできます。 これらのオブジェクトをプログラムで操作する方法の詳細については、「 論理アーキテクチャの概要 (Analysis Services - 多次元データ)」を参照してください。

マイニング構造

データ マイニング構造は、マイニング モデルの作成元のデータ ドメインを定義する論理データ コンテナーです。 1 つのマイニング構造で複数のマイニング モデルをサポートできます。

データ マイニング ソリューションでデータを使用する必要がある場合、Analysis Services ではソースからデータを読み込み、集計およびその他の情報のキャッシュを生成します。 既定では、トレーニング データを再利用して追加のモデルをサポートできるように、このキャッシュは保持されます。 キャッシュを削除する必要がある場合は、マイニング構造オブジェクトの CacheMode プロパティを値 ClearAfterProcessingに変更します。 詳細については、「 AMO データ マイニング クラス」を参照してください。

Analysis Services では、データをトレーニング データセットとテスト データ セットに分離して、代表的なランダムに選択されたデータ セットでマイニング モデルをテストすることもできます。 データは、実際には別々に格納されません。構造キャッシュ内のケース データには、その特定のケースがトレーニングに使用されるかテストに使用されるかを示すプロパティが設定されます。 キャッシュを削除すると、その情報を取得できなくなります。

詳細については、「 マイニング構造 (Analysis Services - データ マイニング)」を参照してください。

データ マイニング構造には、入れ子になったテーブルを含めることができます。 入れ子になったテーブルは、プライマリ データ テーブルでモデル化されているケースに関する追加の詳細情報を提供します。 詳細については、「入れ子になったテーブル (Analysis Services - データ マイニング)」を参照してください。

[マイニング モデル]

処理前のデータ マイニング モデルは、メタデータのプロパティの組み合わせにすぎません。 これらのプロパティでは、マイニング構造とデータ マイニング アルゴリズムを指定し、データの処理方法に影響するパラメーターとフィルター設定のコレクションを定義します。 詳細については、「 マイニング モデル (Analysis Services - データ マイニング)」を参照してください。

モデルを処理すると、マイニング構造のキャッシュに格納されたトレーニング データを使用して、データの統計プロパティと、アルゴリズムおよびそのパラメーターによって定義されたヒューリスティックの両方に基づいたパターンが生成されます。 これは、モデルの トレーニング と呼ばれます。

トレーニングの結果は、見つかったパターンを表し、予測を生成するルールを提供する一連の概要データで、 モデル コンテンツに格納されます。 詳細については、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。

限られた状況では、標準形式である Predictive Model Markup Language (PMML) に従ってモデルの数式とデータ バインドを表すファイルにモデルの論理構造をエクスポートすることもできます。 PMML を使用する他のシステムにこの論理構造をインポートし、そのモデルを予測に使用することができます。 詳細については、「 DMX 選択ステートメントについて」を参照してください。

カスタム データ マイニング オブジェクト

精度チャート、予測クエリなど、データ マイニング プロジェクトのコンテキストで使用するその他のオブジェクトは、ソリューション内に保存されませんが、ASSL を使用してスクリプト化することや、AMO を使用して作成することができます。

さらに、次のカスタム オブジェクトを追加することで、SQL Server Analysis Servicesのインスタンスで使用できるサービスと機能を拡張できます。

カスタム アセンブリ
.NET アセンブリは、CLR または COM に準拠した任意の言語を使用して定義した後、SQL Server のインスタンスに登録できます。 アセンブリ ファイルは、アプリケーションで定義された場所から読み込まれ、コピーは、データと共にサーバーに保存されます。 アセンブリ ファイルのコピーは、サービスが開始されるたびにアセンブリを読み込むために使用されます。

詳細については、「 多次元モデルのアセンブリの管理」を参照してください。

カスタム ストアド プロシージャ
SQL Server Analysis Services データ マイニングでは、ストアド プロシージャを使用してデータ マイニング オブジェクトを操作できます。 独自のストアド プロシージャを作成して、機能を拡張し、予測クエリおよびコンテンツ クエリから返されるデータをより簡単に操作できます。

ストアド プロシージャの定義

次のストアド プロシージャを使用して、クロス検証を実行できます。

データ マイニングのストアド プロシージャ (Analysis Services - データ マイニング)

さらに、SQL Server Analysis Servicesには、データ マイニングに内部的に使用される多くのシステム ストアド プロシージャが含まれています。 システム ストアド プロシージャは内部で使用するためのものですが、それらを応用することもできます。 これらのストアド プロシージャは、マイクロソフトによって随時変更される場合があります。そのため、実際の運用では、DMX、AMO、または XMLA を使用してクエリを作成することをお勧めします。

カスタム プラグイン アルゴリズム
SQL Server Analysis Servicesは、独自のアルゴリズムを作成し、新しいデータ マイニング サービスとしてアルゴリズムをサーバー インスタンスに追加するためのメカニズムを提供します。

Analysis Services では、COM インターフェイスを使用して、プラグイン アルゴリズムと通信します。 新しいアルゴリズムの実装方法の詳細については、「 プラグイン アルゴリズム」を参照してください。

新しいアルゴリズムはそれぞれ使用する前に登録する必要があります。 アルゴリズムを登録するには、アルゴリズムに必要なメタデータを SQL Server Analysis Services のインスタンスの .ini ファイルに追加します。 新しいアルゴリズムを使用する各インスタンスに情報を追加する必要があります。 アルゴリズムを追加したら、インスタンスを再起動し、MINING_SERVICES スキーマ行セットを使用して、新しいアルゴリズムを表示し、そのアルゴリズムでサポートされているオプション、プロバイダーなどを確認できます。

参照

多次元モデルの処理 (Analysis Services)
データ マイニング拡張機能 (DMX) リファレンス