Share via


処理の要件および注意事項 (データ マイニング)

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データ マイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。 非推奨および停止された機能については、ドキュメントの更新は行われません。 詳細については、「Analysis Services 下位互換性」を参照してください。

このトピックでは、データ マイニング オブジェクトを処理するときに注意するいくつかの技術的な考慮事項について説明します。 処理について、および処理がデータ マイニングに適用される方法に関する一般情報については、「 データ マイニング オブジェクトの処理」を参照してください。

リレーショナル ストアに対するクエリ

マイニング構造の処理

マイニング モデルの処理

処理中のリレーショナル ストアに対するクエリ

データ マイニングでの処理には、ソース データのクエリ、生の統計情報の特定、およびモデル定義とアルゴリズムを使用したマイニング モデルのトレーニングの 3 つの段階があります。

SQL Server Analysis Services サーバーは、生データを提供するデータベースに対してクエリを発行します。 このデータベースは、SQL Server 2017 のインスタンスか、SQL Server データベース エンジンの以前のバージョンである可能性があります。 データ マイニング構造の処理時には、ソース内のデータがマイニング構造に転送され、圧縮形式でディスク上に新たに保存されます。 データ ソース内のすべての列が処理されるとは限りません。バインドの定義に従って、マイニング構造に含まれる列だけが処理されます。

このデータを使用して、SQL Server Analysis Servicesはすべてのデータと分離された列のインデックスを作成し、連続列用に個別のインデックスを作成します。 入れ子になったテーブルごとに、インデックスを作成するためのクエリが実行され、入れ子になったテーブルとケース テーブルの各ペアの関係を処理するための追加のクエリが生成されます。 このように複数のクエリが作成されるのは、特殊な内部多次元データ ストアを処理するためです。 サーバー プロパティ DatabaseConnectionPoolMax を設定することで、リレーショナル ストアに送信SQL Server Analysis Servicesクエリの数を制限できます。 詳細については、「 OLAP のプロパティ」を参照してください。

モデルの処理時に、モデルは、データ ソースからデータを再度読み取るのではなく、マイニング構造からデータの概要を取得します。 サーバーは、作成されたキューブと、キャッシュされたインデックス データとケース データを使用して、モデルのトレーニングを行うための独立したスレッドを作成します。

並列モデル処理をサポートするSQL Serverのエディションの詳細については、「SQL Server 2012 の各エディションでサポートされる機能 (https://go.microsoft.com/fwlink/?linkid=232473)」を参照してください。

マイニング構造の処理

マイニング構造は、すべての依存モデルと一緒に処理することも、個別に処理することもできます。 処理に時間がかかると予想されるモデルがあり、その操作を保留する場合、モデルとは別にマイニング構造を処理すると便利です。

詳細については、「 マイニング構造の処理」を参照してください。

ハード ディスク領域の節約が心配な場合は、マイニング構造のキャッシュSQL Server Analysis Servicesローカルに保持されることに注意してください。 つまり、すべてのトレーニング データがローカル ハード ディスクに書き込まれます。 データをキャッシュしない場合は、マイニング構造の MiningStructureCacheMode プロパティを ClearAfterProcessing」を参照してください。 これにより、モデルを処理した後にキャッシュが破棄されます。また、マイニング構造のドリルスルーも無効になります。 詳細については、「 ドリルスルー クエリ (データ マイニング)」を参照してください。

また、キャッシュを消去すると、提示されたテスト セット (定義している場合) を使用できなくなり、テスト セット パーティションの定義も失われます。 ホールドアウト テスト セットの詳細については、「データ セット のトレーニングとテスト」を参照してください。

マイニング モデルの処理

関連付けられているマイニング構造とは別にマイニング モデルを処理することも、マイニング構造に基づくすべてのモデルをマイニング構造と共に処理することもできます。

詳細については、「 マイニング モデルの処理」を参照してください。

ただし、SQL Server Data ToolsとSQL Server Management Studioでは、構造で処理するマイニング モデルを複数選択することはできません。 処理するモデルを制御する必要がある場合は、モデルを個別に選択するか、XMLA または DMX を使用してモデルを順番に処理する必要があります。

再処理が必要な場合

モデルの操作を開始する前に、定義したSQL Server Analysis Services モデルを処理する必要があります。 また、マイニング モデル構造の変更、トレーニング データの更新、既存のマイニング モデルの変更、または構造への新しいマイニング モデルの追加を行った場合は、必ずマイニング モデルを再処理する必要があります。

マイニング モデルは、以下のシナリオでも処理されます。

プロジェクトの配置: 通常は、プロジェクトの設定と現在の状態に応じて、プロジェクトの配置時にそのプロジェクトのマイニング モデルが完全処理されます。

デプロイを開始すると、SQL Server Analysis Services サーバーに以前に処理されたバージョンがあり、構造上の変更がない場合を除き、処理が自動的に開始されます。 プロジェクトを配置するには、ドロップダウン リストから [ソリューションの配置] を選択するか、または F5 キーを押します。 そのための方法は次のとおりです。

マイニング モデルの配置方法を制御するSQL Server Analysis Services配置プロパティを設定する方法の詳細については、「データ マイニング ソリューションの配置」を参照してください。

マイニング モデルの移動: EXPORT コマンドを使用してマイニング モデルを移動する場合、モデルの定義だけがエクスポートされます。この定義には、モデルにデータを提供する予定のマイニング構造の名前が含まれます。

EXPORT コマンドと IMPORT コマンドを使用するシナリオとその再処理の要件を次に示します。

  • 移動先のインスタンスにマイニング構造が存在し、そのマイニング構造が未処理の状態にある場合。

    構造とモデルの両方を再処理する必要があります。

  • 移動先のインスタンスにマイニング構造が存在し、そのマイニング構造が処理済みで、 マイニング モデルのみがエクスポートされた場合。

    モデルは処理せずに使用できます。

  • WITH DEENDENCIES キーワードを使用してマイニング構造の定義もエクスポートされた場合。

    構造とモデルの両方を再処理する必要があります。

詳細については、「 データ マイニング オブジェクトのエクスポートおよびインポート」を参照してください。

参照

マイニング構造 (Analysis Services - データ マイニング)
マイニング構造 (Analysis Services - データ マイニング)
多次元モデルの処理 (Analysis Services)