データ マイニング モデルのカスタマイズ (Analysis Services - データ マイニング)
現在のビジネス ニーズに合ったアルゴリズムを選択した後、マイニング モデルを次の方法でカスタマイズできます。モデルをカスタマイズすると、より良い結果を得られる場合があります。
モデルで使用するデータ列、または列の使用法やコンテンツの種類を変更する。
マイニング モデルに対するフィルターを作成して、モデルのトレーニングに使用するデータを制限する。
アルゴリズム パラメーターを設定して、しきい値やツリーの分割などの条件を制御する。
データの分析や予測に使用される既定のアルゴリズムを変更する。
モデルで使用するデータの変更
モデルで使用するデータ列や、そのデータの使用方法および処理方法に関する決定は、分析の結果に大きく影響します。以下のトピックには、それらの選択に役立つ情報が含まれています。
マイニング モデル (Analysis Services - データ マイニング)
マイニング モデルのアーキテクチャの概要について、基になるマイニング構造やマイニング列の選択を含めて説明します。
マイニング モデルのフィルターの作成 (Analysis Services - データ マイニング)
マイニング モデルに適用されるフィルターを作成して、マイニング構造データのサブセットに基づくモデルを作成する方法を説明します。
-
Analysis Services で、機能の選択というプロセスがどのように使用されるのかを説明します。機能の選択を使用すると、最も役に立つ属性のみを選択してモデルに追加することができます。列や属性の数を減らすと、パフォーマンスやモデルの品質を向上させることができます。使用できる機能の選択の方法は、選択するアルゴリズムによって異なります。
データ マイニング ウィザードを使用する場合は、特定のモデルを作成するうえで最も役に立つデータが自動的に選択されるようにすることもできます。
アルゴリズムの設定のカスタマイズ
アルゴリズムの選択によって、どのような結果が得られるかが決まります。特定のアルゴリズムがどのように動作し、どのようなビジネス シナリオで役立つかについては、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。
Analysis Services で提供されるデータ マイニング アルゴリズムは、広範なカスタマイズにも対応しています。アルゴリズムのパラメーターを設定することにより、そのアルゴリズムの動作やデータの処理方法を制御できます。各アルゴリズムがサポートするパラメーターの詳細については、次のトピックを参照してください。
Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス
Microsoft クラスタリング アルゴリズム テクニカル リファレンス
Microsoft Naive Bayes アルゴリズム テクニカル リファレンス
Microsoft アソシエーション アルゴリズム テクニカル リファレンス
Microsoft シーケンス クラスタ アルゴリズム テクニカル リファレンス (Analysis Services - データ マイニング)
Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス
Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス
Microsoft 線形回帰アルゴリズム テクニカル リファレンス
Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
これらのトピックには、それぞれのアルゴリズムに基づくモデルで使用できる予測関数の一覧も含まれています。
アルゴリズム パラメーターの一覧
各アルゴリズムでは、アルゴリズムの動作をカスタマイズしたり、モデルの結果を細かく調整したりするために使用できるパラメーターがサポートされています。各パラメーターの使用方法については、以下のトピックを参照してください。
その他の要件
データの選択と準備は、データ マイニング プロセスの重要な部分です。たとえば、Microsoft が提供するアルゴリズムでは、重複するキーは使用できません。各モデルで必要となるデータの種類は、アルゴリズムによって異なります。詳細については、次のトピックの「必要条件」を参照してください。
クエリと予測関数による結果のカスタマイズ
モデルを作成して処理したら、それぞれのモデルの種類に固有のビューアーを使用して情報を表示できます。また、データ マイニング拡張機能 (DMX) を使用してカスタム クエリを作成すると、データ内で検出されたパターンについてより詳細な情報を入手することができます。
モデル コンテンツを返すクエリの作成方法については、「データ マイニング モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。
関数を使用して、マイニング モデルによって返される結果を拡張できます。結果の確率を表す統計やその他のスコアを返す関数もあります。さらに、個々のアルゴリズムでサポートされている追加の関数もあります。たとえば、クラスタリングを使用するマイニング モデルでは、特殊な関数を使用して、クラスターに関する情報を見つけることができます。一方、時系列アルゴリズムに基づくモデルでは、また別の関数を使用して、予測やモデル コンテンツのクエリを実行することができます。詳細については、各アルゴリズムのテクニカル リファレンス トピックを参照してください。
マイニング モデルのクエリを実行する方法の例や、特定の種類のモデル用の予測関数を使用する方法の例については、「データ マイニング モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。
すべてのアルゴリズムの種類でサポートされている予測関数の一覧については、「クエリ型への関数のマップ (DMX)」を参照してください。
モデルの変更の評価
ビジネス上の問題を解決するためにさまざまなモデルをテストしたり、モデルのバリエーションを作成したりするときは、各モデルの精度を測定し、さらに、各モデルがビジネス上の問題の解決策としてどの程度適しているかを評価する必要があります。データ マイニング モデルの評価に関する一般的な情報については、「データ マイニング モデルの検証 (Analysis Services - データ マイニング)」を参照してください。さまざまなマイニング モデルの精度をグラフ化する方法の詳細については、「モデルの精度をグラフ化するためのツール (Analysis Services - データ マイニング)」を参照してください。