[アーティクル]
04/01/2012

データマイニングモデルのカスタマイズ (Analysis Services - データマイニング)

現在のビジネスニーズに合ったアルゴリズムを選択した後、マイニングモデルを次の方法でカスタマイズできます。モデルをカスタマイズすると、より良い結果を得られる場合があります。

モデルで使用するデータ列、または列の使用法やコンテンツの種類を変更する。
マイニングモデルに対するフィルターを作成して、モデルのトレーニングに使用するデータを制限する。
アルゴリズムパラメーターを設定して、しきい値やツリーの分割などの条件を制御する。
データの分析や予測に使用される既定のアルゴリズムを変更する。

モデルで使用するデータの変更

モデルで使用するデータ列や、そのデータの使用方法および処理方法に関する決定は、分析の結果に大きく影響します。以下のトピックには、それらの選択に役立つ情報が含まれています。

マイニングモデル (Analysis Services - データマイニング)

マイニングモデルのアーキテクチャの概要について、基になるマイニング構造やマイニング列の選択を含めて説明します。
マイニングモデルのフィルターの作成 (Analysis Services - データマイニング)

マイニングモデルに適用されるフィルターを作成して、マイニング構造データのサブセットに基づくモデルを作成する方法を説明します。
データマイニングでの機能の選択.

Analysis Services で、機能の選択というプロセスがどのように使用されるのかを説明します。機能の選択を使用すると、最も役に立つ属性のみを選択してモデルに追加することができます。列や属性の数を減らすと、パフォーマンスやモデルの品質を向上させることができます。使用できる機能の選択の方法は、選択するアルゴリズムによって異なります。

データマイニングウィザードを使用する場合は、特定のモデルを作成するうえで最も役に立つデータが自動的に選択されるようにすることもできます。

アルゴリズムの設定のカスタマイズ

アルゴリズムの選択によって、どのような結果が得られるかが決まります。特定のアルゴリズムがどのように動作し、どのようなビジネスシナリオで役立つかについては、「データマイニングアルゴリズム (Analysis Services - データマイニング)」を参照してください。

Analysis Services で提供されるデータマイニングアルゴリズムは、広範なカスタマイズにも対応しています。アルゴリズムのパラメーターを設定することにより、そのアルゴリズムの動作やデータの処理方法を制御できます。各アルゴリズムがサポートするパラメーターの詳細については、次のトピックを参照してください。

Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス

Microsoft クラスタリングアルゴリズムテクニカルリファレンス

Microsoft Naive Bayes アルゴリズムテクニカルリファレンス

Microsoft アソシエーションアルゴリズムテクニカルリファレンス

Microsoft シーケンスクラスタアルゴリズムテクニカルリファレンス (Analysis Services - データマイニング)

Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス

Microsoft ロジスティック回帰アルゴリズムテクニカルリファレンス

Microsoft 線形回帰アルゴリズムテクニカルリファレンス

Microsoft タイムシリーズアルゴリズムテクニカルリファレンス

これらのトピックには、それぞれのアルゴリズムに基づくモデルで使用できる予測関数の一覧も含まれています。

アルゴリズムパラメーターの一覧

各アルゴリズムでは、アルゴリズムの動作をカスタマイズしたり、モデルの結果を細かく調整したりするために使用できるパラメーターがサポートされています。各パラメーターの使用方法については、以下のトピックを参照してください。

プロパティ名	適用対象
AUTO_DETECT_PERIODICITY	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
CLUSTER_COUNT	Microsoft クラスタリングアルゴリズムテクニカルリファレンス Microsoft シーケンスクラスタアルゴリズムテクニカルリファレンス (Analysis Services - データマイニング)
CLUSTER_SEED	Microsoft クラスタリングアルゴリズムテクニカルリファレンス
CLUSTERING_METHOD	Microsoft クラスタリングアルゴリズムテクニカルリファレンス
COMPLEXITY_PENALTY	Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
FORCE_REGRESSOR	Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス Microsoft 線形回帰アルゴリズムテクニカルリファレンスモデリングフラグ (データマイニング)
FORECAST_METHOD	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
HIDDEN_NODE_RATIO	Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス
HISTORIC_MODEL_COUNT	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
HISTORICAL_MODEL_GAP	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
HOLDOUT_PERCENTAGE	Microsoft ロジスティック回帰アルゴリズムテクニカルリファレンス Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス注このパラメーターは、マイニング構造に適用される提示割合の値とは異なります。
HOLDOUT_SEED	Microsoft ロジスティック回帰アルゴリズムテクニカルリファレンス Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス注このパラメーターは、マイニング構造に適用される提示されたシードの値とは異なります。
INSTABILITY_SENSITIVITY	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
MAXIMUM_INPUT_ATTRIBUTES	Microsoft クラスタリングアルゴリズムテクニカルリファレンス Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス Microsoft 線形回帰アルゴリズムテクニカルリファレンス Microsoft Naive Bayes アルゴリズムテクニカルリファレンス Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス Microsoft ロジスティック回帰アルゴリズムテクニカルリファレンス
MAXIMUM_ITEMSET_COUNT	Microsoft アソシエーションアルゴリズムテクニカルリファレンス
MAXIMUM_ITEMSET_SIZE	Microsoft アソシエーションアルゴリズムテクニカルリファレンス
MAXIMUM_OUTPUT_ATTRIBUTES	Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス Microsoft 線形回帰アルゴリズムテクニカルリファレンス Microsoft ロジスティック回帰アルゴリズムテクニカルリファレンス Microsoft Naive Bayes アルゴリズムテクニカルリファレンス Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス
MAXIMUM_SEQUENCE_STATES	Microsoft シーケンスクラスタアルゴリズムテクニカルリファレンス (Analysis Services - データマイニング)
MAXIMUM_SERIES_VALUE	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
MAXIMUM_STATES	Microsoft クラスタリングアルゴリズムテクニカルリファレンス Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス Microsoft シーケンスクラスタアルゴリズムテクニカルリファレンス (Analysis Services - データマイニング)
MAXIMUM_SUPPORT	Microsoft アソシエーションアルゴリズムテクニカルリファレンス
MINIMUM_IMPORTANCE	Microsoft アソシエーションアルゴリズムテクニカルリファレンス
MINIMUM_ITEMSET_SIZE	Microsoft アソシエーションアルゴリズムテクニカルリファレンス
MINIMUM_DEPENDENCY_PROBABILITY	Microsoft Naive Bayes アルゴリズムテクニカルリファレンス
MINIMUM_PROBABILITY	Microsoft アソシエーションアルゴリズムテクニカルリファレンス
MINIMUM_SERIES_VALUE	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
MINIMUM_SUPPORT	Microsoft アソシエーションアルゴリズムテクニカルリファレンス Microsoft クラスタリングアルゴリズムテクニカルリファレンス Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス Microsoft シーケンスクラスタアルゴリズムテクニカルリファレンス (Analysis Services - データマイニング) Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
MISSING_VALUE_SUBSTITUTION	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
MODELLING_CARDINALITY	Microsoft クラスタリングアルゴリズムテクニカルリファレンス
PERIODICITY_HINT	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
PREDICTION_SMOOTHING	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス
SAMPLE_SIZE	Microsoft クラスタリングアルゴリズムテクニカルリファレンス Microsoft ロジスティック回帰アルゴリズムテクニカルリファレンス Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス
SCORE_METHOD	Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス
SPLIT_METHOD	Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス
STOPPING_TOLERANCE	Microsoft クラスタリングアルゴリズムテクニカルリファレンス

その他の要件

データの選択と準備は、データマイニングプロセスの重要な部分です。たとえば、Microsoft が提供するアルゴリズムでは、重複するキーは使用できません。各モデルで必要となるデータの種類は、アルゴリズムによって異なります。詳細については、次のトピックの「必要条件」を参照してください。

Microsoft デシジョンツリーアルゴリズム	Microsoft タイムシリーズアルゴリズム
Microsoft クラスタリングアルゴリズム	Microsoft ニューラルネットワークアルゴリズム (Analysis Services - データマイニング)
Microsoft Naive Bayes アルゴリズム	Microsoft ロジスティック回帰アルゴリズム
Microsoft アソシエーションアルゴリズム	Microsoft 線形回帰アルゴリズム
Microsoft シーケンスクラスターアルゴリズム

クエリと予測関数による結果のカスタマイズ

モデルを作成して処理したら、それぞれのモデルの種類に固有のビューアーを使用して情報を表示できます。また、データマイニング拡張機能 (DMX) を使用してカスタムクエリを作成すると、データ内で検出されたパターンについてより詳細な情報を入手することができます。

モデルコンテンツを返すクエリの作成方法については、「データマイニングモデルのクエリ (Analysis Services - データマイニング)」を参照してください。

関数を使用して、マイニングモデルによって返される結果を拡張できます。結果の確率を表す統計やその他のスコアを返す関数もあります。さらに、個々のアルゴリズムでサポートされている追加の関数もあります。たとえば、クラスタリングを使用するマイニングモデルでは、特殊な関数を使用して、クラスターに関する情報を見つけることができます。一方、時系列アルゴリズムに基づくモデルでは、また別の関数を使用して、予測やモデルコンテンツのクエリを実行することができます。詳細については、各アルゴリズムのテクニカルリファレンストピックを参照してください。

マイニングモデルのクエリを実行する方法の例や、特定の種類のモデル用の予測関数を使用する方法の例については、「データマイニングモデルのクエリ (Analysis Services - データマイニング)」を参照してください。

すべてのアルゴリズムの種類でサポートされている予測関数の一覧については、「クエリ型への関数のマップ (DMX)」を参照してください。

モデルの変更の評価

ビジネス上の問題を解決するためにさまざまなモデルをテストしたり、モデルのバリエーションを作成したりするときは、各モデルの精度を測定し、さらに、各モデルがビジネス上の問題の解決策としてどの程度適しているかを評価する必要があります。データマイニングモデルの評価に関する一般的な情報については、「データマイニングモデルの検証 (Analysis Services - データマイニング)」を参照してください。さまざまなマイニングモデルの精度をグラフ化する方法の詳細については、「モデルの精度をグラフ化するためのツール (Analysis Services - データマイニング)」を参照してください。

次の方法で共有

データマイニングモデルのカスタマイズ (Analysis Services - データマイニング)

モデルで使用するデータの変更

アルゴリズムの設定のカスタマイズ

アルゴリズムパラメーターの一覧

その他の要件

クエリと予測関数による結果のカスタマイズ

モデルの変更の評価

関連項目

概念

その他のリソース

次の方法で共有

データ マイニング モデルのカスタマイズ (Analysis Services - データ マイニング)

モデルで使用するデータの変更

アルゴリズムの設定のカスタマイズ

アルゴリズム パラメーターの一覧

その他の要件

クエリと予測関数による結果のカスタマイズ

モデルの変更の評価

関連項目

概念

その他のリソース

データマイニングモデルのカスタマイズ (Analysis Services - データマイニング)

アルゴリズムパラメーターの一覧