[アーティクル]
04/01/2012

PredictTimeSeries (DMX)

予測される時系列データの将来値を返します。時系列データは連続的なデータで、入れ子になったテーブルまたはケーステーブルに格納できます。PredictTimeSeries 関数は、常に入れ子になったテーブルを返します。

構文

PredictTimeSeries(<table column reference>)
PredictTimeSeries(<table column reference>, n)
PredictTimeSeries(<table column reference>, n-start, n-end)
PredictTimeSeries(<scalar column reference>)
PredictTimeSeries(<scalar column reference>, n)
PredictTimeSeries(<scalar column reference>, n-start, n-end)
PredictTimeSeries(<table column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<table column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>

引数

<table column reference>, <scalar column referenc>
予測する列の名前を指定します。列にはスカラーデータまたは表形式データを格納できます。
n
予測する次のステップの数を指定します。n に値を指定しない場合の既定値は 1 です。

n には 0 を指定できません。1 つ以上の予測を作成しないと、関数はエラーを返します。
n-start, n-end
時系列ステップの範囲を指定します。

n-start には 0 以外の整数を指定する必要があります。

n-end には n-start より大きい整数を指定する必要があります。
<source query>
予測の作成に使用される外部データを定義します。
REPLACE_MODEL_CASES | EXTEND_MODEL_CASES
新しいデータの処理方法を指定します。

REPLACE_MODEL_CASES を指定すると、モデルのデータポイントが新しいデータに置き換えられます。ただし、予測は既存のマイニングモデル内のパターンに基づきます。

EXTEND_MODEL_CASES を指定すると、新しいデータが元のトレーニングデータセットに追加されます。将来の予測は、新しいデータを使い果たした後にのみ複合データセットに基づいて作成されます。

これらの引数は、PREDICTION JOIN ステートメントを使用して新しいデータを追加する場合にのみ使用できます。PREDICTION JOIN クエリで引数を指定しない場合の既定値は EXTEND_MODEL_CASES です。

戻り値の型

<table expression> です。

説明

Microsoft タイムシリーズアルゴリズムでは、PREDICTION JOIN ステートメントを使用して新しいデータを追加する場合、履歴予測はサポートされません。

PREDICTION JOIN では、予測処理は常に、元のトレーニングシリーズが終了した直後の時間ステップから開始されます。これは、新しいデータを追加する場合にも当てはまります。したがって、n パラメーターと n-start パラメーターの値は、0 より大きい整数である必要があります。

注
新しいデータの長さは、予測の開始位置には影響しません。そのため、新しいデータを追加して新しい予測を作成する場合は、予測の開始位置を新しいデータの長さより大きい値に設定するか、予測の終了位置を新しいデータの長さだけ拡張するようにします。

例

次の例は、既存の時系列モデルに対する予測の作成方法を示しています。

最初の例では、現在のモデルに基づいた予測を指定した数だけ作成する方法を示します。
2 番目の例では、REPLACE_MODEL_CASES パラメーターを使用して、指定したモデル内のパターンを新しいデータセットに適用する方法を示します。
3 番目の例では、EXTEND_MODEL_CASES パラメーターを使用して、マイニングモデルを新しいデータで更新する方法を示します。

時系列モデルの操作の詳細については、データマイニングチュートリアル「レッスン 2: 予測シナリオの作成 (中級者向けデータマイニングチュートリアル)」および「時系列予測の DMX のチュートリアル」を参照してください。

注
モデルの結果は異なる場合があります。次の例の結果は、結果の形式を説明することのみを目的としています。

例 1 : 特定の数のタイムスライスを予測する

次の例では、PredictTimeSeries 関数を使用して次の 3 ステップの予測を返し、結果をヨーロッパ地域および太平洋地域の M200 シリーズに制限します。この特定のモデルでは、予測可能な属性が Quantity であるため、[Quantity] を PredictTimeSeries 関数の最初の引数として使用する必要があります。

SELECT FLATTENED
    [Forecasting].[Model Region],
    PredictTimeSeries([Forecasting].[Quantity],3)AS t 
FROM
    [Forecasting]
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific'

期待される結果:

Model Region	t.$TIME	t.Quantity
M200 Europe	7/25/2008 12:00:00 AM	121
M200 Europe	8/25/2008 12:00:00 AM	142
M200 Europe	9/25/2008 12:00:00 AM	152
M200 Pacific	7/25/2008 12:00:00 AM	46
M200 Pacific	8/25/2008 12:00:00 AM	44
M200 Pacific	9/25/2008 12:00:00 AM	42

この例では、結果を読みやすくするために FLATTENED キーワードが使用されています。FLATTENED キーワードを使用せずに、階層的な行セットを返す場合、このクエリでは 2 つの列が返されます。1 つ目の列には [ModelRegion] の値、2 つ目の列には入れ子になったテーブルが含まれます。入れ子になったテーブルには、予測されているタイムスライスを示す $TIME と予測された値を含む Quantity という 2 つの列が含まれています。

例 2 : 新しいデータを追加して REPLACE_MODEL_CASES を使用する

特定の地域のデータが正しくないことが判明したので、モデル内のパターンを使用しながら新しいデータに合わせて予測を調整するとします。または、別の地域の傾向の方が信頼性が高いことが判明したので、最も信頼性が高いモデルを異なる地域のデータに適用するとします。

このようなシナリオでは、REPLACE_MODEL_CASES パラメーターを使用して、履歴データとして使用する新しいデータセットを指定できます。これにより、予測は指定したモデル内のパターンに基づくが、新しいデータポイントの末尾からスムーズに継続するようになります。このシナリオの完全なチュートリアルについては、「集計予測モデルの追加 (中級者向けデータマイニングチュートリアル)」を参照してください。

次の PREDICTION JOIN クエリでは、データを置き換えて新しい予測を作成する構文を示します。この例では、置き換え後のデータとして、Amount 列と Quantity 列の値を取得してそれぞれの値に 2 を乗算します。

SELECT [Forecasting].[Model Region],
    PredictTimeSeries([Forecasting].[Quantity], 3, REPLACE_MODEL_CASES) 
FROM
    [Forecasting]
PREDICTION JOIN
  OPENQUERY([Adventure Works DW2008R2],
    'SELECT [ModelRegion], 
    ([Quantity] * 2) as Quantity,
    ([Amount] * 2) as Amount,
      [ReportingDate]
    FROM [dbo].vTimeSeries
    WHERE ModelRegion = N''M200 Pacific''
    ') AS t
ON
  [Forecasting].[Model Region] = t.[ Model Region] AND
[Forecasting].[Reporting Date] = t.[ReportingDate] AND
[Forecasting].[Quantity] = t.[Quantity] AND
[Forecasting].[Amount] = t.[Amount]

次の表では、予測の結果を比較しています。

元の予測	更新された予測
M200 Pacific7/25/2008 12:00:00 AM46 M200 Pacific8/25/2008 12:00:00 AM44 M200 Pacific9/25/2008 12:00:00 AM42	M200 Pacific7/25/2008 12:00:00 AM91 M200 Pacific8/25/2008 12:00:00 AM89 M200 Pacific9/25/2008 12:00:00 AM84

例 3: 新しいデータを追加して EXTEND_MODEL_CASES を使用する

例 3 では、EXTEND_MODEL_CASES オプションを使用して新しいデータを指定し、既存のデータ系列の末尾に追加する方法を示します。既存のデータポイントを置き換えるのではなく、新しいデータをモデルに追加します。

次の例では、NATURAL PREDICTION JOIN の後の SELECT ステートメントで新しいデータを指定します。この構文では複数行の新しい入力を指定できますが、それぞれの新しい入力行のタイムスタンプが一意である必要があります。

SELECT [Model Region],
    PredictTimeSeries([Forecasting].[Quantity], 5, EXTEND_MODEL_CASES) 
FROM
    [Forecasting]
NATURAL PREDICTION JOIN
    (SELECT
        1 as [Reporting Date],
        10 as [Quantity],
        'M200 Europe' AS [Model Region]
    UNION SELECT 
        2 as [Reporting Date],
        15 as [Quantity],
        'M200 Europe' AS [Model Region]
) AS T
WHERE ([Model Region] = 'M200 Europe'
 OR [Model Region] = 'M200 Pacific')

クエリで EXTEND_MODEL_CASES オプションが使用されているので、Analysis Services では、予測のために次の処理が行われます。

2 か月分の新しいデータをモデルに追加して、トレーニングケースの合計サイズを大きくします。
前のケースデータの末尾から予測を開始します。したがって、最初の 2 つの予測は、モデルに追加した実際の新しい売上データを表します。
新しく拡張されたモデルに基づく残りの 3 つのタイムスライスの新しい予測を返します。

次の表は、例 2 のクエリの結果を示しています。最初に返された M200 Europe の 2 つの値は、指定した新しい値とまったく同じです。この動作は仕様であり、新しいデータの末尾から予測を開始するには、開始時刻と終了時刻のステップを指定する必要があります。この操作を行う方法の例については、「レッスン 5 : 時系列モデルの拡張」を参照してください。

また、太平洋地域については、新しいデータを指定していません。したがって、Analysis Services は、5 つすべてのタイムスライスの新しい予測を返します。

Quantity	EXTEND_MODEL_CASES
M200 Europe	$TIMEQuantity 7/25/2008 0:0010 8/25/2008 0:0015 9/25/2008 0:0072 10/25/2008 0:0069 11/25/2008 0:0068
M200 Pacific	$TIMEQuantity 7/25/2008 0:0046 8/25/2008 0:0044 9/25/2008 0:0042 10/25/2008 0:0042 11/25/2008 0:0038

例 4: 時系列予測の統計を返す

PredictTimeSeries 関数は、パラメーターとして INCLUDE_STATISTICS をサポートしていません。ただし、次のクエリを使用して、時系列のクエリに対する予測の統計を返すことができます。この方法は、テーブル列を入れ子にしているモデルにも使用できます。

この特定のモデルでは、予測可能な属性が Quantity であるため、[Quantity] を PredictTimeSeries 関数の最初の引数として使用する必要があります。モデルで別の予測可能な属性を使用する場合は、別の列名に置き換えることができます。

SELECT FLATTENED [Model Region],
(SELECT 
     $Time,
     [Quantity] as [PREDICTION], 
     PredictVariance([Quantity]) AS [VARIANCE],
     PredictStdev([Quantity]) AS [STDEV]
FROM
      PredictTimeSeries([Quantity], 3) AS t
) AS t
FROM Forecasting
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 North America'

サンプルの結果 :

Model Region	t.$TIME	t.PREDICTION	t.VARIANCE	t.STDEV
M200 Europe	7/25/2008 12:00:00 AM	121	11.6050581415597	3.40661975300439
M200 Europe	8/25/2008 12:00:00 AM	142	10.678201866621	3.26775180615374
M200 Europe	9/25/2008 12:00:00 AM	152	9.86897842568614	3.14149302493037
M200 North America	7/25/2008 12:00:00 AM	163	1.20434529288162	1.20434529288162
M200 North America	8/25/2008 12:00:00 AM	178	1.65031343900634	1.65031343900634
M200 North America	9/25/2008 12:00:00 AM	156	1.68969399185442	1.68969399185442

注
この例では、FLATTENED キーワードを使用して、結果を表形式でわかりやすくしました。ただし、プロバイダーで階層的な行セットがサポートされている場合は、FLATTENED キーワードを省略できます。FLATTENED キーワードを省略した場合、クエリでは 2 つの列が返されます。1 つ目の列には、[Model Region] データ系列を識別する値、2 つ目の列には、統計の入れ子になったテーブルが含まれます。

この例では、FLATTENED キーワードを使用して、結果を表形式でわかりやすくしました。ただし、プロバイダーで階層的な行セットがサポートされている場合は、FLATTENED キーワードを省略できます。FLATTENED キーワードを省略した場合、クエリでは 2 つの列が返されます。1 つ目の列には、[Model Region] データ系列を識別する値、2 つ目の列には、統計の入れ子になったテーブルが含まれます。

次の方法で共有

PredictTimeSeries (DMX)

構文

引数

戻り値の型

説明

例

例 1 : 特定の数のタイムスライスを予測する

例 2 : 新しいデータを追加して REPLACE_MODEL_CASES を使用する

例 3: 新しいデータを追加して EXTEND_MODEL_CASES を使用する

例 4: 時系列予測の統計を返す

関連項目

参照

概念

その他のリソース

次の方法で共有

PredictTimeSeries (DMX)

構文

引数

戻り値の型

説明

例

例 1 : 特定の数のタイム スライスを予測する

例 2 : 新しいデータを追加して REPLACE_MODEL_CASES を使用する

例 3: 新しいデータを追加して EXTEND_MODEL_CASES を使用する

例 4: 時系列予測の統計を返す

関連項目

参照

概念

その他のリソース

例 1 : 特定の数のタイムスライスを予測する