PredictTimeSeries (DMX)
予測される時系列データの将来値を返します。時系列データは連続的なデータで、入れ子になったテーブルまたはケース テーブルに格納できます。PredictTimeSeries 関数は、常に入れ子になったテーブルを返します。
構文
PredictTimeSeries(<table column reference>)
PredictTimeSeries(<table column reference>, n)
PredictTimeSeries(<table column reference>, n-start, n-end)
PredictTimeSeries(<scalar column reference>)
PredictTimeSeries(<scalar column reference>, n)
PredictTimeSeries(<scalar column reference>, n-start, n-end)
PredictTimeSeries(<table column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<table column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
引数
<table column reference>, <scalar column referenc>
予測する列の名前を指定します。列にはスカラー データまたは表形式データを格納できます。n
予測する次のステップの数を指定します。n に値を指定しない場合の既定値は 1 です。n には 0 を指定できません。1 つ以上の予測を作成しないと、関数はエラーを返します。
n-start, n-end
時系列ステップの範囲を指定します。n-start には 0 以外の整数を指定する必要があります。
n-end には n-start より大きい整数を指定する必要があります。
<source query>
予測の作成に使用される外部データを定義します。REPLACE_MODEL_CASES | EXTEND_MODEL_CASES
新しいデータの処理方法を指定します。REPLACE_MODEL_CASES を指定すると、モデルのデータ ポイントが新しいデータに置き換えられます。ただし、予測は既存のマイニング モデル内のパターンに基づきます。
EXTEND_MODEL_CASES を指定すると、新しいデータが元のトレーニング データセットに追加されます。将来の予測は、新しいデータを使い果たした後にのみ複合データセットに基づいて作成されます。
これらの引数は、PREDICTION JOIN ステートメントを使用して新しいデータを追加する場合にのみ使用できます。PREDICTION JOIN クエリで引数を指定しない場合の既定値は EXTEND_MODEL_CASES です。
戻り値の型
<table expression> です。
説明
Microsoft タイム シリーズ アルゴリズムでは、PREDICTION JOIN ステートメントを使用して新しいデータを追加する場合、履歴予測はサポートされません。
PREDICTION JOIN では、予測処理は常に、元のトレーニング シリーズが終了した直後の時間ステップから開始されます。これは、新しいデータを追加する場合にも当てはまります。したがって、n パラメーターと n-start パラメーターの値は、0 より大きい整数である必要があります。
注 |
---|
新しいデータの長さは、予測の開始位置には影響しません。そのため、新しいデータを追加して新しい予測を作成する場合は、予測の開始位置を新しいデータの長さより大きい値に設定するか、予測の終了位置を新しいデータの長さだけ拡張するようにします。 |
例
次の例は、既存の時系列モデルに対する予測の作成方法を示しています。
最初の例では、現在のモデルに基づいた予測を指定した数だけ作成する方法を示します。
2 番目の例では、REPLACE_MODEL_CASES パラメーターを使用して、指定したモデル内のパターンを新しいデータセットに適用する方法を示します。
3 番目の例では、EXTEND_MODEL_CASES パラメーターを使用して、マイニング モデルを新しいデータで更新する方法を示します。
時系列モデルの操作の詳細については、データ マイニング チュートリアル「レッスン 2: 予測シナリオの作成 (中級者向けデータ マイニング チュートリアル)」および「時系列予測の DMX のチュートリアル」を参照してください。
注 |
---|
モデルの結果は異なる場合があります。次の例の結果は、結果の形式を説明することのみを目的としています。 |
例 1 : 特定の数のタイム スライスを予測する
次の例では、PredictTimeSeries 関数を使用して次の 3 ステップの予測を返し、結果をヨーロッパ地域および太平洋地域の M200 シリーズに制限します。この特定のモデルでは、予測可能な属性が Quantity であるため、[Quantity] を PredictTimeSeries 関数の最初の引数として使用する必要があります。
SELECT FLATTENED
[Forecasting].[Model Region],
PredictTimeSeries([Forecasting].[Quantity],3)AS t
FROM
[Forecasting]
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific'
期待される結果:
Model Region |
t.$TIME |
t.Quantity |
---|---|---|
M200 Europe |
7/25/2008 12:00:00 AM |
121 |
M200 Europe |
8/25/2008 12:00:00 AM |
142 |
M200 Europe |
9/25/2008 12:00:00 AM |
152 |
M200 Pacific |
7/25/2008 12:00:00 AM |
46 |
M200 Pacific |
8/25/2008 12:00:00 AM |
44 |
M200 Pacific |
9/25/2008 12:00:00 AM |
42 |
この例では、結果を読みやすくするために FLATTENED キーワードが使用されています。FLATTENED キーワードを使用せずに、階層的な行セットを返す場合、このクエリでは 2 つの列が返されます。1 つ目の列には [ModelRegion] の値、2 つ目の列には入れ子になったテーブルが含まれます。入れ子になったテーブルには、予測されているタイム スライスを示す $TIME と予測された値を含む Quantity という 2 つの列が含まれています。
例 2 : 新しいデータを追加して REPLACE_MODEL_CASES を使用する
特定の地域のデータが正しくないことが判明したので、モデル内のパターンを使用しながら新しいデータに合わせて予測を調整するとします。または、別の地域の傾向の方が信頼性が高いことが判明したので、最も信頼性が高いモデルを異なる地域のデータに適用するとします。
このようなシナリオでは、REPLACE_MODEL_CASES パラメーターを使用して、履歴データとして使用する新しいデータセットを指定できます。これにより、予測は指定したモデル内のパターンに基づくが、新しいデータ ポイントの末尾からスムーズに継続するようになります。このシナリオの完全なチュートリアルについては、「集計予測モデルの追加 (中級者向けデータ マイニング チュートリアル)」を参照してください。
次の PREDICTION JOIN クエリでは、データを置き換えて新しい予測を作成する構文を示します。この例では、置き換え後のデータとして、Amount 列と Quantity 列の値を取得してそれぞれの値に 2 を乗算します。
SELECT [Forecasting].[Model Region],
PredictTimeSeries([Forecasting].[Quantity], 3, REPLACE_MODEL_CASES)
FROM
[Forecasting]
PREDICTION JOIN
OPENQUERY([Adventure Works DW2008R2],
'SELECT [ModelRegion],
([Quantity] * 2) as Quantity,
([Amount] * 2) as Amount,
[ReportingDate]
FROM [dbo].vTimeSeries
WHERE ModelRegion = N''M200 Pacific''
') AS t
ON
[Forecasting].[Model Region] = t.[ Model Region] AND
[Forecasting].[Reporting Date] = t.[ReportingDate] AND
[Forecasting].[Quantity] = t.[Quantity] AND
[Forecasting].[Amount] = t.[Amount]
次の表では、予測の結果を比較しています。
元の予測 |
更新された予測 |
---|---|
M200 Pacific7/25/2008 12:00:00 AM46
M200 Pacific8/25/2008 12:00:00 AM44
M200 Pacific9/25/2008 12:00:00 AM42
|
M200 Pacific7/25/2008 12:00:00 AM91
M200 Pacific8/25/2008 12:00:00 AM89
M200 Pacific9/25/2008 12:00:00 AM84
|
例 3: 新しいデータを追加して EXTEND_MODEL_CASES を使用する
例 3 では、EXTEND_MODEL_CASES オプションを使用して新しいデータを指定し、既存のデータ系列の末尾に追加する方法を示します。既存のデータ ポイントを置き換えるのではなく、新しいデータをモデルに追加します。
次の例では、NATURAL PREDICTION JOIN の後の SELECT ステートメントで新しいデータを指定します。この構文では複数行の新しい入力を指定できますが、それぞれの新しい入力行のタイムスタンプが一意である必要があります。
SELECT [Model Region],
PredictTimeSeries([Forecasting].[Quantity], 5, EXTEND_MODEL_CASES)
FROM
[Forecasting]
NATURAL PREDICTION JOIN
(SELECT
1 as [Reporting Date],
10 as [Quantity],
'M200 Europe' AS [Model Region]
UNION SELECT
2 as [Reporting Date],
15 as [Quantity],
'M200 Europe' AS [Model Region]
) AS T
WHERE ([Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific')
クエリで EXTEND_MODEL_CASES オプションが使用されているので、Analysis Services では、予測のために次の処理が行われます。
2 か月分の新しいデータをモデルに追加して、トレーニング ケースの合計サイズを大きくします。
前のケース データの末尾から予測を開始します。したがって、最初の 2 つの予測は、モデルに追加した実際の新しい売上データを表します。
新しく拡張されたモデルに基づく残りの 3 つのタイム スライスの新しい予測を返します。
次の表は、例 2 のクエリの結果を示しています。最初に返された M200 Europe の 2 つの値は、指定した新しい値とまったく同じです。この動作は仕様であり、新しいデータの末尾から予測を開始するには、開始時刻と終了時刻のステップを指定する必要があります。この操作を行う方法の例については、「レッスン 5 : 時系列モデルの拡張」を参照してください。
また、太平洋地域については、新しいデータを指定していません。したがって、Analysis Services は、5 つすべてのタイム スライスの新しい予測を返します。
Quantity |
EXTEND_MODEL_CASES |
---|---|
M200 Europe |
$TIMEQuantity
7/25/2008 0:0010
8/25/2008 0:0015
9/25/2008 0:0072
10/25/2008 0:0069
11/25/2008 0:0068
|
M200 Pacific |
$TIMEQuantity
7/25/2008 0:0046
8/25/2008 0:0044
9/25/2008 0:0042
10/25/2008 0:0042
11/25/2008 0:0038
|
例 4: 時系列予測の統計を返す
PredictTimeSeries 関数は、パラメーターとして INCLUDE_STATISTICS をサポートしていません。ただし、次のクエリを使用して、時系列のクエリに対する予測の統計を返すことができます。この方法は、テーブル列を入れ子にしているモデルにも使用できます。
この特定のモデルでは、予測可能な属性が Quantity であるため、[Quantity] を PredictTimeSeries 関数の最初の引数として使用する必要があります。モデルで別の予測可能な属性を使用する場合は、別の列名に置き換えることができます。
SELECT FLATTENED [Model Region],
(SELECT
$Time,
[Quantity] as [PREDICTION],
PredictVariance([Quantity]) AS [VARIANCE],
PredictStdev([Quantity]) AS [STDEV]
FROM
PredictTimeSeries([Quantity], 3) AS t
) AS t
FROM Forecasting
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 North America'
サンプルの結果 :
Model Region |
t.$TIME |
t.PREDICTION |
t.VARIANCE |
t.STDEV |
---|---|---|---|---|
M200 Europe |
7/25/2008 12:00:00 AM |
121 |
11.6050581415597 |
3.40661975300439 |
M200 Europe |
8/25/2008 12:00:00 AM |
142 |
10.678201866621 |
3.26775180615374 |
M200 Europe |
9/25/2008 12:00:00 AM |
152 |
9.86897842568614 |
3.14149302493037 |
M200 North America |
7/25/2008 12:00:00 AM |
163 |
1.20434529288162 |
1.20434529288162 |
M200 North America |
8/25/2008 12:00:00 AM |
178 |
1.65031343900634 |
1.65031343900634 |
M200 North America |
9/25/2008 12:00:00 AM |
156 |
1.68969399185442 |
1.68969399185442 |
注 |
---|
この例では、FLATTENED キーワードを使用して、結果を表形式でわかりやすくしました。ただし、プロバイダーで階層的な行セットがサポートされている場合は、FLATTENED キーワードを省略できます。FLATTENED キーワードを省略した場合、クエリでは 2 つの列が返されます。1 つ目の列には、[Model Region] データ系列を識別する値、2 つ目の列には、統計の入れ子になったテーブルが含まれます。 |