Microsoft zaman Series algoritması Teknik Başvurusu
The Microsoft Time Series algorithm includes two separate algorithms:
Kullanılmaya başlandı artxp algoritması SQL Server 2005, sonraki büyük olasılıkla değer tahmin etmek için getirilmiştirserisi.
ARIMA algoritması içinde eklenmiş olan SQL Server 2008 uzun süreli, kesinliği artırmak için tahmin.
Varsayılan olarak, Analysis Services modeli eğitmek için ayrı ayrı her algoritması kullanır ve sonra da verim iyi bir değişken sayıda tahmin sonuçlar'ı karıştırırÖngörüler. Veri ve tahmin gereksinimleri temel alarak algoritmaları, yalnızca birini kullanmayı seçebilirsiniz.İçinde başlayan SQL Server 2008 Enterprise, karışım algoritmaları tahmin sırasında denetler sonlandırma noktası da özelleştirebilirsiniz
Bu konuda her algoritması nasıl uygulanır ve çözümleme ve tahmin sonuçlar ince ayar parametrelerini ayarlayarak algoritma nasıl özelleştirebileceğiniz hakkında ek bilgi sağlar.
Zaman serisi algoritmalar uygulaması
MicrosoftAraştırma üzerinde uygulama alma sql Server 2005 ' te kullanılan özgün artxp algoritması geliştirilen Microsoft karar ağaçlar algoritması.Bu nedenle, artxp algoritması dönemsel saat serisi verileri temsil eden bir autoregressive ağacı modeli olarak tanımlanabilir.Bu algoritma önceki öğeler değişken sayıda öngörülen her geçerli öğe ilişkilendirir.artxp türeyen dan adı olgu birden fazla bilinmeyen önceki durum uygulanan autoregressive ağaç yöntem (resim algoritma).artxp algoritması ayrıntılı bir açıklama için bkz: Zaman serisi analizi için Autoregressive ağaç modelleri.
ARIMA algoritması uzun süreli geliştirmek için sql Server 2008'de Microsoft saat Series algoritması eklenmiştir tahmin.Kutusu ve Jenkins tarafından açıklanan tümleşik autoregressive hareketli ortalamalar hesaplama işlemi bir uygulamasıdır.ARIMA metodoloji saat içinde sıralı olarak alınan gözlemlerin bağımlılıklarını belirlemek mümkün kılar ve rasgele darbe modelinin bir parçası olarak dahil edebilirsiniz.ARIMA yöntem de çarpma seasonality destekler.ARIMA algoritması hakkında daha fazla bilgi edinmek isteyen okuyucular, seminal çalışma kutusu ve Jenkins tarafından önerilir; Bu bölüm nasıl ARIMA metodolojisi de yazacak olan hakkında ayrıntılı amacını taşımaktadır Microsoft Zaman Serisi algoritması.
Varsayılan olarak, Microsoft saat Series algoritması artxp ve ARIMA, her iki yöntem kullanır ve sonuçlar iyileştirmek için Karışımlar tahmin doğruluk.Belirli bir yöntem kullanmak isterseniz, şunları yapabilirsiniz küme algoritmalar sonuçlarını nasıl birleştirilir denetlemek için veya yalnızca artxp veya yalnızca ARIMA kullanılacak algoritma parametreleri.Not çapraz tahmin artxp algoritması destekler, ancak ARIMA algoritmasını desteklemiyor.Bu nedenle, çapraz tahmin algoritmalarının bir karışım kullandığınızda veya modeli yalnızca artxp kullanmak üzere yapılandırırken kullanılabilir.
ARIMA fark sipariş anlama
Bu bölümde, ARIMA modelini anlamanız için gerekli bazı terimleri tanıtır ve belirli uygulanması anlatılmaktadır fark kayıt de Microsoft Zaman Serisi algoritması.Bu şartları ve kavramlarını tam açıklaması için bir gözden geçirme kutusu ve Jenkins öneririz.
A terimi bir matematiksel denklem bir bileşenidir.Örneğin, polinom bir Denklem içinde bir terimi, değişkenler ve sabitler birleşimi içerebilir.
ARIMA formül bulunan Microsoft Zaman Serisi algoritması her ikisini de kullanan autoregressive ve hareketli ortalama şartları.
Zaman serisi modelleri olabilir hareketsiz veya nonstationary.Hareketsiz modelleri oysa döngüleri, olabilir rağmen dönmek için ortalaması, dosyaları nonstationary modelleri, eşitlik bir odağa sahip ve büyük farkı veya tarafından sunulan değişiklik tabidir darbe, ya da dış değişkenleri.
Amacı, fark kayıt bir saat serisi kararlı hale gelmesine ve hareketsiz hale olmasını sağlamaktır.
The order of difference represents the number of times that the difference between values is taken for a time series.
Microsoft Zaman Serisi algoritması Tarafından bir veri serisindeki değerler alma ve desen için verileri sığdırmak girişiminde çalışır.Dizi veri hareketsiz değilseniz, bir fark sipariş algoritması uygular.saat serisi daha hareketsiz hale getirmek için fark sırasına göre her bir artış eğilimi gösterir.
saat serisi varsa, örneğin, (z1, z2, …, zn) ve bir fark sırasını kullanarak hesaplamalar, yeni bir seri elde (y1, y2, …., yn-1), nerede yi = zi + 1- zi.Fark sipariş 2 olduğunda, başka bir dizi algoritma oluşturur (x 1, x 2,..., xn-2), ilk sipariş denklemi elde edilmişse y serisini bağlı.Fark kayıt doğru miktarda veriye bağlıdır.Tek bir fark kayıt sırası sabit bir eğilim gösteren modelleri yaygın olarak kullanılır; İkinci bir fark kayıt sırası ile saat değişen bir eğilim gösterebilir.
Fark sırasını kullanılan varsayılan olarak, Microsoft Zaman Serisi algoritması -1 ' dir yani algoritması fark sipariş için en iyi değeri otomatik olarak algılar.Genellikle, bu en iyi değeri (fark kayıt gerekli olduğunda) 1, ancak belirli koşullar altında bu değeri en fazla 2 algoritması artacaktır.
Microsoft Zaman Serisi algoritması En iyi ARIMA fark autoregression değerleri kullanarak belirler.Algoritma ar değerleri inceler ve ar şartları sırasını gösteren bir gizli parametresi, ARIMA_AR_ORDER, ayarlar.Bu gizli parametresinin ARIMA_AR_ORDER, bir aralık 8 -1 değer.Varsayılan değeri-1, algoritma uygun fark sipariş otomatik olarak seçer.
ARIMA_AR_ORDER değerini 1'den büyük olduğunda, algoritma polinom bir terim saat serisi çarpar.Polinom formülü tek şartı 1 veya 1 yakın bir kök giderirse, algoritma terimi çıkarıp 1 tarafından fark artan modelinin kararlılığını korumak çalışır.Fark sipariş en ise, terimi kaldırılır ve fark sırasını değiştirebilirsiniz.
Örneğin, ar değeri = 2, sonuçta elde edilen ar polinom terim benzeyebilir: 1 – 1.4B + .45b ^ 2 (1 .9b) = (1 - 0.5B).Terim Not (1.9b) yaklaşık 0,9 kökü vardır.Algoritma bu terim polinom formülünden ortadan kaldırır ancak zaten 2'in en büyük değerde olduğundan fark sipariş bir artıramazsınız.
Yapabilirsiniz tek yolu dikkat önemlidir zorla bir değişiklik fark sırada desteklenmeyen bir parametre, ARIMA_DIFFERENCE_ORDER kullanmaktır.Bu gizli bir parametreye algoritması üzerinde saat serisi fark kayıt yapar ve olabilir kaç kez kontrol küme özel algoritması parametre yazarak.Ancak, denemek hazırlıklı değilseniz, bu değeri değiştirin ve hesaplamaları ile ilgili bilgi sahibi olduğunuz önermeyiz.Ayrıca orada şu anda fark sipariş artış hızının tetiklenir eşik denetlemenize izin vermesini gizli parametreler de dahil olmak üzere herhangi bir mekanizma unutmayın.
Son olarak, formülün yukarıda Not Basitleştirilmiş olan durum, yok seasonality ipuçları ile.Seasonality ipuçlarını verdiyse, her seasonality ipucu denklemi solunda bir ar polinom terim daha sonra eklenir ve aynı strateji differenced serisi kararsız koşulları ortadan kaldırmak için uygulanır.
Microsoft zaman Series algoritma özelleştirme
The Microsoft Time Series algorithm supports several parameters that affect the behavior, performance, and accuracy of the resulting mining model.
Seasonality algılanması
Both algorithms support detection of seasonality or periodicity.Analysis Services uses Fast Fourier transformation to detect seasonality before training.
En iyi sonuçlar elde etmek için seasonality algılama algoritma parametreleri ayarlayarak denetleyebilirsiniz.Değerini değiştirerek AUTODETECT_SEASONALITY, oluşturulan saat parça sayısını etkileyebilir.Bir değer veya için birden çok değer ayarlayarak PERIODICITY_HINT, algoritması ile bilinen yinelenen dönemleri hakkında bilgi sağlamak ve arttırmak doğruluğunu algılama.
Not
ARTxp ve ARIMA algoritmaları için seasonality ipuçlarını duyarlıdır.Bu nedenle, yanlış ipucunu sağlayan sonuçlar olumsuz etkileyebilir.
Algoritmalar karıştırma
Varsayılan olarak, Analysis Services birleştirir ve eşit Ağırlık verir algoritmaları.Ancak, içinde başlayan SQL Server 2008 Enterprise, KARIŞIK seçeneğini seçerek karıştırma sonuçlarını özelleştirebilirsiniz ve Ağırlık verir sonuçlar doğrultusunda kısa veya uzun süreli bir parametre ayarı tahmin.
Çapraz tahmin kullanmak isterseniz, ARIMA çapraz tahmin desteklemediğinden artxp veya KARMA seçeneği kullanmanız gerekir.
Algoritma seçimini kontrol etmek için küme FORECAST_METHOD parametresi.Varsayılan olarak, FORECAST_METHOD parametresi küme için KARIŞIK ve Analysis Services her iki algoritmaları kullanır ve sonra Ağırlık verir, değerlerine en üst düzeye güçleri her algoritması.Ancak, küme FORECAST_METHOD artxp yalnızca ARTxp algoritması kullanmak istiyorsanız veya ARIMA varsa, kullanmak istediğiniz yalnızca ARIMA algoritması.
İçinde başlayan SQL Server 2008 Enterprise, ayrıca özelleştirme nasıl Analysis Services karma algoritmalar ARIMA ve artxp birleşimi. Değişim hızı ve karışımı için başlangıç noktası ayarlayarak denetleyebilirsiniz PREDICTION_SMOOTHING parametresi:
Varsa, küme PREDICTION_SMOOTHING 0, model olur saf ARTxp.
Varsa, küme PREDICTION_SMOOTHING 1, model olur saf ARIMA.
Varsa, set PREDICTION_SMOOTHING modeli için 0 ve 1 arasında bir değer ARTxp algoritması tahmin adımları üssel olarak azalan bir işlev olarak Ağırlık verirAynı saat, ağırlık modeli de ARIMA algoritması 1-tamamlayıcı ARTxp Ağırlık verir.Yumuşak eğrilere normalleştirme ve sabitlemeyi sabit modeli kullanır.
En çok 5 saat dilimleri öngörmek, genel olarak, ARTxp neredeyse her zaman daha iyi seçimdir.Tahmin etmek saat dilimleri sayısı arttıkça, ancak, ARIMA genellikle daha iyi yapar.
Aşağıdaki diyagramda nasıl model algoritmaları Karışımlar gösterilmektedir, PREDICTION_SMOOTHING olan küme için varsayılan değer 0,5.ARIMA ve ARTxp eşit en önce ancak tahmin adımları artar sayısı ağırlıklı, ARIMA daha yoğun bir şekilde weighed.
Buna karşılık, algoritmalar karıştırma Aşağıdaki diyagramda gösterilmiştir, PREDICTION_SMOOTHING olan küme 0.2 için.Adım 0, ağırlık modeli verir ARIMA 0.2 ve artxp 0,8.Bundan sonra ARIMA ağırlığını de katlanarak artar ve de katlanarak ARTxp ağırlığını azaltır.
Algoritma parametreleri ayarlama
Aşağıdaki tablo ile kullanılan parametrelerini açıklar Microsoft zaman Series algoritması.
Parameter |
Açıklama |
---|---|
AUTO_DETECT_PERIODICITY |
Arasında sayısal bir değer belirtir 0 ve periodicity algılar 1. 0,6 Varsayılandır. Yakın bir değer ise 0, periodicity yalnızca için kesinlikle dönemsel veri algılandı Daha yakın bu değeri 1 olarak ayarlanması, neredeyse Periyodik birçok desenleri bulma ve periodicity ipuçlarını otomatik oluşturma ayrıcalıklı kılar.
Not
Büyük olasılıkla birçok periodicity ipuçları postalarla önemli ölçüde uzun modeli eğitim süreleri ancak daha doğru modelleri için yol açacaktır.
|
COMPLEXITY_PENALTY |
Büyüme oranını kontrol karar ağacı.Varsayılan değer 0,1'dir. Bu değeri azaltmak bir bölünme olasılığı artar.Bu değeri artırmak bölünmüş olasılığını azaltır.
Not
Bu parametre yalnızca kullanılabilir SQL Server kuruluş.
|
FORECAST_METHOD |
Analiz ve tahmin için kullanılacak hangi algoritmasını belirtir.Olası değerler şunlardır: artxp, ARIMA ya da KARIŞIK.Varsayılan KARIŞTIRILIR. |
HISTORIC_MODEL_COUNT |
Oluşturulacaktır geçmişteki modelleri sayısını belirtir.Varsayılan değer 1'dir.
Not
Bu parametre yalnızca kullanılabilir SQL Server kuruluş.
|
HISTORICAL_MODEL_GAP |
İki ardışık geçmişteki modelleri arasında saat öteleme belirtir.Varsayılan değer 10'dir.Değer birimi modeli tarafından tanımlandığı saat birimlerinin sayısını temsil eder. Bu değerin ayarlanması, g saat dilimleri aralıklarla kesilmiş veriler için oluşturulacak geçmişteki modelleri neden olan g, 2 * g, 3 * gve benzeri.
Not
Bu parametre yalnızca kullanılabilir SQL Server kuruluş.
|
INSTABILITY_SENSITIVITY |
Hangi belirli bir eşiği ve ARTxp algoritması farkı aşıyor tahmin Öngörüler bastırır noktasını denetler.Varsayılan değer 1’dır.
Not
Bu parametre yalnızca ARIMA kullanan modelleri için geçerli değildir.
The default value of 1 provides the same behavior as in SQL Server 2005.Analysis Services monitors the normalized standard deviation for each prediction.Standartlaştırma sapmalar için herhangi bir öngörü aşıyor hemen eşik, saat series algoritması null döndürür ve tahmin işlemi durdurulur. Değeri, 0 durur kararsızlık algılama.Bu farkı ne olursa olsun Öngörüler sonsuz sayıda oluşturabileceğiniz anlamına gelir.
Not
Bu parametre, yalnızca değiştirilebilir SQL Server kuruluş.De SQL Server Standart, Analysis Services 1 yalnızca varsayılan değeri kullanır.
|
MAXIMUM_SERIES_VALUE |
Öngörüler için kullanılacak en yüksek değeri belirtir.Bu parametre ile birlikte, kullanılan MINIMUM_SERIES_VALUE, oranları Öngörüler için beklenen bazı aralık.Örneğin, herhangi bir gün için öngörülen satış miktarı stoktaki ürün sayısına hiçbir zaman sınırı belirtebilirsiniz.
Not
Bu parametre yalnızca kullanılabilir SQL Server kuruluş.
|
MINIMUM_SERIES_VALUE |
Öngörülen en düşük değeri belirtir.Bu parametre ile birlikte, kullanılan MAXIMUM_SERIES_VALUE, oranları Öngörüler için beklenen bazı aralık.Örneğin, öngörülen satış miktarı eksi bir sayı hiçbir zaman olması gerektiğini belirtebilirsiniz.
Not
Bu parametre yalnızca kullanılabilir SQL Server kuruluş.
|
MINIMUM_SUPPORT |
Her saat serisi ağaç içinde bir bölünme oluşturmak için gereken saat dilimleri en az sayısını belirtir.Varsayılan değer 10'dir. |
MISSING_VALUE_SUBSTITUTION |
Nasıl geçmiş verilerini boşluklar doldurulur belirler.Varsayılan olarak, veri boşluklar bulunamaz. Aşağıdaki tablo Bu parametre için olası değerler listelenmiştir:
DeğerAçıklama
PreviousÖnceki saat dilim değeri yineler.
OrtalamaHareketli ortalama Eğitimi'nde kullanılan saat dilimleri, kullanır.
Sayısal sabitBelirtilen tüm eksik değerleri değiştirmek için kullanır.
HiçbiriEksik değerleri eğitimli modelinin eğri çizilen değerlerle değiştirir.Bu varsayılan değerdir.
Dizinin birden çok serisi veri içeriyorsa, ragged kenarları sahip olamaz.Diğer bir deyişle, tüm serisi, aynı başlangıç ve bitiş noktaları olması gerekir. Analysis ServicesAyrıca gerçekleştirdiğinizde, yeni veri boşlukları doldurmak için bu parametrenin değeri kullanır bir PREDICTION JOIN saat serisi modeli. |
PERIODICITY_HINT |
Periodicity veri olarak algoritması için bir ipucu sağlar.Örneğin, satış yılına göre değişir ve serideki ölçü birimi ay varsa, periodicity 12'dir.Bu parametre biçimi alır {n [, n]}, nerede n pozitif bir sayıdır. The n in the brackets [] is optional and can be repeated as frequently as needed.Örneğin, birden çok periodicity ipuçları için sağlanan veri sağlamak için aylık olarak girdiğiniz {12, 3, 1} yıl, üç aylık ve ay desenleri algılamak için.Ancak, periodicity model kalitesi üzerinde güçlü bir etkiye sahiptir.Size ipucu gerçek periodicity farklıysa, sonuçlar bundan olumsuz etkilendi. {1} Varsayılandır.
Not
Ayraçlar gereklidir.Ayrıca, bu parametre bir dize veri türü vardır.Bu parametre veri Mining Extensions (dmx) deyim bir parçası olarak yazarsanız, bu nedenle, sayısı ve kaşlı ayraçlar tırnak içine alın gerekir.
|
PREDICTION_SMOOTHING |
Nasıl modeli tahmin en iyi duruma getirmek için mixed olmalıdır belirtir.Arasında herhangi bir değer yazabilirsiniz 0 ve 1 veya aşağıdaki değerlerden birini kullanın:
Not
Use FORECAST_METHOD parametresi için kontrol eğitim.
DeğerAçıklama
0Tahmin yalnızca ARTxp kullandığını belirtir.Tahmin daha az Öngörüler için optimize edilmiştir.
1Belirleyen tahmin ARIMA, yalnızca kullanır.Tahmin birçok Öngörüler için optimize edilmiştir.
0.5(Varsayılan) Bunun için her iki algoritmaları kullanılması gerektiğini tahmin ve sonuçlar karıştırılan belirtir.
Not
Bu parametre yalnızca kullanılabilir SQL Server kuruluş.
|
Bayrakları modelleme
The Microsoft Time Series algorithm supports the following modeling flags.Araştırma yapısı veya araştırma modeli oluşturduğunuzda belirtmek için modelleme bayrakları tanımlamak nasıl değerleri her sütun çözümleme sırasında işlenir.Daha fazla bilgi için bkz: Modelleme bayrakları (veri madenciliği).
Bayrak modelleme |
Açıklama |
---|---|
BOŞ DEĞİL |
Sütun null değeri içeremez gösterir.Analysis Services null değer modeli eğitim sırasında karşılaşırsa bir hata neden olur. Araştırma yapısı sütunlar için geçerlidir. |
MODEL_EXISTENCE_ONLY |
Sütun iki olası durumlar sahip olarak kabul edilir gelir: Eksik ve mevcut.Null değeri eksik bir değerdir. Araştırma modeli sütunlar için geçerlidir. |
Gereksinimler
Bir saat serisi modeli içeren benzersiz değerler, giriş sütun ve en az bir anahtar saat sütun içermelidir tahmin edilebilir sütun.
Giriş ve öngörülebilir sütunları
The Microsoft Time Series algorithm supports the specific input column content types, predictable column content types, and modeling flags that are listed in the following table.
Column |
İçerik türleri |
---|---|
Giriş öznitelik |
Sürekli, anahtar, anahtar saati ve tablo |
Öngörülebilir öznitelik |
Sürekli, tablo |
Not
Cyclical ve Sipariş edilmiş içerik türleri desteklenir, ancak bunları olarak ayrık değerler değerlendirir ve özel işlem gerçekleştirmek.
Ayrıca bkz.
Başvuru
Kavramlar
Değişiklik Geçmişi
Güncelleştirilmiş içerik |
---|
|