Çok Değişkenli Anomali Algılayıcısı API'sini kullanmaya yönelik en iyi yöntemler
Önemli
20 Eylül 2023 tarihinden itibaren yeni Anomali Algılayıcısı kaynakları oluşturamayacaksınız. Anomali Algılayıcısı hizmeti 1 Ekim 2026'da kullanımdan kaldırılıyor.
Bu makalede, çok değişkenli Anomali Algılayıcısı (MVAD) API'leri kullanılırken izlenecek önerilen yöntemlerle ilgili yönergeler sağlanmaktadır. Bu öğreticide şunları yapacaksınız:
- API kullanımı: MVAD'yi hatasız kullanmayı öğrenin.
- Veri mühendisliği: MVAD'nin daha iyi doğrulukla performans göstermesini sağlamak için verilerinizi en iyi şekilde pişirmeyi öğrenin.
- Yaygın tuzaklar: Müşterilerin karşılaştığı yaygın tuzaklardan nasıl kaçınacağınızı öğrenin.
- SSS: Sık sorulan soruların yanıtlarını öğrenin.
API kullanımı
MVAD kullanırken oluşan hataları önlemek için bu bölümdeki yönergeleri izleyin. Hala hata alıyorsanız, açıklamalar ve yapılması gereken eylemler için hata kodlarının tam listesine bakın.
Giriş parametreleri
Gerekli parametreler
Eğitim ve çıkarım API'si isteklerinde şu üç parametre gereklidir:
source
- Paylaşılan Erişim İmzaları (SAS) ile Azure Blob Depolama bulunan zip dosyanızın bağlantısı.startTime
- Eğitim veya çıkarım için kullanılan verilerin başlangıç zamanı. Verilerdeki gerçek en erken zaman damgasından daha erkense, başlangıç noktası olarak gerçek en erken zaman damgası kullanılır.endTime
- Eğitim veya çıkarım için kullanılan ve değerinden sonra veya eşitstartTime
olması gereken verilerin bitiş zamanı. Verilerdeki gerçek en son zaman damgasından daha geçseendTime
, bitiş noktası olarak gerçek en son zaman damgası kullanılır. değerine eşitseendTime
startTime
, genellikle akış senaryolarında kullanılan tek bir veri noktasının çıkarımı anlamına gelir.
Eğitim API'si için isteğe bağlı parametreler
Eğitim API'si için diğer parametreler isteğe bağlıdır:
slidingWindow
- Anomalileri belirlemek için kullanılan veri noktası sayısı. 28 ile 2.880 arasında bir tamsayı. Varsayılan değer 300'dür. Model eğitimi içinseslidingWindow
k
, geçerli sonuçlar elde etmek için çıkarım sırasında kaynak dosyadan en azk
noktalara erişilebilir olmalıdır.MVAD, bir sonraki veri noktasının anomali olup olmadığını belirlemek için veri noktalarının bir kesimini alır. Segmentin uzunluğu şeklindedir
slidingWindow
. Lütfen birslidingWindow
değer seçerken iki şeyi aklınızda bulundurun:- Verilerinizin özellikleri: düzenli olup olmadığı ve örnekleme oranı. Verileriniz düzenli olarak ayarlandığında, 1 - 3 döngünün uzunluğunu olarak
slidingWindow
ayarlayabilirsiniz. Verileriniz dakika düzeyi veya ikinci düzey gibi yüksek frekansta (küçük ayrıntı düzeyi) olduğunda, görece daha yüksek bir değerislidingWindow
ayarlayabilirsiniz. - Eğitim/çıkarım süresi ile olası performans etkisi arasındaki denge. Daha büyük
slidingWindow
bir değer daha uzun eğitim/çıkarım süresine neden olabilir. Daha büyükslidingWindow
sn'lerin doğruluk kazanımlarına yol açacağının garantisi yoktur. KüçükslidingWindow
bir model, modelin en uygun çözümle yakınsamasını zorlaştırabilir. Örneğin, yalnızca iki nokta olduğundaslidingWindow
anomalileri algılamak zordur.
- Verilerinizin özellikleri: düzenli olup olmadığı ve örnekleme oranı. Verileriniz düzenli olarak ayarlandığında, 1 - 3 döngünün uzunluğunu olarak
alignMode
- Zaman damgalarında birden çok değişkeni (zaman serisi) hizalama. Bu parametreInner
için iki seçenek vardır veOuter
varsayılan değer olurOuter
.Değişkenlerin zaman damgası dizileri arasında yanlış hizalama olduğunda bu parametre kritik önem taşır. Modelin daha fazla işlem yapmadan önce değişkenleri aynı zaman damgası dizisine hizalaması gerekir.
Inner
modelin algılama sonuçlarını yalnızca her değişkenin değeri olan zaman damgalarında (tüm değişkenlerin kesişimi gibi) bildireceği anlamına gelir.Outer
, modelin herhangi bir değişkenin değeri olan zaman damgalarında algılama sonuçlarını bildireceği anlamına gelir; yani tüm değişkenlerin birleşimi.Farklı değerleri açıklamaya
alignModel
yönelik bir örnek aşağıda verilmiştir.Değişken-1
timestamp value 2020-11-01 Kategori 1 2020-11-02 2 2020-11-04 4 2020-11-05 5 Değişken-2
timestamp value 2020-11-01 Kategori 1 2020-11-02 2 2020-11-03 3 2020-11-04 4 Inner
iki değişkeni birleştirmetimestamp Değişken-1 Değişken-2 2020-11-01 Kategori 1 Kategori 1 2020-11-02 2 2 2020-11-04 4 4 Outer
iki değişkeni birleştirmetimestamp Değişken-1 Değişken-2 2020-11-01 Kategori 1 Kategori 1 2020-11-02 2 2 2020-11-03 nan
3 2020-11-04 4 4 2020-11-05 5 nan
fillNAMethod
- Birleştirilmiş tabloyu doldurmanan
. Birleştirilmiş tabloda eksik değerler olabilir ve bunların düzgün işlenmesi gerekir. Bunları doldurmak için çeşitli yöntemler sunuyoruz. Seçenekler ,Linear
,Previous
,Subsequent
,Zero
ve veFixed
varsayılan değerdirLinear
.Seçenek Yöntem Linear
Değerleri doğrusal ilişkilendirmeye göre doldurma nan
Previous
Boşlukları doldurmak için son geçerli değeri yayma. Örnek: [1, 2, nan, 3, nan, 4]
->[1, 2, 2, 3, 3, 4]
Subsequent
Boşlukları doldurmak için sonraki geçerli değeri kullanın. Örnek: [1, 2, nan, 3, nan, 4]
->[1, 2, 3, 3, 4, 4]
Zero
Değerleri 0 ile doldurun nan
.Fixed
değerleri içinde paddingValue
sağlanması gereken belirtilen geçerli bir değerle doldurunnan
.paddingValue
- Doldurma değeri, bu durumda sağlandığında ve sağlanması gerektiğinde doldurmaknan
fillNAMethod
Fixed
için kullanılır. Diğer durumlarda isteğe bağlıdır.displayName
- Bu, modelleri tanımlamak için kullanılan isteğe bağlı bir parametredir. Örneğin, parametreleri, veri kaynaklarını ve modelle ilgili diğer meta verileri ve giriş verilerini işaretlemek için bunu kullanabilirsiniz. Varsayılan değer boş bir dizedir.
Giriş veri şeması
MVAD bir ölçüm grubundaki anomalileri algılar ve her ölçümü değişken veya zaman serisi olarak adlandırıyoruz.
Kabul edilen şemayı denetlemek için örnek veri dosyasını Microsoft'tan indirebilirsiniz: https://aka.ms/AnomalyDetector/MVADSampleData
Her değişkenin iki ve yalnızca iki alanı
timestamp
olmalı vevalue
virgülle ayrılmış değerler (CSV) dosyasında depolanmalıdır.CSV dosyasının sütun adları tam olarak
timestamp
vevalue
büyük/küçük harfe duyarlı olmalıdır.timestamp
Değerler ISO 8601'e uygun olmalıdır;value
tamsayılar veya herhangi bir sayıda ondalık basamak içeren ondalık değerler olabilir. CSV dosyasının içeriğine iyi bir örnek:timestamp value 2019-04-01T00:00:00Z 5 2019-04-01T00:01:00Z 3.6 2019-04-01T00:02:00Z 4 ... ... Dekont
Zaman damgalarınızın saatleri, dakikaları ve/veya saniyeleri varsa, API'leri çağırmadan önce düzgün bir şekilde yuvarlandığından emin olun.
Örneğin, veri sıklığınızın her 30 saniyede bir bir veri noktası olması gerekiyorsa ancak "12:00:01" ve "12:00:28" gibi zaman damgaları görüyorsanız, zaman damgalarını "12:00:00" ve "12:00:30" gibi yeni değerlerle önceden işlemeniz gerektiğini belirten güçlü bir sinyaldir.
Ayrıntılar için lütfen en iyi yöntemler belgesindeki "Zaman damgası yukarı yuvarlama" bölümüne bakın.
Csv dosyasının adı değişken adı olarak kullanılır ve benzersiz olmalıdır. Örneğin, "temperature.csv" ve "humidity.csv".
Eğitim değişkenleri ve çıkarım değişkenleri tutarlı olmalıdır. Örneğin, eğitim için ,
series_2
,series_3
, ,series_4
veseries_5
kullanıyorsanızseries_1
, çıkarım için tam olarak aynı değişkenleri sağlamanız gerekir.CSV dosyaları bir zip dosyasına sıkıştırılmalı ve bir Azure blob kapsayıcısına yüklenmelidir. Zip dosyası istediğiniz ada sahip olabilir.
Klasör yapısı
Veri hazırlamada sık karşılaşılan bir hata, zip dosyasındaki ek klasörlerdir. Örneğin, zip dosyasının adının olduğunu series.zip
varsayalım. Ardından dosyaları yeni bir klasöre ./series
sıkıştırdıktan sonra CSV dosyalarının doğru yolu olur ./series/series_1.csv
ve yanlış bir yol olabilir./series/foo/bar/series_1.csv
.
Windows'da zip dosyasının sıkıştırmasını kaldırdıktan sonra dizin ağacının doğru örneği
.
└── series
├── series_1.csv
├── series_2.csv
├── series_3.csv
├── series_4.csv
└── series_5.csv
Windows'da zip dosyasının sıkıştırmasını kaldırdıktan sonra dizin ağacının yanlış bir örneği
.
└── series
└── series
├── series_1.csv
├── series_2.csv
├── series_3.csv
├── series_4.csv
└── series_5.csv
Veri mühendisliği
Artık kodunuzu herhangi bir hata olmadan MVAD API'leriyle çalıştırabilirsiniz. Modelinizin doğruluğunu artırmak için neler yapılabilir?
Veri kalitesi
- Model, geçmiş verilerden normal desenleri öğrenirken, eğitim verileri sistemin genel normal durumunu temsil etmelidir. Eğitim verileri anomaliler ile doluysa modelin bu tür desenleri öğrenmesi zordur. Anormal oranın ampirik eşiği iyi doğruluk için %1 ve altındadır.
- Genel olarak, eğitim verilerinin eksik değer oranı %20'nin altında olmalıdır. Çok fazla eksik veri, normal desenler olarak otomatik olarak doldurulan değerler (genellikle doğrusal değerler veya sabit değerler) ile sonuçlanabilir. Bu, anomali olarak algılanan gerçek (eksik olmayan) veri noktalarıyla sonuçlanabilir.
Veri miktarı
MVAD'nin temel alınan modelinin milyonlarca parametresi vardır. En uygun parametre kümesini öğrenmek için en az sayıda veri noktası gerekir. Ampirik kural, modeli doğru doğruluk için eğitmek için değişken başına 5.000 veya daha fazla veri noktası (zaman damgası) sağlamanız gerektiğidir. Genel olarak, eğitim verileri ne kadar çok olursa doğruluk da o kadar iyi olur. Ancak bu kadar çok veri tahakkuk ettiremediğiniz durumlarda, yine de daha az veriyle denemeler yapıp güvenliği aşılmış doğruluğun hala kabul edilebilir olup olmadığını görmenizi öneririz.
Çıkarım API'sini her çağırdığınızda, kaynak veri dosyasının yeterli veri noktası içerdiğinden emin olmanız gerekir. Bu normalde
slidingWindow
+ çıkarım sonuçlarına ihtiyaç duyan veri noktası sayısıdır. Örneğin, one yeni zaman damgasından her çıkarım yapmak istediğinizde, veri dosyası yalnızca baştakislidingWindow
artı ONE veri noktasını içerebilir; daha sonra aynı sayıda veri noktasına (slidingWindow
+ 1) sahip başka bir zip dosyası oluşturabilir, ancak ONE adımını "sağ" tarafa taşıyarak başka bir çıkarım işi için gönderebilirsiniz.Bunun ötesindeki veya "önce" olan her şey, öndeki kayan pencere çıkarım sonucunu hiç etkilemez ve yalnızca performans düşüşüne neden olabilir. Aşağıda hataya
NotEnoughInput
neden olabilecek her şey.
Zaman damgası yukarı yuvarlama
Bir değişken grubunda (zaman serisi), her değişken bağımsız bir kaynaktan toplanabilir. Farklı değişkenlerin zaman damgaları birbiriyle ve bilinen frekanslarla tutarsız olabilir. İşte basit bir örnek.
Değişken-1
timestamp | value |
---|---|
12:00:01 | 1.0 |
12:00:35 | 1.5 |
12:01:02 | 0,9 |
12:01:31 | 2.2 |
12:02:08 | 1.3 |
Değişken-2
timestamp | value |
---|---|
12:00:03 | 2.2 |
12:00:37 | 2,6 |
12:01:09 | 1.4 |
12:01:34 | 1.7 |
12:02:04 | 2,0 |
her 30 saniyede bir veri noktası gönderen iki algılayıcıdan toplanan iki değişkenimiz var. Ancak algılayıcılar veri noktalarını katı bir eşit sıklıkta değil, bazen daha erken ve bazen daha sonra göndermektedir. MVAD farklı değişkenler arasındaki bağıntıları dikkate aldığından, ölçümlerin sistemin durumunu doğru yansıtabilmesi için zaman damgalarının düzgün hizalanması gerekir. Yukarıdaki örnekte, 1 ve değişken 2 değişkenlerinin zaman damgaları hizalamadan önce sıklıklarına düzgün bir şekilde 'yuvarlanmalıdır'.
Önceden işlenmedikleri takdirde neler olacağını görelim. Olarak Outer
ayarlanırsak alignMode
(iki kümenin birleşimi anlamına gelir), birleştirilen tablo şu şekildedir:
timestamp | Değişken-1 | Değişken-2 |
---|---|---|
12:00:01 | 1.0 | nan |
12:00:03 | nan |
2.2 |
12:00:35 | 1.5 | nan |
12:00:37 | nan |
2,6 |
12:01:02 | 0,9 | nan |
12:01:09 | nan |
1.4 |
12:01:31 | 2.2 | nan |
12:01:34 | nan |
1.7 |
12:02:04 | nan |
2,0 |
12:02:08 | 1.3 | nan |
nan
eksik değerleri gösterir. Açıkçası, birleştirilmiş tablo beklediğiniz gibi değildir. Değişken 1 ve değişken 2 birlikte çalışma ve MVAD modeli aralarındaki bağıntılar hakkında bilgi ayıklayamaz. olarak ayarlanırsa alignMode
Inner
, değişken 1 ve değişken 2'de ortak bir zaman damgası olmadığından, birleştirilmiş tablo boş olur.
Bu nedenle, 1 ve değişken 2 değişkenlerinin zaman damgaları önceden işlenmelidir (en yakın 30 saniyelik zaman damgalarına yuvarlanmalıdır) ve yeni zaman serisi şunlardır:
Değişken-1
timestamp | value |
---|---|
12:00:00 | 1.0 |
12:00:30 | 1.5 |
12:01:00 | 0,9 |
12:01:30 | 2.2 |
12:02:00 | 1.3 |
Değişken-2
timestamp | value |
---|---|
12:00:00 | 2.2 |
12:00:30 | 2,6 |
12:01:00 | 1.4 |
12:01:30 | 1.7 |
12:02:00 | 2,0 |
Artık birleştirilmiş tablo daha mantıklıdır.
timestamp | Değişken-1 | Değişken-2 |
---|---|---|
12:00:00 | 1.0 | 2.2 |
12:00:30 | 1.5 | 2,6 |
12:01:00 | 0,9 | 1.4 |
12:01:30 | 2.2 | 1.7 |
12:02:00 | 1.3 | 2,0 |
Yakın zaman damgalarında farklı değişkenlerin değerleri iyi hizalanmıştır ve MVAD modeli artık bağıntı bilgilerini ayıklayabilir.
Sınırlamalar
Hem eğitim hem de çıkarım API'lerinde bazı sınırlamalar vardır. Hatalardan kaçınmak için bu sınırlamaların farkında olmalısınız.
Genel Sınırlamalar
- Kayan pencere: 28-2880 zaman damgası, varsayılan değer 300'dür. Düzenli veriler için 2-4 döngünün uzunluğunu kayan pencere olarak ayarlayın.
- Değişken numaraları: Eğitim ve toplu çıkarım için en fazla 301 değişken.
Eğitim Sınırlamaları
- Zaman damgaları: En fazla 10000000. Çok az zaman damgası model kalitesini düşürebilir. 5.000'den fazla zaman damgasına sahip olmasını öneririz.
- Ayrıntı düzeyi: En düşük ayrıntı düzeyidir
per_second
.
Toplu çıkarım sınırlamaları
- Zaman damgaları: En fazla 20000, en az 1 kayan pencere uzunluğu.
Akış çıkarım sınırlamaları
- Zaman damgaları: En fazla 2880, en az 1 kayan pencere uzunluğu.
- Zaman damgalarını algılama: 1 ile 10.
Model kalitesi
Gerçek senaryolarda hatalı pozitif ve hatalı negatifle nasıl başa çıkılır?
Anomalilerin önemini gösteren önem derecesini sağladık. Hatalı pozitif değerler önem derecesinde bir eşik ayarlanarak filtrelenebilir. Bazen çıkarım verilerinde desen kaydırmaları olduğunda çok fazla hatalı pozitif sonuç görünebilir. Böyle durumlarda modelin yeni veriler üzerinde yeniden eğitilmesi gerekebilir. Eğitim verileri çok fazla anomali içeriyorsa, algılama sonuçlarında hatalı negatifler olabilir. Bunun nedeni, modelin eğitim verilerinden desenleri öğrenmesi ve anomalilerin modele sapma getirebileceğidir. Bu nedenle düzgün veri temizleme, hatalı negatiflerin azaltılmasına yardımcı olabilir.
Eğitim kaybına ve doğrulama kaybına göre hangi modelin en iyi şekilde kullanılacağını tahmin etme
Genel olarak, etiketli veri kümesi olmadan hangi modelin en iyi olduğuna karar vermek zordur. Ancak, kabaca tahminde bulunmak ve bu kötü modelleri atmak için eğitim ve doğrulama kayıplarını kullanabiliriz. İlk olarak, eğitim kayıplarının yakınsanıp yakınsamadığını gözlemlemeliyiz. Ayrılan kayıplar genellikle modelin kalitesinin düşük olduğunu gösterir. İkincisi, kayıp değerleri yetersiz uygunluk veya fazla uygunluk olup olmadığını belirlemeye yardımcı olabilir. Yetersiz uygunluk veya fazla uygunluk gösteren modeller istenen performansa sahip olmayabilir. Üçüncüsü, kayıp işlevinin tanımı algılama performansını doğrudan yansıtmasa da, kayıp değerleri model kalitesini tahmin etmek için yardımcı bir araç olabilir. Düşük kayıp değeri, iyi bir model için gerekli bir koşuldur, bu nedenle yüksek kayıp değerlerine sahip modelleri atabiliriz.
Yaygın tuzaklar
Hata kodu tablosunun dışında, MVAD API'lerini kullanırken sizin gibi müşterilerden bazı yaygın tuzaklar öğrendik. Bu tablo, bu sorunlardan kaçınmanıza yardımcı olur.
Tuzak | Sonucu | Açıklama ve çözüm |
---|---|---|
Eğitim verileri ve/veya çıkarım verilerindeki zaman damgaları, her değişkenin ilgili veri sıklığıyla uyumlu olacak şekilde yukarı yuvarlanmamıştı. | Çıkarım sonuçlarının zaman damgaları beklendiği gibi değildir: çok az zaman damgası veya çok fazla zaman damgası. | Lütfen Timestamp yukarı yuvarlama bölümüne bakın. |
Eğitim verilerinde çok fazla anormal veri noktası var | Eğitim sırasında anormal veri noktalarını normal desenler olarak değerlendirdiğinden model doğruluğu olumsuz etkilenir. | Ampirik olarak anormal oranı %1 veya altında tutmak yararlı olacaktır. |
Çok az eğitim verisi | Model doğruluğu tehlikeye girdi. | Ampirik olarak, bir MVAD modelini eğitmek için iyi bir doğruluk elde etmek için değişken başına 15.000 veya daha fazla veri noktası (zaman damgası) gerekir. |
Tüm veri noktalarını isAnomaly =true anomali olarak alma |
Çok fazla hatalı pozitif sonuç | Hem hem de isAnomaly severity (veya score ) kullanarak ciddi olmayan anomalileri çıkarmanız ve (isteğe bağlı olarak) rastgele gürültüleri engellemek için anomalilerin süresini denetlemek için gruplandırma kullanmanız gerekir. ile arasındaki severity fark için lütfen aşağıdaki SSS bölümüne bakın.score |
Alt klasörler, eğitim veya çıkarım için veri dosyasına sıkıştırılır. | Alt klasörlerdeki csv veri dosyaları eğitim ve/veya çıkarım sırasında yoksayılır. | Zip dosyasında hiçbir alt klasöre izin verilmez. Ayrıntılar için lütfen Klasör yapısı'na bakın. |
Çıkarım veri dosyasında çok fazla veri var: örneğin, çıkarım veri zip dosyasındaki tüm geçmiş verileri sıkıştırma | Herhangi bir hata göremeyebilirsiniz, ancak zip dosyasını Azure Blob'a yüklemeyi denediğinizde ve çıkarım çalıştırmayı denediğinizde performansın düşmesiyle karşılaşırsınız. | Ayrıntılar için lütfen Veri miktarı bölümüne bakın. |
Azure bölgelerinde henüz MVAD'yi desteklemeyen Anomali Algılayıcısı kaynakları oluşturma ve MVAD API'lerini çağırma | MVAD API'lerini çağırırken "kaynak bulunamadı" hatasıyla karşılaşırsınız. | Önizleme aşamasında MVAD yalnızca sınırlı bölgelerde kullanılabilir. MVAD bölge dağıtımlarını takip etmek için lütfen Anomali Algılayıcısı'deki yeniliklere yer işareti ekleyin. Ayrıca bir GitHub sorunu bildirebilir veya belirli bölgeler için istekte bulunmak için adresinden bizimle AnomalyDetector@microsoft.com iletişime geçebilirsiniz. |
SSS
MVAD kayan pencere nasıl çalışır?
MVAD'nin kayan penceresinin nasıl çalıştığını öğrenmek için iki örnek kullanalım. = 1.440 ayarladığınızı slidingWindow
ve giriş verilerinizin bir dakikalık ayrıntı düzeyinde olduğunu varsayalım.
Akış senaryosu: "2021-01-02T00:00:00Z" konumundaki ONE veri noktasının anormal olup olmadığını tahmin etmek istiyorsunuz. ve
endTime
değerinizstartTime
aynı olacaktır ("2021-01-02T00:00:00Z"). Ancak çıkarım veri kaynağınız en az 1.440 + 1 zaman damgası içermelidir. MVAD, hedef veri noktasından önce gelen verileri ("2021-01-02T00:00:00Z") alarak hedefin anomali olup olmadığına karar verir. Bu durumda, gerekli önde gelen verilerin uzunluğu veya 1.440'tırslidingWindow
. 1.440 = 60 * 24 olduğundan giriş verilerinizin en geç "2021-01-01T00:00:00Z" ile başlaması gerekir.Toplu iş senaryosu: Tahmin etmeniz gereken birden çok hedef veri noktanız vardır. sizin değeriniz
endTime
sizin değerindenstartTime
daha büyük olacaktır. Bu tür senaryolarda çıkarım "hareketli pencere" şeklinde gerçekleştirilir. Örneğin, MVAD 'deki2021-01-02T00:00:00Z
verilerin anormal olup olmadığını belirlemek için 'den2021-01-01T00:00:00Z
2021-01-01T23:59:00Z
(dahil) öğesine kadar olan verileri kullanır. Ardından ileriye taşınır ve verinin anormal olup olmadığını belirlemek için 'den2021-01-01T00:01:00Z
2021-01-02T00:00:00Z
(dahil) öğesine veri2021-01-02T00:01:00Z
kullanır. Tarafından belirtilenendTime
son zaman damgasına (veya gerçek en son zaman damgasına) kadar aynı şekilde devam eder (karşılaştırmak için 1.440 veri noktası alarak). Bu nedenle, çıkarım veri kaynağınız ilestartTime
-slidingWindow
başlayan verileri içermelidir ve ideal olarak toplam boyutslidingWindow
+ (endTime
-startTime
içerir).
ile arasındaki severity
score
fark nedir?
Normalde, işletmeniz için çok önemli olmayan 'anomalileri' yok etmek için filtre olarak kullanmanızı severity
öneririz. Senaryonuza ve veri deseninize bağlı olarak, daha az önemli olan anomaliler genellikle görece daha düşük severity
değerlere veya rastgele ani artışlar gibi tek başına (kesintili) yüksek severity
değerlere sahiptir.
Eşiklere severity
veya sürekli yüksek severity
değerlerin süresine göre daha karmaşık kurallara ihtiyaç duyduğunuz durumlarda, daha güçlü filtreler oluşturmak için kullanmak score
isteyebilirsiniz. Anomalileri belirlemek için MVAD'nin nasıl kullandığını score
anlamak yardımcı olabilir:
Veri noktasının hem genel hem de yerel perspektiften anormal olup olmadığını değerlendiriyoruz. Zaman damgası belirli bir eşikten yüksekse score
, zaman damgası bir anomali olarak işaretlenir. Eşikten düşükse score
ancak bir segmentte görece daha yüksekse, anomali olarak da işaretlenir.