Çok Değişkenli Anomali Algılayıcısı API'sini kullanmaya yönelik en iyi yöntemler

Makale
01/18/2024

Önemli

20 Eylül 2023 tarihinden itibaren yeni Anomali Algılayıcısı kaynakları oluşturamayacaksınız. Anomali Algılayıcısı hizmeti 1 Ekim 2026'da kullanımdan kaldırılıyor.

Bu makalede, çok değişkenli Anomali Algılayıcısı (MVAD) API'leri kullanılırken izlenecek önerilen yöntemlerle ilgili yönergeler sağlanmaktadır. Bu öğreticide şunları yapacaksınız:

API kullanımı: MVAD'yi hatasız kullanmayı öğrenin.
Veri mühendisliği: MVAD'nin daha iyi doğrulukla performans göstermesini sağlamak için verilerinizi en iyi şekilde pişirmeyi öğrenin.
Yaygın tuzaklar: Müşterilerin karşılaştığı yaygın tuzaklardan nasıl kaçınacağınızı öğrenin.
SSS: Sık sorulan soruların yanıtlarını öğrenin.

API kullanımı

MVAD kullanırken oluşan hataları önlemek için bu bölümdeki yönergeleri izleyin. Hala hata alıyorsanız, açıklamalar ve yapılması gereken eylemler için hata kodlarının tam listesine bakın.

Giriş parametreleri

Gerekli parametreler

Eğitim ve çıkarım API'si isteklerinde şu üç parametre gereklidir:

source- Paylaşılan Erişim İmzaları (SAS) ile Azure Blob Depolama bulunan zip dosyanızın bağlantısı.
startTime - Eğitim veya çıkarım için kullanılan verilerin başlangıç zamanı. Verilerdeki gerçek en erken zaman damgasından daha erkense, başlangıç noktası olarak gerçek en erken zaman damgası kullanılır.
endTime - Eğitim veya çıkarım için kullanılan ve değerinden sonra veya eşit startTimeolması gereken verilerin bitiş zamanı. Verilerdeki gerçek en son zaman damgasından daha geçse endTime , bitiş noktası olarak gerçek en son zaman damgası kullanılır. değerine eşitse endTimestartTime, genellikle akış senaryolarında kullanılan tek bir veri noktasının çıkarımı anlamına gelir.

Eğitim API'si için isteğe bağlı parametreler

Eğitim API'si için diğer parametreler isteğe bağlıdır:

slidingWindow - Anomalileri belirlemek için kullanılan veri noktası sayısı. 28 ile 2.880 arasında bir tamsayı. Varsayılan değer 300'dür. Model eğitimi içinse slidingWindowk , geçerli sonuçlar elde etmek için çıkarım sırasında kaynak dosyadan en az k noktalara erişilebilir olmalıdır.

MVAD, bir sonraki veri noktasının anomali olup olmadığını belirlemek için veri noktalarının bir kesimini alır. Segmentin uzunluğu şeklindedir slidingWindow. Lütfen bir slidingWindow değer seçerken iki şeyi aklınızda bulundurun:
1. Verilerinizin özellikleri: düzenli olup olmadığı ve örnekleme oranı. Verileriniz düzenli olarak ayarlandığında, 1 - 3 döngünün uzunluğunu olarak slidingWindowayarlayabilirsiniz. Verileriniz dakika düzeyi veya ikinci düzey gibi yüksek frekansta (küçük ayrıntı düzeyi) olduğunda, görece daha yüksek bir değeri slidingWindowayarlayabilirsiniz.
2. Eğitim/çıkarım süresi ile olası performans etkisi arasındaki denge. Daha büyük slidingWindow bir değer daha uzun eğitim/çıkarım süresine neden olabilir. Daha büyük slidingWindowsn'lerin doğruluk kazanımlarına yol açacağının garantisi yoktur. Küçük slidingWindow bir model, modelin en uygun çözümle yakınsamasını zorlaştırabilir. Örneğin, yalnızca iki nokta olduğunda slidingWindow anomalileri algılamak zordur.
alignMode - Zaman damgalarında birden çok değişkeni (zaman serisi) hizalama. Bu parametre Inner için iki seçenek vardır ve Outervarsayılan değer olur Outer.

Değişkenlerin zaman damgası dizileri arasında yanlış hizalama olduğunda bu parametre kritik önem taşır. Modelin daha fazla işlem yapmadan önce değişkenleri aynı zaman damgası dizisine hizalaması gerekir.

Innermodelin algılama sonuçlarını yalnızca her değişkenin değeri olan zaman damgalarında (tüm değişkenlerin kesişimi gibi) bildireceği anlamına gelir. Outer, modelin herhangi bir değişkenin değeri olan zaman damgalarında algılama sonuçlarını bildireceği anlamına gelir; yani tüm değişkenlerin birleşimi.

Farklı değerleri açıklamaya alignModel yönelik bir örnek aşağıda verilmiştir.

Değişken-1

timestamp value

2020-11-01 Kategori 1

2020-11-02 2

2020-11-04 4

2020-11-05 5

Değişken-2

timestamp value

2020-11-01 Kategori 1

2020-11-02 2

2020-11-03 3

2020-11-04 4

Inner iki değişkeni birleştirme

timestamp Değişken-1 Değişken-2

2020-11-01 Kategori 1 Kategori 1

2020-11-02 2 2

2020-11-04 4 4

Outer iki değişkeni birleştirme

timestamp Değişken-1 Değişken-2

2020-11-01 Kategori 1 Kategori 1

2020-11-02 2 2

2020-11-03 nan 3

2020-11-04 4 4

2020-11-05 5 nan

timestamp	value
2020-11-01	Kategori 1
2020-11-02	2
2020-11-04	4
2020-11-05	5

timestamp	value
2020-11-01	Kategori 1
2020-11-02	2
2020-11-03	3
2020-11-04	4

timestamp	Değişken-1	Değişken-2
2020-11-01	Kategori 1	Kategori 1
2020-11-02	2	2
2020-11-04	4	4

timestamp	Değişken-1	Değişken-2
2020-11-01	Kategori 1	Kategori 1
2020-11-02	2	2
2020-11-03	`nan`	3
2020-11-04	4	4
2020-11-05	5	`nan`

fillNAMethod - Birleştirilmiş tabloyu doldurma nan . Birleştirilmiş tabloda eksik değerler olabilir ve bunların düzgün işlenmesi gerekir. Bunları doldurmak için çeşitli yöntemler sunuyoruz. Seçenekler , Linear, Previous, Subsequent, Zerove ve Fixed varsayılan değerdir Linear.

Seçenek	Yöntem
`Linear`	Değerleri doğrusal ilişkilendirmeye göre doldurma `nan`
`Previous`	Boşlukları doldurmak için son geçerli değeri yayma. Örnek: `[1, 2, nan, 3, nan, 4]` ->`[1, 2, 2, 3, 3, 4]`
`Subsequent`	Boşlukları doldurmak için sonraki geçerli değeri kullanın. Örnek: `[1, 2, nan, 3, nan, 4]` ->`[1, 2, 3, 3, 4, 4]`
`Zero`	Değerleri 0 ile doldurun `nan` .
`Fixed`	değerleri içinde `paddingValue`sağlanması gereken belirtilen geçerli bir değerle doldurun`nan`.

paddingValue - Doldurma değeri, bu durumda sağlandığında ve sağlanması gerektiğinde doldurmak nanfillNAMethodFixed için kullanılır. Diğer durumlarda isteğe bağlıdır.
displayName - Bu, modelleri tanımlamak için kullanılan isteğe bağlı bir parametredir. Örneğin, parametreleri, veri kaynaklarını ve modelle ilgili diğer meta verileri ve giriş verilerini işaretlemek için bunu kullanabilirsiniz. Varsayılan değer boş bir dizedir.

Giriş veri şeması

MVAD bir ölçüm grubundaki anomalileri algılar ve her ölçümü değişken veya zaman serisi olarak adlandırıyoruz.

Kabul edilen şemayı denetlemek için örnek veri dosyasını Microsoft'tan indirebilirsiniz: https://aka.ms/AnomalyDetector/MVADSampleData
Her değişkenin iki ve yalnızca iki alanı timestamp olmalı ve valuevirgülle ayrılmış değerler (CSV) dosyasında depolanmalıdır.
CSV dosyasının sütun adları tam olarak timestamp ve valuebüyük/küçük harfe duyarlı olmalıdır.
timestamp Değerler ISO 8601'e uygun olmalıdır; value tamsayılar veya herhangi bir sayıda ondalık basamak içeren ondalık değerler olabilir. CSV dosyasının içeriğine iyi bir örnek:

timestamp value

2019-04-01T00:00:00Z 5

2019-04-01T00:01:00Z 3.6

2019-04-01T00:02:00Z 4

... ...

Dekont

Zaman damgalarınızın saatleri, dakikaları ve/veya saniyeleri varsa, API'leri çağırmadan önce düzgün bir şekilde yuvarlandığından emin olun.

Örneğin, veri sıklığınızın her 30 saniyede bir bir veri noktası olması gerekiyorsa ancak "12:00:01" ve "12:00:28" gibi zaman damgaları görüyorsanız, zaman damgalarını "12:00:00" ve "12:00:30" gibi yeni değerlerle önceden işlemeniz gerektiğini belirten güçlü bir sinyaldir.

Ayrıntılar için lütfen en iyi yöntemler belgesindeki "Zaman damgası yukarı yuvarlama" bölümüne bakın.
Csv dosyasının adı değişken adı olarak kullanılır ve benzersiz olmalıdır. Örneğin, "temperature.csv" ve "humidity.csv".
Eğitim değişkenleri ve çıkarım değişkenleri tutarlı olmalıdır. Örneğin, eğitim için , series_2, series_3, , series_4ve series_5 kullanıyorsanızseries_1, çıkarım için tam olarak aynı değişkenleri sağlamanız gerekir.
CSV dosyaları bir zip dosyasına sıkıştırılmalı ve bir Azure blob kapsayıcısına yüklenmelidir. Zip dosyası istediğiniz ada sahip olabilir.

timestamp	value
2019-04-01T00:00:00Z	5
2019-04-01T00:01:00Z	3.6
2019-04-01T00:02:00Z	4
...	...

Klasör yapısı

Veri hazırlamada sık karşılaşılan bir hata, zip dosyasındaki ek klasörlerdir. Örneğin, zip dosyasının adının olduğunu series.zipvarsayalım. Ardından dosyaları yeni bir klasöre ./seriessıkıştırdıktan sonra CSV dosyalarının doğru yolu olur ./series/series_1.csv ve yanlış bir yol olabilir./series/foo/bar/series_1.csv.

Windows'da zip dosyasının sıkıştırmasını kaldırdıktan sonra dizin ağacının doğru örneği

.
└── series
    ├── series_1.csv
    ├── series_2.csv
    ├── series_3.csv
    ├── series_4.csv
    └── series_5.csv

Windows'da zip dosyasının sıkıştırmasını kaldırdıktan sonra dizin ağacının yanlış bir örneği

.
└── series
    └── series
        ├── series_1.csv
        ├── series_2.csv
        ├── series_3.csv
        ├── series_4.csv
        └── series_5.csv

Veri mühendisliği

Artık kodunuzu herhangi bir hata olmadan MVAD API'leriyle çalıştırabilirsiniz. Modelinizin doğruluğunu artırmak için neler yapılabilir?

Veri kalitesi

Model, geçmiş verilerden normal desenleri öğrenirken, eğitim verileri sistemin genel normal durumunu temsil etmelidir. Eğitim verileri anomaliler ile doluysa modelin bu tür desenleri öğrenmesi zordur. Anormal oranın ampirik eşiği iyi doğruluk için %1 ve altındadır.
Genel olarak, eğitim verilerinin eksik değer oranı %20'nin altında olmalıdır. Çok fazla eksik veri, normal desenler olarak otomatik olarak doldurulan değerler (genellikle doğrusal değerler veya sabit değerler) ile sonuçlanabilir. Bu, anomali olarak algılanan gerçek (eksik olmayan) veri noktalarıyla sonuçlanabilir.

Veri miktarı

MVAD'nin temel alınan modelinin milyonlarca parametresi vardır. En uygun parametre kümesini öğrenmek için en az sayıda veri noktası gerekir. Ampirik kural, modeli doğru doğruluk için eğitmek için değişken başına 5.000 veya daha fazla veri noktası (zaman damgası) sağlamanız gerektiğidir. Genel olarak, eğitim verileri ne kadar çok olursa doğruluk da o kadar iyi olur. Ancak bu kadar çok veri tahakkuk ettiremediğiniz durumlarda, yine de daha az veriyle denemeler yapıp güvenliği aşılmış doğruluğun hala kabul edilebilir olup olmadığını görmenizi öneririz.
Çıkarım API'sini her çağırdığınızda, kaynak veri dosyasının yeterli veri noktası içerdiğinden emin olmanız gerekir. Bu normalde slidingWindow + çıkarım sonuçlarına ihtiyaç duyan veri noktası sayısıdır. Örneğin, one yeni zaman damgasından her çıkarım yapmak istediğinizde, veri dosyası yalnızca baştaki slidingWindow artı ONE veri noktasını içerebilir; daha sonra aynı sayıda veri noktasına (slidingWindow + 1) sahip başka bir zip dosyası oluşturabilir, ancak ONE adımını "sağ" tarafa taşıyarak başka bir çıkarım işi için gönderebilirsiniz.

Bunun ötesindeki veya "önce" olan her şey, öndeki kayan pencere çıkarım sonucunu hiç etkilemez ve yalnızca performans düşüşüne neden olabilir. Aşağıda hataya NotEnoughInput neden olabilecek her şey.

Zaman damgası yukarı yuvarlama

Bir değişken grubunda (zaman serisi), her değişken bağımsız bir kaynaktan toplanabilir. Farklı değişkenlerin zaman damgaları birbiriyle ve bilinen frekanslarla tutarsız olabilir. İşte basit bir örnek.

Değişken-1

timestamp	value
12:00:01	1.0
12:00:35	1.5
12:01:02	0,9
12:01:31	2.2
12:02:08	1.3

Değişken-2

timestamp	value
12:00:03	2.2
12:00:37	2,6
12:01:09	1.4
12:01:34	1.7
12:02:04	2,0

her 30 saniyede bir veri noktası gönderen iki algılayıcıdan toplanan iki değişkenimiz var. Ancak algılayıcılar veri noktalarını katı bir eşit sıklıkta değil, bazen daha erken ve bazen daha sonra göndermektedir. MVAD farklı değişkenler arasındaki bağıntıları dikkate aldığından, ölçümlerin sistemin durumunu doğru yansıtabilmesi için zaman damgalarının düzgün hizalanması gerekir. Yukarıdaki örnekte, 1 ve değişken 2 değişkenlerinin zaman damgaları hizalamadan önce sıklıklarına düzgün bir şekilde 'yuvarlanmalıdır'.

Önceden işlenmedikleri takdirde neler olacağını görelim. Olarak Outer ayarlanırsak alignMode (iki kümenin birleşimi anlamına gelir), birleştirilen tablo şu şekildedir:

timestamp	Değişken-1	Değişken-2
12:00:01	1.0	`nan`
12:00:03	`nan`	2.2
12:00:35	1.5	`nan`
12:00:37	`nan`	2,6
12:01:02	0,9	`nan`
12:01:09	`nan`	1.4
12:01:31	2.2	`nan`
12:01:34	`nan`	1.7
12:02:04	`nan`	2,0
12:02:08	1.3	`nan`

nan eksik değerleri gösterir. Açıkçası, birleştirilmiş tablo beklediğiniz gibi değildir. Değişken 1 ve değişken 2 birlikte çalışma ve MVAD modeli aralarındaki bağıntılar hakkında bilgi ayıklayamaz. olarak ayarlanırsa alignModeInner, değişken 1 ve değişken 2'de ortak bir zaman damgası olmadığından, birleştirilmiş tablo boş olur.

Bu nedenle, 1 ve değişken 2 değişkenlerinin zaman damgaları önceden işlenmelidir (en yakın 30 saniyelik zaman damgalarına yuvarlanmalıdır) ve yeni zaman serisi şunlardır:

Değişken-1

timestamp	value
12:00:00	1.0
12:00:30	1.5
12:01:00	0,9
12:01:30	2.2
12:02:00	1.3

Değişken-2

timestamp	value
12:00:00	2.2
12:00:30	2,6
12:01:00	1.4
12:01:30	1.7
12:02:00	2,0

Artık birleştirilmiş tablo daha mantıklıdır.

timestamp	Değişken-1	Değişken-2
12:00:00	1.0	2.2
12:00:30	1.5	2,6
12:01:00	0,9	1.4
12:01:30	2.2	1.7
12:02:00	1.3	2,0

Yakın zaman damgalarında farklı değişkenlerin değerleri iyi hizalanmıştır ve MVAD modeli artık bağıntı bilgilerini ayıklayabilir.

Sınırlamalar

Hem eğitim hem de çıkarım API'lerinde bazı sınırlamalar vardır. Hatalardan kaçınmak için bu sınırlamaların farkında olmalısınız.

Genel Sınırlamalar

Kayan pencere: 28-2880 zaman damgası, varsayılan değer 300'dür. Düzenli veriler için 2-4 döngünün uzunluğunu kayan pencere olarak ayarlayın.
Değişken numaraları: Eğitim ve toplu çıkarım için en fazla 301 değişken.

Eğitim Sınırlamaları

Zaman damgaları: En fazla 10000000. Çok az zaman damgası model kalitesini düşürebilir. 5.000'den fazla zaman damgasına sahip olmasını öneririz.
Ayrıntı düzeyi: En düşük ayrıntı düzeyidir per_second.

Toplu çıkarım sınırlamaları

Zaman damgaları: En fazla 20000, en az 1 kayan pencere uzunluğu.

Akış çıkarım sınırlamaları

Zaman damgaları: En fazla 2880, en az 1 kayan pencere uzunluğu.
Zaman damgalarını algılama: 1 ile 10.

Model kalitesi

Gerçek senaryolarda hatalı pozitif ve hatalı negatifle nasıl başa çıkılır?

Anomalilerin önemini gösteren önem derecesini sağladık. Hatalı pozitif değerler önem derecesinde bir eşik ayarlanarak filtrelenebilir. Bazen çıkarım verilerinde desen kaydırmaları olduğunda çok fazla hatalı pozitif sonuç görünebilir. Böyle durumlarda modelin yeni veriler üzerinde yeniden eğitilmesi gerekebilir. Eğitim verileri çok fazla anomali içeriyorsa, algılama sonuçlarında hatalı negatifler olabilir. Bunun nedeni, modelin eğitim verilerinden desenleri öğrenmesi ve anomalilerin modele sapma getirebileceğidir. Bu nedenle düzgün veri temizleme, hatalı negatiflerin azaltılmasına yardımcı olabilir.

Eğitim kaybına ve doğrulama kaybına göre hangi modelin en iyi şekilde kullanılacağını tahmin etme

Genel olarak, etiketli veri kümesi olmadan hangi modelin en iyi olduğuna karar vermek zordur. Ancak, kabaca tahminde bulunmak ve bu kötü modelleri atmak için eğitim ve doğrulama kayıplarını kullanabiliriz. İlk olarak, eğitim kayıplarının yakınsanıp yakınsamadığını gözlemlemeliyiz. Ayrılan kayıplar genellikle modelin kalitesinin düşük olduğunu gösterir. İkincisi, kayıp değerleri yetersiz uygunluk veya fazla uygunluk olup olmadığını belirlemeye yardımcı olabilir. Yetersiz uygunluk veya fazla uygunluk gösteren modeller istenen performansa sahip olmayabilir. Üçüncüsü, kayıp işlevinin tanımı algılama performansını doğrudan yansıtmasa da, kayıp değerleri model kalitesini tahmin etmek için yardımcı bir araç olabilir. Düşük kayıp değeri, iyi bir model için gerekli bir koşuldur, bu nedenle yüksek kayıp değerlerine sahip modelleri atabiliriz.

Yaygın tuzaklar

Hata kodu tablosunun dışında, MVAD API'lerini kullanırken sizin gibi müşterilerden bazı yaygın tuzaklar öğrendik. Bu tablo, bu sorunlardan kaçınmanıza yardımcı olur.

Tuzak	Sonucu	Açıklama ve çözüm
Eğitim verileri ve/veya çıkarım verilerindeki zaman damgaları, her değişkenin ilgili veri sıklığıyla uyumlu olacak şekilde yukarı yuvarlanmamıştı.	Çıkarım sonuçlarının zaman damgaları beklendiği gibi değildir: çok az zaman damgası veya çok fazla zaman damgası.	Lütfen Timestamp yukarı yuvarlama bölümüne bakın.
Eğitim verilerinde çok fazla anormal veri noktası var	Eğitim sırasında anormal veri noktalarını normal desenler olarak değerlendirdiğinden model doğruluğu olumsuz etkilenir.	Ampirik olarak anormal oranı %1 veya altında tutmak yararlı olacaktır.
Çok az eğitim verisi	Model doğruluğu tehlikeye girdi.	Ampirik olarak, bir MVAD modelini eğitmek için iyi bir doğruluk elde etmek için değişken başına 15.000 veya daha fazla veri noktası (zaman damgası) gerekir.
Tüm veri noktalarını `isAnomaly`=`true` anomali olarak alma	Çok fazla hatalı pozitif sonuç	Hem hem de `isAnomalyseverity` (veya `score`) kullanarak ciddi olmayan anomalileri çıkarmanız ve (isteğe bağlı olarak) rastgele gürültüleri engellemek için anomalilerin süresini denetlemek için gruplandırma kullanmanız gerekir. ile arasındaki `severity` fark için lütfen aşağıdaki SSS bölümüne bakın.`score`
Alt klasörler, eğitim veya çıkarım için veri dosyasına sıkıştırılır.	Alt klasörlerdeki csv veri dosyaları eğitim ve/veya çıkarım sırasında yoksayılır.	Zip dosyasında hiçbir alt klasöre izin verilmez. Ayrıntılar için lütfen Klasör yapısı'na bakın.
Çıkarım veri dosyasında çok fazla veri var: örneğin, çıkarım veri zip dosyasındaki tüm geçmiş verileri sıkıştırma	Herhangi bir hata göremeyebilirsiniz, ancak zip dosyasını Azure Blob'a yüklemeyi denediğinizde ve çıkarım çalıştırmayı denediğinizde performansın düşmesiyle karşılaşırsınız.	Ayrıntılar için lütfen Veri miktarı bölümüne bakın.
Azure bölgelerinde henüz MVAD'yi desteklemeyen Anomali Algılayıcısı kaynakları oluşturma ve MVAD API'lerini çağırma	MVAD API'lerini çağırırken "kaynak bulunamadı" hatasıyla karşılaşırsınız.	Önizleme aşamasında MVAD yalnızca sınırlı bölgelerde kullanılabilir. MVAD bölge dağıtımlarını takip etmek için lütfen Anomali Algılayıcısı'deki yeniliklere yer işareti ekleyin. Ayrıca bir GitHub sorunu bildirebilir veya belirli bölgeler için istekte bulunmak için adresinden bizimle AnomalyDetector@microsoft.com iletişime geçebilirsiniz.

SSS

MVAD kayan pencere nasıl çalışır?

MVAD'nin kayan penceresinin nasıl çalıştığını öğrenmek için iki örnek kullanalım. = 1.440 ayarladığınızı slidingWindow ve giriş verilerinizin bir dakikalık ayrıntı düzeyinde olduğunu varsayalım.

Akış senaryosu: "2021-01-02T00:00:00Z" konumundaki ONE veri noktasının anormal olup olmadığını tahmin etmek istiyorsunuz. ve endTime değeriniz startTime aynı olacaktır ("2021-01-02T00:00:00Z"). Ancak çıkarım veri kaynağınız en az 1.440 + 1 zaman damgası içermelidir. MVAD, hedef veri noktasından önce gelen verileri ("2021-01-02T00:00:00Z") alarak hedefin anomali olup olmadığına karar verir. Bu durumda, gerekli önde gelen verilerin uzunluğu veya 1.440'tır slidingWindow . 1.440 = 60 * 24 olduğundan giriş verilerinizin en geç "2021-01-01T00:00:00Z" ile başlaması gerekir.
Toplu iş senaryosu: Tahmin etmeniz gereken birden çok hedef veri noktanız vardır. sizin değeriniz endTime sizin değerinden startTimedaha büyük olacaktır. Bu tür senaryolarda çıkarım "hareketli pencere" şeklinde gerçekleştirilir. Örneğin, MVAD 'deki 2021-01-02T00:00:00Z verilerin anormal olup olmadığını belirlemek için 'den 2021-01-01T00:00:00Z2021-01-01T23:59:00Z (dahil) öğesine kadar olan verileri kullanır. Ardından ileriye taşınır ve verinin anormal olup olmadığını belirlemek için 'den 2021-01-01T00:01:00Z2021-01-02T00:00:00Z (dahil) öğesine veri 2021-01-02T00:01:00Z kullanır. Tarafından belirtilen endTime son zaman damgasına (veya gerçek en son zaman damgasına) kadar aynı şekilde devam eder (karşılaştırmak için 1.440 veri noktası alarak). Bu nedenle, çıkarım veri kaynağınız ile startTime - slidingWindow başlayan verileri içermelidir ve ideal olarak toplam boyut slidingWindow + (endTime - startTime içerir).

ile arasındaki `severityscore`fark nedir?

Normalde, işletmeniz için çok önemli olmayan 'anomalileri' yok etmek için filtre olarak kullanmanızı severity öneririz. Senaryonuza ve veri deseninize bağlı olarak, daha az önemli olan anomaliler genellikle görece daha düşük severity değerlere veya rastgele ani artışlar gibi tek başına (kesintili) yüksek severity değerlere sahiptir.

Eşiklere severity veya sürekli yüksek severity değerlerin süresine göre daha karmaşık kurallara ihtiyaç duyduğunuz durumlarda, daha güçlü filtreler oluşturmak için kullanmak score isteyebilirsiniz. Anomalileri belirlemek için MVAD'nin nasıl kullandığını score anlamak yardımcı olabilir:

Veri noktasının hem genel hem de yerel perspektiften anormal olup olmadığını değerlendiriyoruz. Zaman damgası belirli bir eşikten yüksekse score , zaman damgası bir anomali olarak işaretlenir. Eşikten düşükse score ancak bir segmentte görece daha yüksekse, anomali olarak da işaretlenir.

Çok Değişkenli Anomali Algılayıcısı API'sini kullanmaya yönelik en iyi yöntemler

API kullanımı

Giriş parametreleri

Gerekli parametreler

Eğitim API'si için isteğe bağlı parametreler

Giriş veri şeması

Klasör yapısı

Veri mühendisliği

Veri kalitesi

Veri miktarı

Zaman damgası yukarı yuvarlama

Sınırlamalar

Genel Sınırlamalar

Eğitim Sınırlamaları

Toplu çıkarım sınırlamaları

Akış çıkarım sınırlamaları

Model kalitesi

Gerçek senaryolarda hatalı pozitif ve hatalı negatifle nasıl başa çıkılır?

Eğitim kaybına ve doğrulama kaybına göre hangi modelin en iyi şekilde kullanılacağını tahmin etme

Yaygın tuzaklar

SSS

MVAD kayan pencere nasıl çalışır?

ile arasındaki `severityscore`fark nedir?

Sonraki adımlar

Ek kaynaklar

Çok Değişkenli Anomali Algılayıcısı API'sini kullanmaya yönelik en iyi yöntemler

API kullanımı

Giriş parametreleri

Gerekli parametreler

Eğitim API'si için isteğe bağlı parametreler

Giriş veri şeması

Klasör yapısı

Veri mühendisliği

Veri kalitesi

Veri miktarı

Zaman damgası yukarı yuvarlama

Sınırlamalar

Genel Sınırlamalar

Eğitim Sınırlamaları

Toplu çıkarım sınırlamaları

Akış çıkarım sınırlamaları

Model kalitesi

Gerçek senaryolarda hatalı pozitif ve hatalı negatifle nasıl başa çıkılır?

Eğitim kaybına ve doğrulama kaybına göre hangi modelin en iyi şekilde kullanılacağını tahmin etme

Yaygın tuzaklar

SSS

MVAD kayan pencere nasıl çalışır?

ile arasındaki severityscorefark nedir?

Sonraki adımlar

Ek kaynaklar

ile arasındaki `severityscore`fark nedir?