Aracılığıyla paylaş


Önemli terimlerin makine öğrenmesi sözlüğü

Aşağıdaki liste, ML.NET'de özel modellerinizi oluştururken yararlı olan önemli makine öğrenmesi terimlerinin bir derlemesidir.

Doğru -luk

Sınıflandırmada doğruluk, doğru sınıflandırılmış öğelerin test kümesindeki toplam öğe sayısına bölünmesidir. 0 (en az doğru) ile 1 (en doğru) arasında değişir. Doğruluk, model performansının değerlendirme ölçümlerinden biridir. Bunu duyarlık, yakalama ve F puanı ile birlikte düşünün.

Eğrinin altındaki alan (AUC)

İkili sınıflandırmada, doğru pozitif oranı (y ekseninde) yanlış pozitifler oranına (x ekseninde) göre çizen eğrinin altındaki alanın değeri olan değerlendirme ölçümü. 0,5 (en kötü) ile 1 (en iyi) arasında değişir. ROC eğrisinin altındaki alan olarak da bilinen alıcı çalışma karakteristik eğrisi. Daha fazla bilgi için Wikipedia'da Alıcı işletim özelliği makalesine bakın.

İkili sınıflandırma

Etiketin iki sınıftan yalnızca biri olduğu bir sınıflandırma örneği. Daha fazla bilgi için Makine öğrenmesi görevleri konusunun İkili sınıflandırma bölümüne bakın.

Kalibrasyon

Kalibrasyon, ikili ve çok sınıflı sınıflandırma için ham puanı sınıf üyeliğine eşleme işlemidir. Bazı ML.NET eğitmenlerin soneki NonCalibrated vardır. Bu algoritmalar, daha sonra bir sınıf olasılığına eşlenmesi gereken bir ham puan üretir.

Katalog

ML.NET katalog, yaygın bir amaca göre gruplandırılmış bir uzantı işlevleri koleksiyonudur.

Örneğin, her makine öğrenmesi görevinin (ikili sınıflandırma, regresyon, derecelendirme vb.) kullanılabilir makine öğrenmesi algoritmaları (eğitmenler) kataloğu vardır. İkili sınıflandırma eğitmenleri için katalog: BinaryClassificationCatalog.BinaryClassificationTrainers.

Sınıflandırma

Veriler bir kategoriyi tahmin etmek için kullanıldığında , denetimli makine öğrenmesi görevi sınıflandırma olarak adlandırılır. İkili sınıflandırma yalnızca iki kategoriyi tahmin etme anlamına gelir (örneğin, bir görüntüyü 'kedi' veya 'köpek' resmi olarak sınıflandırma). Çok sınıflı sınıflandırma birden çok kategoriyi tahmin etme anlamına gelir (örneğin, bir görüntüyü belirli bir köpek türünün resmi olarak sınıflandırırken).

Katsayı belirleme

Regresyonda, verilerin bir modele ne kadar uygun olduğunu gösteren bir değerlendirme ölçümüdür. 0 ile 1 arasında değişir. 0 değeri, verilerin rastgele olduğu veya başka bir şekilde modele sığamayacağı anlamına gelir. 1 değeri, modelin veriyle tam olarak eşleşir anlamına gelir. Buna genellikle r2, R2 veya r karesi denir.

Veriler

Veriler, tüm makine öğrenmesi uygulamalarının merkezidir. ML.NET verileri nesnelerle IDataView temsil edilir. Veri görünümü nesneleri:

  • sütun ve satırlardan oluşur
  • , yalnızca bir işlem tarafından çağrıldığında veri yüklendikleri için göz göre değerlendirilir
  • her sütunun türünü, biçimini ve uzunluğunu tanımlayan bir şema içerir

Tahmincisi

arabirimini uygulayan ML.NET sınıfı IEstimator<TTransformer> .

Tahmin aracı bir dönüşümün belirtimidir (hem veri hazırlama dönüşümü hem de makine öğrenmesi modeli eğitim dönüşümü). Tahmin araçları bir dönüşüm işlem hattına zincirlenebilir. Tahmin aracının veya tahmin aracı işlem hattının parametreleri çağrıldığında Fit öğrenilir. Sonucu Fit bir Transformatördür.

Uzantı yöntemi

Bir sınıfın parçası olan ancak sınıfın dışında tanımlanan bir .NET yöntemi. Uzantı yönteminin ilk parametresi, uzantı yönteminin ait olduğu sınıfa yönelik statik this bir başvurudur.

Uzantı yöntemleri, tahmin aracı örneklerini oluşturmak için ML.NET'de yaygın olarak kullanılır.

Özellik

Ölçülen fenomenin ölçülebilir özelliği, genellikle sayısal (çift) bir değerdir. Birden çok özellik Özellik vektör olarak adlandırılır ve genellikle olarak double[]depolanır. Özellikler ölçülen fenomenin önemli özelliklerini tanımlar. Daha fazla bilgi için Vikipedi'deki Özellik makalesine bakın.

Özellik mühendisliği

Özellik mühendisliği, bir dizi özelliği tanımlamayı ve mevcut fenomen verilerinden özellik vektörleri üreten yazılım geliştirmeyi ,yani özellik ayıklamayı içeren bir süreçtir. Daha fazla bilgi için Vikipedi'deki Özellik mühendisliği makalesine bakın.

F puanı

Sınıflandırmada, duyarlığı ve yakalamayı dengeleyen bir değerlendirme ölçümüdür.

Hiper Parametre

Makine öğrenmesi algoritmasının parametresi. Örnek olarak karar ormanında öğrenebileceğiniz ağaç sayısı veya gradyan azalma algoritmasındaki adım boyutu verilebilir. Hiper parametre değerleri modeli eğitmeden önce ayarlanır ve tahmin işlevinin parametrelerini bulma sürecini yönetir; örneğin, bir karar ağacındaki karşılaştırma noktaları veya doğrusal regresyon modelindeki ağırlıklar. Daha fazla bilgi için Wikipedia'da Hyperparameter makalesine bakın.

Etiketle

Makine öğrenmesi modeliyle tahmin edilecek öğe. Örneğin, köpeğin cinsi veya gelecekteki bir hisse senedi fiyatı.

Günlük kaybı

Sınıflandırmada, bir sınıflandırıcının doğruluğunu niteleyen bir değerlendirme ölçümüdür. Günlük kaybı ne kadar küçük olursa sınıflandırıcı da o kadar doğru olur.

Loss işlevi

Kayıp işlevi, eğitim etiketi değerleriyle model tarafından yapılan tahmin arasındaki farktır. Modelin parametreleri, kayıp işlevi en aza indirilerek tahmin edilir.

Farklı eğitmenler farklı kayıp fonksiyonları ile yapılandırılabilir.

Ortalama mutlak hata (MAE)

Regresyonda, model hatasının tahmin edilen etiket değeri ile doğru etiket değeri arasındaki uzaklık olduğu tüm model hatalarının ortalaması olan bir değerlendirme ölçümüdür.

Modelleme

Geleneksel olarak, tahmin işlevinin parametreleri. Örneğin, doğrusal regresyon modelindeki ağırlıklar veya karar ağacındaki bölme noktaları. ML.NET model, bir etki alanı nesnesinin etiketini tahmin etmek için gereken tüm bilgileri (örneğin, görüntü veya metin) içerir. Bu, ML.NET modellerin hem gerekli özellik geliştirme adımlarını hem de tahmin işlevinin parametrelerini içerdiği anlamına gelir.

Çok sınıflı sınıflandırma

Etiketin üç veya daha fazla sınıftan biri olduğu bir sınıflandırma örneği. Daha fazla bilgi için Makine öğrenmesi görevleri konusunun Çok sınıflı sınıflandırma bölümüne bakın.

N-gram

Metin verileri için bir özellik ayıklama şeması: N sözcük dizisi bir özellik değerine dönüşür.

Normalleştirme

Normalleştirme, kayan nokta verilerini 0 ile 1 arasındaki değerlere ölçeklendirme işlemidir. ML.NET'de kullanılan eğitim algoritmalarının çoğu giriş özelliği verilerinin normalleştirilmesini gerektirir. ML.NET, normalleştirme için bir dizi dönüşüm sağlar

Sayısal özellik vektöru

Yalnızca sayısal değerlerden oluşan bir özellik vektör. Bu, ile double[]benzerdir.

İşlem Hattı

Modeli bir veri kümesine sığdırmak için gereken tüm işlemler. İşlem hattı veri içeri aktarma, dönüştürme, özellik geliştirme ve öğrenme adımlarından oluşur. İşlem hattı eğitildikten sonra modele dönüşür.

Duyarlık

Sınıflandırmada, bir sınıfın duyarlığı, doğru şekilde o sınıfa ait olarak tahmin edilen öğelerin sayısıdır ve sınıfa ait olarak tahmin edilen öğelerin toplam sayısına bölünür.

Geri çağırma

Sınıflandırmada, bir sınıfın geri çağırma işlemi, bu sınıfa ait olarak doğru tahmin edilen öğelerin sayısıdır ve bu da aslında sınıfa ait olan öğelerin toplam sayısına bölünür.

Düzenlileştirme

Normalleştirme, çok karmaşık olması için doğrusal bir modeli cezalı hale getirir. İki tür düzenlileştirme vardır:

  • $L_1$ normalleştirmesi, önemsiz özellikler için ağırlıkları sıfırlar. Kaydedilen modelin boyutu, bu tür bir düzenlileştirmeden sonra küçülebilir.
  • $L_2$ normalleştirmesi, önemsiz özellikler için ağırlık aralığını en aza indirir. Bu daha genel bir işlemdir ve aykırı değerlere karşı daha az duyarlıdır.

Regresyon

Çıkışın gerçek bir değer olduğu denetimli makine öğrenmesi görevi( örneğin, çift). Hisse senedi fiyatlarını tahmin etme örnek olarak verilebilir. Daha fazla bilgi için Makine öğrenmesi görevleri konusunun Regresyon bölümüne bakın.

Göreli mutlak hata

Regresyonda, tüm mutlak hataların toplamı olan bir değerlendirme ölçümü, doğru etiket değerleri ile tüm doğru etiket değerlerinin ortalaması arasındaki mesafelerin toplamına bölünür.

Göreli kare hatası

Regresyonda, doğru etiket değerleri ile tüm doğru etiket değerlerinin ortalaması arasındaki kare uzaklıkların toplamına bölünen tüm mutlak hataların karesinin toplamı olan bir değerlendirme ölçümü.

Ortalama hata karesinin kökü (RMSE)

Regresyonda, hataların karelerinin ortalamasının kare kökü olan bir değerlendirme ölçümü.

Puanlama

Puanlama, eğitilmiş bir makine öğrenmesi modeline yeni veri uygulama ve tahmin oluşturma işlemidir. Puanlama, çıkarım olarak da bilinir. Modelin türüne bağlı olarak puan ham değer, olasılık veya kategori olabilir.

Denetimli makine öğrenmesi

İstenen modelin henüz görünmeyen veriler için etiketi tahmin ettiği makine öğrenmesi alt sınıfı. Sınıflandırma, regresyon ve yapılandırılmış tahmin örnek olarak verilebilir. Daha fazla bilgi için Wikipedia'da Denetimli öğrenme makalesine bakın.

Eğitim

Belirli bir eğitim veri kümesi için model tanımlama işlemi. Doğrusal model için bu, ağırlıkları bulmak anlamına gelir. Bir ağaç için, bölünmüş noktaları tanımlamayı içerir.

Trafo

arabirimini uygulayan ITransformer bir ML.NET sınıfı.

Transformatörler birbirine IDataView dönüşür. Transformatör, tahmin aracı veya tahmin hattı eğitilerek oluşturulur.

Denetimsiz makine öğrenmesi

İstenen modelin verilerdeki gizli (veya gizli) yapıyı bulduğu makine öğrenmesi alt sınıfı. Örnek olarak kümeleme, konu modelleme ve boyut azaltma verilebilir. Daha fazla bilgi için Wikipedia'da Denetimsiz öğrenme makalesine bakın.