Maliyet işlevleriyle model hatalarını en aza indirme

Tamamlandı

Öğrenme süreci, yüksek kaliteli tahminler yapabilene kadar modeli sürekli olarak değiştirir. Bir modelin ne kadar iyi performans sergilediğini belirlemek için öğrenme sürecinde matematik, maliyet işlevi biçiminde kullanılır. Maliyet işlevi, nesnel işlev olarak da bilinir. Maliyet işlevinin ne olduğunu anlamak için biraz ayıralım.

Hata, maliyet ve kayıp

Denetimli öğrenmede hata, maliyet ve kayıpların tümü, modelin bir veya daha fazla etiketi tahmin etmede yaptığı hata sayısına başvurur.

Bu üç terim makine öğrenmesinde biraz gevşek bir şekilde kullanılır ve bu da kafa karışıklığına neden olabilir. Basitlik adına, bunları burada birbirinin yerine kullanacağız. Maliyet matematik aracılığıyla hesaplanır; Nitel bir karar değil. Örneğin, bir model günlük sıcaklığın 40°F olacağını, ancak gerçek değerin 35°F olduğunu öngörüyorsa 5°F hatası olduğunu söyleyebiliriz.

Maliyeti en aza indirmek hedefimizdir

Maliyet modelin ne kadar kötü çalıştığını gösterdiği için hedefimiz sıfır maliyete sahip olmaktır. Başka bir deyişle, modeli hiç hata yapmayan bir şekilde eğitmek istiyoruz. Bu fikir genellikle imkansız olsa da, bunun yerine modeli mümkün olan en düşük maliyete sahip olacak şekilde eğitmek için biraz daha karmaşık bir hedef belirledik.

Bu hedef nedeniyle, maliyeti hesaplama şeklimiz modelin öğrenmeye çalıştığı şeyleri belirler. Yukarıdaki örnekte maliyeti, sıcaklığı tahmin etme hatası olarak tanımladık.

Maliyet işlevi nedir?

Denetimli öğrenmede maliyet işlevi, modelin tahmini ve beklenen etiketten maliyeti hesaplayan küçük bir kod parçasıdır: doğru yanıt. Örneğin, önceki alıştırmamızda tahmin hatalarını hesaplayarak, squaring yaparak ve toplayarak maliyeti hesapladık.

Maliyet işlevi maliyeti hesapladıktan sonra modelin iyi çalışıp çalışmadığını anlarız. İyi performans gösterirse eğitimi durdurmayı seçebiliriz. Aksi takdirde maliyet bilgilerini iyileştiriciye geçirebiliriz. Bu bilgiler model için yeni parametreler seçmek için kullanılır.

Diagram of the machine-learning lifecycle with labels, but without features.

Eğitim sırasında, farklı maliyet işlevleri eğitimin ne kadar süreceğini veya ne kadar iyi çalıştığını değiştirebilir. Örneğin, maliyet işlevi her zaman hataların küçük olduğunu belirtirse, iyileştirici modelde yalnızca küçük değişiklikler yapar. Başka bir örnek olarak, maliyet işlevi belirli hatalar yapıldığında çok büyük değerler döndürürse, iyileştirici modelde bu tür hatalar yapmaması için değişiklikler yapar.

Tümüne uygun tek bir maliyet işlevi yoktur. Hangisinin en iyisi, neyi başarmaya çalıştığımıza bağlıdır. Memnun olduğumuz bir sonuç elde etmek için genellikle maliyet işlevleriyle denemeler yapmamız gerekir. Sonraki alıştırmada bu denemeyi yapacağız.