Makine öğrenmesi nedir?

Tamamlandı

Makine öğrenmesinin kökeni istatistikler ve verilerin matematiksel modellemesidir. Makine öğrenmesinin temel fikri, bilinmeyen sonuçları veya değerleri tahmin etmek için geçmiş gözlemlerdeki verileri kullanmaktır. Örneğin:

  • Bir dondurma mağazasının sahibi, hava durumu tahminine göre belirli bir günde kaç dondurma satabileceklerini tahmin etmek için geçmiş satışları ve hava durumu kayıtlarını birleştiren bir uygulama kullanabilir.
  • Bir doktor, kilo, kan şekeri düzeyi ve diğer ölçümler gibi faktörlere bağlı olarak yeni bir hastanın diyabet riski altında olup olmadığını tahmin eden otomatik testler yapmak için geçmiş hastaların klinik verilerini kullanabilir.
  • Antarktika'daki bir araştırmacı, bir kuşun paletlerinin, faturalarının ve diğer fiziksel özniteliklerinin ölçümlerine göre farklı penguen türlerinin (Adelie, Gentoo veya Chinstrap gibi) tanımlanmasını otomatikleştirmek için geçmiş gözlemleri kullanabilir.

İşlev olarak makine öğrenmesi

Makine öğrenmesi matematiğe ve istatistiklere dayandığından, makine öğrenmesi modellerini matematiksel terimlerle düşünmek yaygın bir durumdur. Temel olarak, makine öğrenmesi modeli bir veya daha fazla giriş değerine göre bir çıkış değeri hesaplamak için bir işlevi kapsülleyen bir yazılım uygulamasıdır. Bu işlevi tanımlama işlemi eğitim olarak bilinir. İşlev tanımlandıktan sonra, çıkarım adı verilen bir işlemdeki yeni değerleri tahmin etmek için bunu kullanabilirsiniz.

Şimdi eğitim ve çıkarımla ilgili adımları inceleyelim.

Makine öğrenmesindeki eğitim ve çıkarım aşamalarını gösteren diyagram.

  1. Eğitim verileri geçmiş gözlemlerden oluşur. Gözlemler çoğu durumda gözlemlenen öznitelikleri veya gözlemlenen şeyin özelliklerini ve modeli tahmin etmek için eğitmek istediğiniz şeyin bilinen değerini (etiket olarak bilinir) içerir.

    Matematiksel terimle, x kısaltma değişkeni adı ve y olarak adlandırılan etiketin kullanıldığı özellikleri sıklıkla görürsünüz. Genellikle, bir gözlem birden çok özellik değerinden oluşur, bu nedenle x aslında bir vektördür (birden çok değer içeren bir dizidir), örneğin: [x1,x 2,x 3,...].

    Bunu daha net bir şekilde ifade etmek için daha önce açıklanan örnekleri ele alalım:

    • Dondurma satış senaryosunda hedefimiz, hava durumuna göre dondurma satışlarının sayısını tahmin edebilen bir model eğitmektir. Günün hava durumu ölçümleri (sıcaklık, yağış, rüzgar vb.) özellikleri (x) ve her gün satılan dondurmaların sayısı etiket (y) olacaktır.
    • Tıbbi senaryoda amaç, hastanın klinik ölçümlerine göre diyabet riski altında olup olmadığını tahmin etmektir. Hastanın ölçümleri (ağırlık, kan şekeri düzeyi vb.) özelliklerdir (x) ve diyabet olasılığı (örneğin, risk altında için 1, risk altında olmayanlar için 0) etikettir (y).
    • Antarktika araştırma senaryosunda, bir penguenin türünü fiziksel özniteliklerine göre tahmin etmek istiyoruz. Penguenin temel ölçümleri (paletlerinin uzunluğu, fatura genişliği vb.) özelliklerdir (x) ve türler (örneğin, Adelie için 0, Gentoo için 1 veya Chinstrap için 2) etikettir (y).
  2. Özellikler ve etiket arasındaki ilişkiyi belirlemeye çalışmak ve x üzerinde y hesaplamak için gerçekleştirilebilecek bir hesaplama olarak bu ilişkiyi genelleştirmek için verilere bir algoritma uygulanır. Kullanılan belirli algoritma, çözmeye çalıştığınız tahmine dayalı sorunun türüne bağlıdır (daha sonra bununla ilgili daha fazla bilgi için), ancak temel ilke, etiketi hesaplamak için özelliklerin değerlerinin kullanılabildiği bir işlevi verilere sığdırmaya çalışmaktır.

  3. Algoritmanın sonucu, algoritma tarafından bir işlev olarak türetilen hesaplamayı kapsülleyen bir modeldir. Bunu f olarak adlandıralım. Matematiksel gösteriminde:

    y = f(x)

  4. Eğitim aşaması tamamlandıktan sonra eğitilen model çıkarım için kullanılabilir. Model temelde eğitim süreci tarafından üretilen işlevi kapsülleyen bir yazılım programıdır. Bir özellik değerleri kümesi girebilirsiniz ve çıkış olarak ilgili etiketin tahminini alabilirsiniz. Modelin çıktısı gözlemlenen bir değer değil, işlev tarafından hesaplanan bir tahmin olduğundan, genellikle işlevin çıkışını ŷ olarak (oldukça hoş bir şekilde "y-hat" olarak sözlü olarak gösterilir) görürsünüz.