Sorunu tanımlama

Tamamlandı

İlk adımdan başlayarak, modelin çözmesi gereken sorunu anlamak için şunları anlamak istiyorsunuz:

  • Modelin çıktısının nasıl olması gerektiği.
  • Kullandığınız makine öğrenmesi görevi türü.
  • Modelin başarılı olmasına neden olan ölçütler.

Sahip olduğunuz verilere ve modelin beklenen çıkışına bağlı olarak makine öğrenmesi görevini tanımlayabilirsiniz. Görev, modeli eğitmek için kullanabileceğiniz algoritma türlerini belirler.

Bazı yaygın makine öğrenmesi görevleri şunlardır:

Beş yaygın makine öğrenmesi görevine genel bakış diyagramı.

  1. Sınıflandırma: Kategorik değeri tahmin edin.
  2. Regresyon: Sayısal bir değeri tahmin edin.
  3. Zaman serisi tahmini: Zaman serisi verilerine göre gelecekteki sayısal değerleri tahmin etme.
  4. Görüntü işleme: Görüntüleri sınıflandırabilir veya görüntülerdeki nesneleri algılayabilirsiniz.
  5. Doğal dil işleme (NLP): Metinden içgörüleri ayıklayın.

Modeli eğitmek için, gerçekleştirmek istediğiniz göreve bağlı olarak kullanabileceğiniz bir dizi algoritmanız vardır. Modeli değerlendirmek için doğruluk veya duyarlık gibi performans ölçümlerini hesaplayabilirsiniz. Kullanılabilir ölçümler, modelinizin gerçekleştirmesi gereken göreve de bağlıdır ve bir modelin görevinde başarılı olup olmadığına karar vermenize yardımcı olur.

Bir örneği keşfetme

Hastaların diyabeti olup olmadığını belirlemek istediğiniz bir senaryo düşünün. Çözmeye çalıştığınız sorun ve kullanılabilir veri türü seçtiğiniz makine öğrenmesi görevini belirler. Bu durumda, kullanılabilir veriler hastaların diğer sağlık veri noktalarıdır. İstediğimiz çıkışı, hastanın diyabeti olduğuna veya diyabete sahip olmadığına dair kategorik bilgiler olarak gösterebiliriz. Bu nedenle makine öğrenmesi görevi sınıflandırmadır.

Başlamadan önce sürecin tamamını anlamak, başarılı bir makine öğrenmesi çözümü tasarlamak için vermeniz gereken kararları eşleme fırsatı sunar. Aşağıda, bir hastada diyabeti tanımlama sorununa yaklaşmanın bir yolunu gösteren bir diyagram yer alır. Diyagramda veriler belirli algoritmalar kullanılarak önceden hazırlanır, bölünür ve eğitilir. Daha sonra model kalite açısından değerlendirilir.

Modeli eğitmek için yedi adımı gösteren diyagram.

  1. Veri yükleme: Veri kümesini içeri aktarın ve inceleyin.
  2. Verileri ön işleme: Tutarlılık için normalleştirin ve temizleyin.
  3. Verileri bölme: Eğitim ve test kümelerine ayırın.
  4. Modeli seçin: Algoritmayı seçin ve yapılandırın.
  5. Eğitim modeli: Eğitim verilerinden desenleri öğrenin.
  6. Puan modeli: Test verilerinde tahminler oluşturun.
  7. Değerlendirme: Performans ölçümlerini hesaplama.

Makine öğrenmesi modelini eğitmek genellikle yinelemeli bir süreçtir ve en iyi performansa sahip modeli bulmak için bu adımların her birini birden çok kez gözden geçirebilirsiniz.