Giriş

Tamamlandı

Verilerin makine öğrenmesini şekillendirmesi, makine öğrenmesine tahmin gücü verir. Etkili modeller oluşturmak için kullandığınız verileri anlamanız gerekir.

Burada hem insanların hem de bilgisayarların verileri kategorilere ayırma, depolama ve yorumlama şeklini inceleyeceğiz. İyi bir veri kümesinin ne olduğunu ve kullanılabilir verilerimizdeki sorunları nasıl düzeltebileceğimizi inceleyeceğiz. Ayrıca yeni verilerin keşfini de uyguluyoruz ve bir veri kümesi hakkında derin düşünmenin daha iyi tahmine dayalı modeller oluşturmamıza ne kadar yardımcı olabileceğini görüyoruz.

Senaryo: Titanik'in son yolculuğu

Hevesli bir deniz arkeologu olarak, deniz felaketlerine aşırı derecede meraklısınız. Bir gece geç saatlerde, balina kemiklerinin görüntüleriyle Atlantis hakkındaki eski kaydırmalar arasında gezinirken Titanik'in ilk ve son yolculuğunun bilinen yolcularını ve mürettebatını listeleyen genel bir veri kümesi bulursunuz. Kader ve şans arasındaki dengenin içinde, merak ediyorum - Titanik yolcunun hayatta kalmasını hangi faktörler belirledi? Bu dönemdeki veriler kısmen eksiktir; bazı yolcular için çok fazla bilgi bilinmemektedir. Bu verileri tam olarak analiz etmeden önce düzeltme eki uygulama yollarını bulmanız gerekir.

Önkoşullar

  • Modeller ve maliyet gibi makine öğrenmesi kavramları hakkında bazı bilgiler yardımcı olur, ancak gerekli değildir

Öğrenme hedefleri

Bu modülde şunları yapacaksınız:

  • Keşif Veri Analizi (EDA) ile büyük veri kümelerini görselleştirme
  • Veri kümesindeki hataları temizleme
  • Sayısal ve kategorik verilerle bilinmeyen değerleri tahmin edin