Giriş

Tamamlandı

Bir veri bilimcisinin rolü öncelikle verileri keşfetmeyi ve analiz etmeyi içerir. Veri analizinin sonu bir rapor veya makine öğrenmesi modeli olsa da veri bilimcileri verilerle çalışmaya başlar ve Python veri bilimcilerinin verilerle çalışmak için kullandığı en popüler programlama dilidir.

Onlarca yıllık açık kaynak geliştirme sürecinden sonra Python, güçlü istatistiksel ve sayısal kitaplıklarla kapsamlı işlevler sunar:

  • NumPy ve Pandas verileri çözümlemeyi ve işlemeyi basitleştirir
  • Matplotlib cazip veri görselleştirmeleri sağlar
  • Scikit-learn basit ve etkili tahmine dayalı veri analizi sunar
  • TensorFlow ve PyTorch makine öğrenmesi ve derin öğrenme özellikleri sağlar

Örnek senaryo

Veri analizi projesi genellikle belirli bir senaryoyla ilgili içgörüler oluşturmak veya bir hipotezi test etmek için tasarlanmıştır.

Örneğin, bir üniversite profesörüne katılan derslerin sayısı, çalışmak için harcanan saatler ve dönem sonu sınavında elde edilen son not dahil olmak üzere öğrencileri hakkında veri topladığını varsayalım. Profesör, bir öğrencinin üstlendiği çalışma miktarı ile elde ettiği son not arasında bir ilişki olup olmadığını belirlemek için verileri analiz edebilir. Profesör, verileri yalnızca en az sayıda saat boyunca çalışan öğrencilerin başarılı bir not almayı bekleyebileceği bir hipotezi test etmek için kullanabilir.

Diagram of lecture and study time related to student grades.

Ne yapacağız?

Bu eğitim modülünde, bir profesörün bakış açısıyla kurgusal bir üniversite sınıfı için not verilerini keşfedecek ve analiz edeceğiz. Jupyter not defterlerini ve veri kümesini temizlemek için çeşitli Python araçları ve kitaplıkları kullanacağız, verilerle ilgili çeşitli hipotezleri test etmek için istatistiksel teknikler uygulayacak ve değişkenler arasındaki ilişkileri belirlemek için verileri görselleştireceğiz.