Derin öğrenme kavramlarını anlama

7 dakika

Beyninizde, ağa elektrokimyasal sinyaller geçiren sinir uzantılarıyla birbirine bağlanan nöronlar adı verilen sinir hücrelerine sahipsiniz.

Diagram of a human brain with a network of neurons.

Ağdaki ilk nöron uyarıldığında, giriş sinyali işlenir ve belirli bir eşiği aşarsa nöron etkinleştirilir ve sinyali bağlı olduğu nöronlara geçirir. Bu nöronlar sırayla etkinleştirilebilir ve sinyali ağın geri kalanından geçirebilir. Zaman içinde, etkili bir şekilde nasıl yanıt vereceğinizi öğrendikçe nöronlar arasındaki bağlantılar sık kullanımla güçlendirilir. Örneğin, size bir penguenin resmi gösterilirse, nöron bağlantılarınız resimdeki bilgileri işlemenizi ve bir penguenin özelliklerini bu şekilde tanımlamanızı sağlar. Zaman içinde, çeşitli hayvanların birden çok resmi gösterilirse, hayvanları özelliklerine göre tanımlamaya dahil olan nöronların ağı daha da güçlenir. Başka bir deyişle, farklı hayvanları doğru bir şekilde tanımlama konusunda daha iyi olursunuz.

Derin öğrenme, elektrokimyasal uyaran yerine sayısal girişleri işleyen yapay sinir ağlarını kullanarak bu biyolojik işleme öykünür.

Diagram of an artificial neural network.

Gelen sinir bağlantıları genellikle x olarak tanımlanan sayısal girişlerle değiştirilir. Birden fazla giriş değeri olduğunda x, x 1_{, _x} 2 vb. adlı öğelere sahip bir vektör olarak kabul edilir.

Her x değeriyle ilişkili olan ağırlık (w), öğrenme simülasyonu yapmak için x değerinin etkisini güçlendirmek veya zayıflatmak için kullanılır. Ayrıca, ağ üzerinde ayrıntılı denetim sağlamak için bir sapma (b) girişi eklenir. Eğitim işlemi sırasında w ve b değerleri ağı ayarlayıp doğru çıkışları üretmeyi "öğrenecek" şekilde ayarlanır.

Nöron, x, w ve b ağırlıklı toplamını hesaplayan bir işlevi kapsüller. Bu işlev sırayla, nöronun ağdaki bir sonraki nöron katmanına bir çıkış geçirip geçirmediğini belirlemek için sonucu kısıtlayan (genellikle 0 ile 1 arasındaki bir değerle) bir etkinleştirme işlevi içine alınır.

Derin öğrenme modeli eğitma

Derin öğrenme modelleri, yapay nöronların birden çok katmanından oluşan sinir ağlarıdır. Her katman, ilişkili w ağırlıkları ve sapmaları olan x değerleri üzerinde gerçekleştirilen bir işlev kümesini temsil eder ve son katman, modelin tahmin ettiği y etiketinin çıkışında sonuçlanır. Bir sınıflandırma modeli söz konusu olduğunda (giriş verileri için büyük olasılıkla en büyük olasılıkla kategoriyi veya sınıfı tahmin eder), çıkış her olası sınıf için olasılığı içeren bir vektördür.

Aşağıdaki diyagram, bir veri varlığının sınıfını dört özelliğe ( x değerleri) göre tahmin eden bir derin öğrenme modelini temsil eder. Modelin çıkışı ( y değerleri), üç olası sınıf etiketinin her biri için olasılıktır.

Diagram of a neural network.

Modeli eğitmek için, derin öğrenme çerçevesi birden çok giriş verisi toplu işlemini (gerçek etiket değerlerinin bilindiği) besler, tüm ağ katmanlarındaki işlevleri uygular ve çıkış olasılıkları ile eğitim verilerinin bilinen gerçek sınıf etiketleri arasındaki farkı ölçer. Tahmin çıkışları ile gerçek etiketler arasındaki toplu fark, kayıp olarak bilinir.

Tüm veri toplu işlemleri için toplam kaybı hesaplayan derin öğrenme çerçevesi, genel kaybı azaltmak için modeldeki ağırlıkların ve sapmaların nasıl ayarlanması gerektiğini belirlemek için bir iyileştirici kullanır. Bu ayarlamalar daha sonra sinir ağı modelindeki katmanlara geri özelliklendirilir ve veriler ağ üzerinden yeniden geçirilir ve kayıp yeniden hesaplanır. Bu işlem, kayıp en aza indirilinceye ve model doğru tahmin yapabilmek için doğru ağırlıkları ve sapmaları "öğrenene" kadar birden çok kez yinelenir (her yineleme bir dönem olarak bilinir).

Her dönem boyunca, ağırlıklar ve sapmalar kaybı en aza indirmek için ayarlanır. Bunların ayarlandığı tutar, iyileştiriciye belirttiğiniz öğrenme oranına tabidir. Öğrenme oranı çok düşükse, eğitim sürecinin en uygun değerleri belirlemesi uzun sürebilir; ancak çok yüksekse, iyileştirici hiçbir zaman en uygun değerleri bulamayabilir.

Devam et

Derin öğrenme modeli eğitma

Geri Bildirim