Azure Machine Learning'de derin öğrenme ve makine öğrenmesi karşılaştırması

Bu makalede derin öğrenme ile makine öğrenmesi karşılaştırması ve bunların daha geniş bir yapay zeka kategorisine nasıl sığdıkları açıklanmaktadır. Sahtekarlık algılama, ses ve yüz tanıma, yaklaşım analizi ve zaman serisi tahmini gibi Azure Machine Learning'de oluşturabileceğiniz derin öğrenme çözümleri hakkında bilgi edinin.

Çözümleriniz için algoritma seçme konusunda rehberlik için bkz . Machine Learning Algoritması Bilgi Sayfası.

Azure Machine Learning'deki Temel Modeller, belirli kullanım örnekleri için ince ayar yapılabilen önceden eğitilmiş derin öğrenme modelleridir. Azure Machine Learning'de Temel Modeller (önizleme) ve Azure Machine Learning'de Temel Modelleri kullanma (önizleme) hakkında daha fazla bilgi edinin.

Derin öğrenme, makine öğrenmesi ve yapay zeka

Relationship diagram: AI vs. machine learning vs. deep learning

Derin öğrenme ve makine öğrenmesi ile yapay zeka karşılaştırmasını anlamak için aşağıdaki tanımları göz önünde bulundurun:

  • Derin öğrenme , yapay sinir ağlarını temel alan makine öğrenmesinin bir alt kümesidir. Yapay sinir ağlarının yapısı birden çok giriş, çıkış ve gizli katmandan oluştuğundan öğrenme süreci derindir. Her katman, giriş verilerini bir sonraki katmanın belirli bir tahmin görevi için kullanabileceği bilgilere dönüştüren birimler içerir. Bu yapı sayesinde bir makine kendi veri işlemesi aracılığıyla bilgi edinebilir.

  • Makine öğrenmesi , makinelerin görevleri geliştirmek için deneyimi kullanmasına olanak tanıyan teknikleri (derin öğrenme gibi) kullanan bir yapay zeka alt kümesidir. Öğrenme süreci aşağıdaki adımları temel alır:

    1. Verileri bir algoritmaya besleme. (Bu adımda, örneğin özellik ayıklama gerçekleştirerek modele ek bilgiler sağlayabilirsiniz.)
    2. Modeli eğitmek için bu verileri kullanın.
    3. Modeli test edin ve dağıtın.
    4. Otomatik tahmine dayalı bir görev yapmak için dağıtılan modeli kullanın. (Başka bir deyişle, model tarafından döndürülen tahminleri almak için dağıtılan modeli çağırın ve kullanın.)
  • Yapay zeka (AI), bilgisayarların insan zekasını taklit etmelerini sağlayan bir tekniktir. Makine öğrenmesi içerir.

  • Üretken yapay zeka , yeni içerik oluşturmak için teknikleri (derin öğrenme gibi) kullanan bir yapay zeka alt kümesidir. Örneğin, görüntü, metin veya ses oluşturmak için üretken yapay zekayı kullanabilirsiniz. Bu modeller, bu içeriği oluşturmak için yüksek düzeyde önceden eğitilmiş bilgilerden yararlanılır.

Makine öğrenmesi ve derin öğrenme tekniklerini kullanarak, genellikle insan zekasıyla ilişkili görevleri yerine getiren bilgisayar sistemleri ve uygulamaları oluşturabilirsiniz. Bu görevler görüntü tanıma, konuşma tanıma ve dil çevirisi içerir.

Derin öğrenme ve makine öğrenmesi teknikleri

Makine öğrenmesine ve derin öğrenmeye genel bakışa sahip olduğunuz için şimdi iki tekniği karşılaştıralım. Makine öğrenmesinde algoritmaya, daha fazla bilgi tüketerek (örneğin, özellik ayıklama gerçekleştirerek) doğru bir tahminde bulunmanın anlatılması gerekir. Derin öğrenmede algoritma, yapay sinir ağı yapısı sayesinde kendi veri işleme yoluyla doğru tahminde bulunmayı öğrenebilir.

Aşağıdaki tabloda iki teknik daha ayrıntılı olarak karşılaştırabilirsiniz:

Tüm makine öğrenmesi Yalnızca derin öğrenme
Veri noktası sayısı Tahminlerde bulunmak için az miktarda veri kullanabilir. Tahminlerde bulunmak için büyük miktarda eğitim verisi kullanması gerekir.
Donanım bağımlılıkları Düşük uçlu makinelerde çalışabilir. Çok fazla hesaplama gücüne ihtiyacı yoktur. Üst düzey makinelere bağlıdır. Doğal olarak çok sayıda matris çarpma işlemi yapar. GPU bu işlemleri verimli bir şekilde iyileştirebilir.
Özellik geliştirme işlemi Özelliklerin kullanıcılar tarafından doğru bir şekilde tanımlanmasını ve oluşturulmasını gerektirir. Verilerden üst düzey özellikleri öğrenir ve tek başına yeni özellikler oluşturur.
Öğrenme yaklaşımı Öğrenme sürecini daha küçük adımlara ayırır. Ardından her bir adımdaki sonuçları tek bir çıkışta birleştirir. Sorunu uçtan uca çözerek öğrenme sürecinde ilerleyin.
Yürütme süresi Birkaç saniye ile birkaç saat arasında değişen eğitimler nispeten az zaman alır. Derin öğrenme algoritması birçok katman içerdiği için eğitmek genellikle uzun sürer.
Çıktı Çıkış genellikle puan veya sınıflandırma gibi sayısal bir değerdir. Çıktının metin, puan veya ses gibi birden çok biçimi olabilir.

Öğrenme aktarımı nedir?

Derin öğrenme modellerinin eğitmesi için genellikle büyük miktarda eğitim verileri, üst düzey işlem kaynakları (GPU, TPU) ve daha uzun bir eğitim süresi gerekir. Bunların hiçbirini kullanamamanıza neden olan senaryolarda, öğrenme aktarımı olarak bilinen bir tekniği kullanarak eğitim sürecine kısayol sağlayabilirsiniz.

Öğrenmeyi aktarma, bir sorunun çözülmesinden elde edilen bilgileri farklı ama ilgili bir soruna uygulayan bir tekniktir.

Sinir ağlarının yapısı nedeniyle, ilk katman kümesi genellikle alt düzey özellikler içerirken, son katman kümesi söz konusu etki alanına daha yakın olan daha üst düzey özellikler içerir. Son katmanları yeni bir etki alanında veya sorunda kullanmak üzere yeniden kullanarak, yeni modeli eğitmek için gereken süreyi, verileri ve işlem kaynaklarını önemli ölçüde azaltabilirsiniz. Örneğin, arabaları tanıyan bir modeliniz zaten varsa, kamyonları, motosikletleri ve diğer araç türlerini de tanımak için transfer öğrenmesini kullanarak bu modeli yeniden kullanabilirsiniz.

Azure Machine Learning'de açık kaynak çerçeve kullanarak görüntü sınıflandırması için aktarım öğrenmesi uygulamayı öğrenin: Öğrenme aktarımını kullanarak derin öğrenme PyTorch modelini eğitin.

Derin öğrenme kullanım örnekleri

Yapay sinir ağı yapısı nedeniyle, derin öğrenme görüntüler, ses, video ve metin gibi yapılandırılmamış verilerdeki desenleri tanımlama konusunda üstünlük sağlar. Bu nedenle derin öğrenme, sağlık, enerji, finans ve ulaşım gibi birçok sektörü hızla dönüştürmektedir. Bu sektörler artık geleneksel iş süreçlerini yeniden ele alır.

Derin öğrenme için en yaygın uygulamalardan bazıları aşağıdaki paragraflarda açıklanmıştır. Azure Machine Learning'de açık kaynak çerçeveden oluşturduğunuz bir modeli kullanabilir veya sağlanan araçları kullanarak modeli oluşturabilirsiniz.

Adlandırılmış varlık tanıma

Adlandırılmış varlık tanıma, bir metin parçasını giriş olarak alan ve önceden belirtilen bir sınıfa dönüştüren bir derin öğrenme yöntemidir. Bu yeni bilgiler posta kodu, tarih, ürün kimliği olabilir. Daha sonra bilgiler yapılandırılmış bir şemada depolanabilir ve adres listesi oluşturulabilir veya kimlik doğrulama altyapısı için kıyaslama görevi görür.

Nesne algılama

Derin öğrenme birçok nesne algılama kullanım örneğinde uygulanmıştır. Nesne algılama, bir görüntüdeki nesneleri (arabalar veya kişiler gibi) tanımlamak ve sınırlayıcı kutu içeren her nesne için belirli bir konum sağlamak için kullanılır.

Nesne algılama zaten oyun, perakende, turizm ve kendi kendine araba gibi sektörlerde kullanılmaktadır.

Görüntü başlık oluşturma

Görüntü tanıma gibi, belirli bir görüntü için görüntü başlık, sistemin görüntünün içeriğini açıklayan bir başlık oluşturması gerekir. Fotoğraflardaki nesneleri algılayıp etiketleyebileceğiniz durumlarda, bir sonraki adım bu etiketleri açıklayıcı cümlelere dönüştürmektir.

Genellikle, görüntü başlık uygulamaları bir görüntüdeki nesneleri tanımlamak için kıvrımlı sinir ağları kullanır ve ardından etiketleri tutarlı cümlelere dönüştürmek için yinelenen bir sinir ağı kullanır.

Makine çevirisi

Makine çevirisi, sözcükleri veya tümceleri bir dilden alır ve otomatik olarak başka bir dile çevirir. Makine çevirisi uzun süredir devam ediyor, ancak derin öğrenme iki belirli alanda etkileyici sonuçlar elde ediyor: metnin otomatik çevirisi (ve konuşmayı metne çevirisi) ve görüntülerin otomatik çevirisi.

Uygun veri dönüştürme ile sinir ağı metin, ses ve görsel sinyalleri anlayabilir. Makine çevirisi, daha büyük ses dosyalarındaki ses parçacıklarını tanımlamak ve konuşulan sözcüğü veya görüntüyü metin olarak dökümünü almak için kullanılabilir.

Metin analizi

Derin öğrenme yöntemlerine dayalı metin analizi, büyük miktarlardaki metin verilerini (örneğin, tıbbi belgeler veya gider makbuzları) analiz etmeyi, desenleri tanımayı ve bunun dışında düzenli ve kısa bilgiler oluşturmayı içerir.

Şirketler, iç ticaret ve kamu düzenlemeleriyle uyumluluğu algılamak için metin analizi gerçekleştirmek için derin öğrenmeyi kullanır. Bir diğer yaygın örnek de sigorta dolandırıcılığıdır: Metin analizi genellikle bir sigorta talebi sahte olma olasılığını tanımak için büyük miktarda belgeyi analiz etmek için kullanılmıştır.

Yapay sinir ağları

Yapay sinir ağları, bağlı düğümlerin katmanlarıyla oluşturulur. Derin öğrenme modellerinde çok sayıda katmana sahip sinir ağları kullanılır.

Aşağıdaki bölümlerde en popüler yapay sinir ağı tipolojileri incelanmıştır.

Feedforward sinir ağı

Feedforward sinir ağı, en basit yapay sinir ağı türüdür. Akışa doğru bir ağda, bilgiler giriş katmanından çıkış katmanına yalnızca bir yönde taşınır. Feedforward sinir ağları, bir girişi bir dizi gizli katmana geçirerek dönüştürür. Her katman bir dizi nörondan oluşur ve her katman daha önce katmandaki tüm nöronlara tamamen bağlanır. Son tam bağlı katman (çıkış katmanı), oluşturulan tahminleri temsil eder.

Yinelenen sinir ağı (RNN)

Yinelenen sinir ağları yaygın olarak kullanılan bir yapay sinir ağıdır. Bu ağlar bir katmanın çıkışını kaydeder ve katmanın sonucunu tahmin etmeye yardımcı olmak için bunu giriş katmanına geri besler. Yinelenen sinir ağları harika öğrenme yeteneklerine sahiptir. Bunlar zaman serisi tahmini, el yazısı öğrenme ve dili tanıma gibi karmaşık görevler için yaygın olarak kullanılır.

Evrişimli sinir ağı (CNN)

Kıvrımlı sinir ağı özellikle etkili bir yapay sinir ağıdır ve benzersiz bir mimari sunar. Katmanlar üç boyutta düzenlenir: genişlik, yükseklik ve derinlik. Bir katmandaki nöronlar, bir sonraki katmandaki tüm nöronlara değil, sadece katmanın nöronlarının küçük bir bölgesine bağlanır. Son çıkış, derinlik boyutu boyunca düzenlenmiş tek bir olasılık puanı vektörine indirilir.

Kıvrımlı sinir ağları, video tanıma, görüntü tanıma ve öneren sistemler gibi alanlarda kullanılmıştır.

Üretken çekişmeli ağ (GAN)

Üretken saldırgan ağlar, görüntüler gibi gerçekçi içerikler oluşturmak için eğitilen üretken modellerdir. Oluşturucu ve ayrıştırıcı olarak bilinen iki ağdan oluşur. Her iki ağ da aynı anda eğitilir. Eğitim sırasında oluşturucu, gerçek verilere çok benzeyen yeni yapay veriler oluşturmak için rastgele kirlilik kullanır. Ayrıştırıcı, oluşturucudan çıkışı giriş olarak alır ve oluşturulan içeriğin gerçek mi yoksa yapay mı olduğunu belirlemek için gerçek verileri kullanır. Her ağ birbiriyle rekabet ediyor. Oluşturucu gerçek içerikten ayırt edilemeyen yapay içerik oluşturmaya çalışıyor ve ayırıcı girişleri doğru bir şekilde gerçek veya yapay olarak sınıflandırmaya çalışıyor. Daha sonra çıkış, ilgili hedeflerine daha iyi ulaşmalarına yardımcı olmak için her iki ağın ağırlıklarını güncelleştirmek için kullanılır.

Üretken saldırgan ağlar görüntüden görüntüye çeviri ve yaş ilerlemesi gibi sorunları çözmek için kullanılır.

Dönüştürücüler

Transformatörler, metin veya zaman serisi verileri gibi dizileri içeren sorunları çözmeye uygun bir model mimarisidir. Kodlayıcı ve kod çözücü katmanlarından oluşur. Kodlayıcı bir giriş alır ve bağlam gibi bilgileri içeren sayısal bir gösterimle eşler. Kod çözücü, çevrilmiş metin gibi bir çıkış oluşturmak için kodlayıcıdaki bilgileri kullanır. Transformatörleri kodlayıcılar ve kod çözücüler içeren diğer mimarilerden farklı kılan şey, dikkat alt katmanlarıdır. Dikkat, bir dizideki diğer girişlerle ilgili olarak bağlamlarının önemine göre bir girişin belirli bölümlerine odaklanma fikridir. Örneğin, bir haber makalesini özetlerken tüm cümleler ana fikri açıklamaya uygun değildir. Makalenin tamamında önemli sözcüklere odaklanarak özetleme, başlık olan tek bir cümlede yapılabilir.

Transformatörler çeviri, metin oluşturma, soru yanıtlama ve metin özetleme gibi doğal dil işleme sorunlarını çözmek için kullanılmıştır.

Transformatörlerin bazı iyi bilinen uygulamaları şunlardır:

  • Transformatörlerden Çift Yönlü Kodlayıcı Gösterimleri (BERT)
  • Üretim Öncesi Transformatör 2 (GPT-2)
  • Üretim Öncesi Transformatör 3 (GPT-3)

Sonraki adımlar

Aşağıdaki makalelerde, Azure Machine Learning'de açık kaynak derin öğrenme modellerini kullanmaya yönelik daha fazla seçenek gösterilmektedir: