TensorFlow ile doğal dil işlemeye giriş
Bu modülde, doğal dil metniyle ilgilenmek için farklı sinir ağı mimarilerini keşfedeceğiz. Son yıllarda Doğal Dil İşleme (NLP), hem dil modeli mimarilerindeki iyileştirmeler hem de giderek daha büyük metin corporası üzerinde eğitilmeleri nedeniyle alan olarak hızlı bir büyüme yaşadı. Sonuç olarak, metinleri "anlama" yetenekleri büyük ölçüde geliştirilmiştir ve BERT gibi büyük önceden eğitilmiş modeller yaygın olarak kullanılmıştır.
NLP'yi TensorFlow'da tensor olarak temsil etme ve sözcük torbaları, eklemeler ve yinelenen sinir ağları gibi klasik NLP mimarilerine odaklanacağız.
Doğal Dil Görevleri
Sinir ağlarını kullanarak çözebileceğimiz birkaç NLP görevi vardır:
- Metin Sınıflandırması , bir metin parçasını önceden tanımlanmış birkaç sınıftan birinde sınıflandırmamız gerektiğinde kullanılır. E-posta istenmeyen posta algılama, haber kategorilere ayırma, bir kategoriye destek isteği atama ve daha fazlası buna örnek olarak verilebilir.
- Amaç Sınıflandırması , konuşma yapay zeka sistemindeki bir giriş konuşmasını tümceciğin gerçek anlamını veya kullanıcının amacını temsil eden amaçlardan birine eşlemek istediğimiz belirli bir metin sınıflandırması örneğidir.
- Yaklaşım Analizi , belirli bir metin parçasının pozitiflik derecesini anlamak istediğimiz bir regresyon görevidir. Bir veri kümesindeki metni en negatiften (-1) en pozitife (+1) etiketlemek ve giriş metninin pozitifliğini temsil eden bir sayı çıkaracak bir model eğitmek isteyebiliriz.
- Adlandırılmış Varlık Tanıma (NER), metinden tarihler, adresler, kişi adları vb. varlıkları ayıklama görevidir. Amaç sınıflandırmasıyla birlikte, NER genellikle iletişim sistemlerinde kullanıcının konuşmasından parametreleri ayıklamak için kullanılır.
- Anahtar Sözcük Ayıklama'nın benzer bir görevi, bir metin içindeki en anlamlı sözcükleri bulmak için kullanılabilir ve daha sonra etiket olarak kullanılabilir.
- Metin Özetleme , en anlamlı metin parçalarını ayıklar ve kullanıcıya özgün metnin sıkıştırılmış bir sürümünü verir.
- Soru Yanıtlama , bir metin parçasından yanıt ayıklama görevidir. Bu model giriş olarak bir metin parçası ve bir soru alır ve yanıtı içeren metin içinde tam yeri bulur. Örneğin, "John, Microsoft Learn'u kullanmayı seven 22 yaşında bir öğrencidir" metni ve John'un kaç yaşında olduğu sorusu bize 22 yanıtını vermelidir.
Bu modülde çoğunlukla Metin Sınıflandırma görevine odaklanacağız. Ancak, gelecekte daha zor görevleri yerine getirmek için ihtiyacımız olan tüm önemli kavramları öğreneceğiz.
Öğrenme hedefleri
- NLP görevleri için metnin nasıl işlendiğini anlama
- Yinelenen Sinir Ağları (RNN) ve Üretken Sinir Ağları (GNN) hakkında bilgi edinin
- Dikkat Mekanizmaları hakkında bilgi edinin
- Metin sınıflandırma modelleri oluşturmayı öğrenin
Önkoşullar
- Python bilgisi
- Makine öğrenmesi hakkında temel bilgiler