PostgreSQL için Azure Veritabanı ile üretken yapay zeka

Üretken yapay zeka, mevcut multimedya içeriğinden öğrenebilen ve yeni içerik oluşturabilen bir yapay zeka algoritma sınıfını ifade eder. Oluşturulan içeriği istemler ve ince ayarlama gibi tekniklerle özelleştirebilirsiniz. Üretken yapay zeka algoritmaları belirli makine öğrenmesi modellerini kullanır:

  • Transformatörler ve metin oluşturma için yinelenen sinir ağları (RNN)
  • Görüntü oluşturma için saldırgan ağlar (GAN' ler) ve çeşitlemeli otomatik kodlayıcılar (VAE)

Üretken yapay zeka, metin otomatik tamamlama, metin özetleme ve çeviri gibi yaygın görevlerle birlikte görüntü ve müzik sentezinde ve sağlık hizmetlerinde kullanılır. Üretken yapay zeka teknikleri, verilerde kümeleme ve segmentlere ayırma, anlamsal arama ve öneriler, makale modelleme, soru yanıtlama ve anomali algılama gibi özellikleri etkinleştirir.

Aşağıdaki videoda PostgreSQL için Azure Veritabanı ve uzantı ile üretken yapay zeka kullanımı gösterilmektedirpgvector. Bu makaledeki kavramları anlamanıza yardımcı olabilir.

OpenAI

OpenAI, yapay zeka ve makine öğrenmesi alanındaki öncü çalışmaları ile bilinen bir araştırma kuruluşu ve teknoloji şirketidir. Misyonu, en ekonomik açıdan değerli işlerde insanlardan daha iyi performans gösterebilen son derece otonom yapay zeka sistemlerini ifade eden yapay genel zekanın (AGI) tüm insanlığa fayda sağladığından emin olmaktır. OpenAI, GPT-3, GPT-3.5 ve GPT-4 gibi en ileri düzey üretici modelleri pazara sundu.

Azure OpenAI, Azure kullanarak üretken yapay zeka uygulamaları oluşturmaya yardımcı olan bir Microsoft hizmeti teklifidir. Azure OpenAI, Müşterilere OpenAI GPT-4, GPT-3, Codex, DALL-E ve Whisper modelleriyle gelişmiş dil yapay zekası ve Azure'ın güvenlik ve kurumsal özellikleri sunar. Azure OpenAI, uyumluluk ve bir birinden diğerine sorunsuz bir geçiş sağlamak için OpenAI ile API'leri kodlar.

Azure OpenAI'yi kullanan müşteriler, OpenAI ile aynı modelleri çalıştırırken Microsoft Azure'ın güvenlik özelliklerine sahip olur. Azure OpenAI özel ağ, bölgesel kullanılabilirlik ve sorumlu yapay zeka içerik filtrelemesi sunar.

Azure OpenAI hakkında daha fazla bilgi edinin.

Büyük dil modeli

Büyük dil modeli (LLM), insan benzeri bir dili anlamak ve oluşturmak için çok miktarda metin verisi üzerinde eğitilen bir yapay zeka modeli türüdür. LLM'ler genellikle transformatörler gibi derin öğrenme mimarilerini kullanır. Çok çeşitli doğal dil anlama ve oluşturma görevleri gerçekleştirebilme özellikleriyle bilinirler. Azure OpenAI hizmeti ve OpenAI'nin ChatGPT'si LLM tekliflerine örnek olarak verilebilir.

LLM'lerin temel özellikleri ve özellikleri şunlardır:

  • Ölçek: LLM'ler, parametre sayısı açısından büyük ölçekli mimariler kullanır. GPT-3 gibi modeller, karmaşık desenleri dilde yakalamalarını sağlayan yüz milyonlarca ila trilyonlarca parametre içerir.
  • Ön eğitim: LLM'ler internetten büyük bir metin verisi kümesi üzerinde önceden eğitilir. Bu ön eğitim, dil bilgisi, söz dizimi, semantik ve dil ve dünya hakkında çok çeşitli bilgileri öğrenmelerini sağlar.
  • İnce ayar: Önceden eğitildikten sonra, daha küçük, göreve özgü veri kümeleriyle belirli görevler veya etki alanlarındaki LLM'lere ince ayar yapabilirsiniz. Bu ince ayarlama işlemi, metin sınıflandırması, çeviri, özetleme ve soru yanıtlama gibi daha özel görevlere uyum sağlamalarını sağlar.

GPT

GPT, Generative Pretrained Transformer anlamına gelir ve OpenAI tarafından geliştirilen bir dizi büyük dil modelini ifade eder. GPT modelleri, OpenAI'nin İnternet'ten çok büyük miktarda veri üzerinde önceden eğitilen sinir ağlarıdır, bu nedenle insan benzeri metinleri anlayıp oluşturabilirler.

İşte ana GPT modellerine ve bunların temel özelliklerine genel bir bakış:

  • GPT-3: Haziran 2020'de piyasaya sürüldü ve GPT serisinde iyi bilinen bir model. 175 milyar parametresi vardır ve bu da onu var olan en büyük ve en güçlü dil modellerinden biri yapar.

    GPT-3, çok çeşitli doğal dil anlama ve oluşturma görevlerinde dikkat çekici bir performans elde eder. Metin tamamlama, çeviri ve soru yanıtlama gibi görevleri insan düzeyinde akıcı bir şekilde gerçekleştirebilir.

    GPT-3, en küçükten (125 milyon parametre) en büyük (175 milyar parametre) kadar çeşitli model boyutlarına ayrılır.

  • GPT-4: OpenAI'nin en son GPT modeli. 1,76 trilyon parametreye sahiptir.

Vectors

Vektör, hem büyüklüğe hem de yöne sahip miktarları temsil etmek için doğrusal cebir ve geometride kullanılan matematiksel bir kavramdır. Makine öğrenmesi bağlamında veri noktalarını veya özellikleri göstermek için vektörleri kullanın.

Vektörlerin temel öznitelikleri ve işlemleri şunlardır:

  • Büyüklük: Genellikle norm olarak belirtilen vektör uzunluğu veya boyutu, verilerin büyüklüğünü temsil eder. Negatif olmayan bir gerçek sayı.
  • Yön: Yön, bir başvuru noktası veya koordinat sistemiyle ilgili olarak, temsil ettiği miktarın yönünü veya açısını gösterir.
  • Bileşenler: Vektör, farklı eksenler veya boyutlar boyunca bileşenlerine ayrıştırılabilir. 2B Kartezyen koordinat sisteminde bir vektör (x, y) olarak temsil edilebilir; burada x ve y sırasıyla x ekseni ve y ekseni boyunca bileşenleridir. N boyutlu vektör, n tanımlama grubudur ({x1, x2... xn}).
  • Toplama ve skaler çarpma: Yeni vektörler oluşturmak için vektörleri bir araya ekleyin ve bunları skalerlerle (gerçek sayılar) çarpın.
  • Noktalı ürünler ve çapraz ürünler: Noktalı ürünler (skaler ürünler) ve çapraz ürünler (vektör ürünleri) aracılığıyla vektörleri birleştirin.

Vektör veritabanları

Vektör veritabanı yönetim sistemi (DBMS) olarak da bilinen vektör veritabanı, vektör verilerini verimli bir şekilde depolamak, yönetmek ve sorgulamak için tasarlanmış bir veritabanı sistemi türüdür. Geleneksel ilişkisel veritabanları öncelikli olarak tablolardaki yapılandırılmış verileri işlerken, vektör veritabanları ise vektör olarak temsil edilen çok boyutlu veri noktalarının depolanması ve alınması için iyileştirilmiştir. Bu veritabanları benzerlik aramaları, jeo-uzamsal veriler, öneri sistemleri ve kümeleme gibi işlemlerin söz konusu olduğu uygulamalar için kullanışlıdır.

Vektör veritabanlarının temel özellikleri şunlardır:

  • Vektör depolama: Vektör veritabanları, veri noktalarını birden çok boyuta sahip vektörler olarak depolar. Her boyut, veri noktasının bir özelliğini veya özniteliğini temsil eder. Bu vektörler sayısal, kategorik ve metinsel veriler de dahil olmak üzere çok çeşitli veri türlerini temsil edebilir.
  • Verimli vektör işlemleri: Vektör veritabanları vektör ekleme, çıkarma, noktalı ürünler ve benzerlik hesaplamaları (kosinüs benzerliği veya Öklid uzaklığı gibi) gibi vektör işlemlerini gerçekleştirmek için iyileştirilmiştir.
  • Verimli arama: Verimli dizin oluşturma mekanizmaları, benzer vektörlerin hızlı alınması için çok önemlidir. Vektör veritabanları, hızlı almayı etkinleştirmek için çeşitli dizin oluşturma mekanizmaları kullanır.
  • Sorgu dilleri: Vektör veritabanları, vektör işlemleri ve benzerlik aramaları için uyarlanmış sorgu dilleri ve API'ler sağlar. Bu sorgu dilleri kullanıcıların arama ölçütlerini verimli bir şekilde ifade etmelerini sağlar.
  • Benzerlik araması: Vektör veritabanları, kullanıcıların sağlanan sorgu noktasına benzer veri noktalarını bulmalarına olanak tanıyan benzerlik aramalarında üstünlük sağlar. Bu özellik arama ve öneri sistemlerinde değerlidir.
  • Jeo-uzamsal veri işleme: Bazı vektör veritabanları jeo-uzamsal veriler için tasarlanmıştır, bu nedenle konum tabanlı hizmetler, coğrafi bilgi sistemleri (GIS) ve haritayla ilgili görevler gibi uygulamalar için çok uygundur.
  • Farklı veri türleri için destek: Vektör veritabanları vektörler, görüntüler ve metinler gibi çeşitli veri türlerini depolayabilir ve yönetebilir.

PostgreSQL, uzantıyı kullanarak vektör veritabanının pgvectorözelliklerini elde edebilir.

Eklemeler

Eklemeler, makine öğrenmesi ve doğal dil işlemede bir kavramdır. Bunlar sözcükler, belgeler veya varlıklar gibi nesneleri çok boyutlu bir alanda vektör olarak temsil eder.

Bu vektörler genellikle yoğun, yani çok sayıda boyuta sahiptir. Bunları sinir ağları da dahil olmak üzere çeşitli tekniklerle öğrenirsiniz. Eklemeler, sürekli vektör uzayında nesneler arasındaki anlamsal ilişkileri ve benzerlikleri yakalamayı hedefler.

Yaygın ekleme türleri şunlardır:

  • Sözcük: Doğal dil işlemede, sözcük eklemeleri sözcükleri vektör olarak temsil eder. Her sözcük, benzer anlamlara veya bağlamlara sahip sözcüklerin birbirine daha yakın olduğu yüksek boyutlu bir alanda bir vektöre eşlenir. Word2Vec ve GloVe popüler sözcük ekleme teknikleridir.
  • Belge: Belge ekleme işlemleri, belgeleri vektör olarak temsil eder. Doc2Vec belge eklemeleri oluşturmak için popülerdir.
  • Görüntü: Nesne tanıma gibi görevlerin görsel özelliklerini yakalamak için görüntüleri ekleme olarak temsil edebilirsiniz.

Eklemeler, makine öğrenmesi modellerinin kolayca işleyebileceği bir biçimde karmaşık, yüksek boyutlu verileri temsil etmek için merkezi bir yerdir. Bunları büyük veri kümelerinde eğitebilir ve çeşitli görevler için özellik olarak kullanabilirsiniz. LLM'ler bunları kullanır.

PostgreSQL, Azure AI uzantısı OpenAI tümleştirmesi ile vektör eklemeleri oluşturma özelliklerine sahip olabilir.

Scenarios

Üretken yapay zeka, teknoloji, sağlık hizmetleri, eğlence, finans, üretim ve daha fazlası dahil olmak üzere çeşitli etki alanları ve sektörlerde çok çeşitli uygulamalara sahiptir. Üretken yapay zeka kullanarak gerçekleştirebileceğiniz bazı yaygın görevler şunlardır:

  • Anlamsal arama:
    • Üretken yapay zeka, sözcük temelli arama yerine verilerde anlamsal aramaya olanak tanır. İkincisi sorgularla tam eşleşmeleri ararken anlamsal arama, arama sorgusunun amacını karşılayan içeriği bulur.
  • Sohbet botları ve sanal yardımcılar:
    • Müşteriler için kendi kendine yardım uygulama gibi doğal bağlama duyarlı konuşmalara katılabilen sohbet botları geliştirin.
  • Öneri sistemleri:
    • Öğelerin veya kullanıcıların eklemelerini veya gösterimlerini oluşturarak öneri algoritmalarını geliştirin.
  • Kümeleme ve segmentasyon:
    • Yapay zeka tarafından oluşturulan oluşturma eklemeleri, benzer verilerin birlikte gruplanması için kümeleme algoritmalarının verileri kümelemesine olanak sağlar. Bu kümeleme, reklamverenlerin müşterilerini özniteliklerine göre farklı şekilde hedeflemesine olanak tanıyan müşteri segmentasyonu gibi senaryolara olanak tanır.
  • İçerik oluşturma:
    • Sohbet botları, roman ve şiir oluşturma ve doğal dil anlama gibi uygulamalar için insan benzeri metinler oluşturun.
    • Grafikler, eğlence ve reklam için gerçekçi görüntüler, resimler veya tasarımlar oluşturun.
    • Filmler, oyunlar ve pazarlama için videolar, animasyonlar veya video efektleri oluşturun.
    • Müzik oluşturun.
  • Çeviri:
    • Metni bir dilden başka bir dile çevirme.
  • Özetleme:
    • Önemli bilgileri ayıklamak için uzun makaleleri veya belgeleri özetleyin.
  • Veri artırma:
    • Makine öğrenmesi modellerine yönelik eğitim veri kümelerini genişletmek ve geliştirmek için ek veri örnekleri oluşturun.
    • Tıbbi görüntüleme gibi gerçek dünyada toplanması zor veya pahalı senaryolar için yapay veriler oluşturun.
  • Uyuşturucu bulma:
    • Moleküler yapılar oluşturma ve ilaç araştırmaları için olası ilaç adaylarını tahmin etmek.
  • Oyun geliştirme:
    • Düzeyler, karakterler ve dokular dahil olmak üzere oyun içeriği oluşturun.
    • Gerçekçi oyun içi ortamlar ve manzaralar oluşturun.
  • Veri ayırma ve tamamlama:
    • Temiz veri örnekleri oluşturarak gürültülü verileri temizleyin.
    • Veri kümelerindeki eksik veya eksik verileri doldurun.