Aracılığıyla paylaş


Arama sorguları ve belgeleri için eklemeler oluşturma

Azure AI Search vektörleştirme modellerini barındırmaz, bu nedenle zorluklarınızdan biri sorgu girişleri ve çıkışları için eklemeler oluşturmaktır. Desteklenen herhangi bir ekleme modelini kullanabilirsiniz, ancak bu makalede adımlar için Azure OpenAI ekleme modelleri varsayılır.

Yerleşik veri öbekleme ve vektörleştirme sağlayan tümleşik vektörleştirmeyi öneririz. Tümleşik vektörleştirme dizin oluşturuculara, beceri kümelerine ve Azure AI Search'ten harici olarak yürütülen bir modele işaret eden yerleşik veya özel becerilere bağımlıdır.

Veri öbeklemeyi ve vektörleştirmeyi kendiniz işlemek istiyorsanız, örnek depoda diğer topluluk çözümleriyle nasıl tümleştirildiğini gösteren tanıtımlar sağlarız.

Ekleme modelleri vektör sorgularında nasıl kullanılır?

  • Sorgu girişleri, sorgu işleme sırasında vektörlere dönüştürülen vektörler veya metin veya görüntülerdir. Azure AI Search'teki yerleşik çözüm vektörleştirici kullanmaktır.

    Alternatif olarak, sorgu girişini istediğiniz bir ekleme modeline geçirerek dönüştürme işlemini kendiniz de işleyebilirsiniz. Hız sınırlamasını önlemek için iş yükünüzde yeniden deneme mantığı uygulayabilirsiniz. Python tanıtımı için azmi kullandık.

  • Sorgu çıkışları, arama dizininde bulunan tüm eşleşen belgelerdir. Arama dizininiz daha önce eklenmiş bir veya daha fazla vektör alanına sahip belgelerle yüklenmiş olmalıdır. Dizin oluşturma için hangi ekleme modelini kullandıysanız kullanın, sorgular için aynı modeli kullanın.

Aynı bölgede kaynak oluşturma

Tümleşik vektörleştirme, kaynakların aynı bölgede olmasını gerektirir:

  1. Metin ekleme modeli için bölgeleri denetleyin.

  2. Azure AI Search için aynı bölgeyi bulun.

  3. Anlamsal derecelendirme içeren karma sorguları desteklemek için veya yapay zeka zenginleştirme işlem hattında özel beceri kullanarak makine öğrenmesi modeli tümleştirmesini denemek istiyorsanız, bu özellikleri sağlayan bir Azure AI Search bölgesi seçin.

Geliştirilmiş sorgu için ekleme oluşturma

Aşağıdaki Python kodu, bir vektör sorgusunun "values" özelliğine yapıştırabileceğiniz bir ekleme oluşturur.

!pip install openai

import openai

openai.api_type = "azure"
openai.api_key = "YOUR-API-KEY"
openai.api_base = "https://YOUR-OPENAI-RESOURCE.openai.azure.com"
openai.api_version = "2024-02-01"

response = openai.Embedding.create(
    input="How do I use Python in VSCode?",
    engine="text-embedding-ada-002"
)
embeddings = response['data'][0]['embedding']
print(embeddings)

Çıkış, 1.536 boyutlu bir vektör dizisidir.

Model tümleştirmesi eklemeye yönelik ipuçları ve öneriler

  • Kullanım örneklerini tanımlama: Vektör arama özellikleri için model tümleştirmesi eklemenin arama çözümünüzde değer katıştırabileceği belirli kullanım örneklerini değerlendirin. Bu, metin içeriği, çok dilli arama veya benzerlik araması içeren çok modüllü veya eşleşen resim içeriğini içerebilir.

  • Öbekleme stratejisi tasarlama: Ekleme modellerinin kabul edebildiği belirteç sayısı sınırları vardır ve bu da büyük dosyalar için veri öbekleme gereksinimi sağlar. Daha fazla bilgi için bkz . Vektör arama çözümleri için büyük belgeleri öbekle.

  • Maliyeti ve performansı iyileştirme: Vektör araması yoğun kaynak kullanımlı olabilir ve maksimum sınırlara tabidir, bu nedenle yalnızca anlamsal anlam içeren alanları vektörleştirmeyi göz önünde bulundurun. Vektör boyutunu küçülterek aynı fiyata daha fazla vektör depolayabilirsiniz.

  • Doğru ekleme modelini seçin: Metin tabanlı aramalar için sözcük eklemeler veya görsel aramalar için resim ekleme gibi belirli kullanım örneğiniz için uygun bir model seçin. OpenAI'den text-embedding-ada-002 veya Azure AI Görüntü İşleme'dan Görüntü Alma REST API'si gibi önceden eğitilmiş modelleri kullanmayı göz önünde bulundurun.

  • Vektör uzunluklarını normalleştirme: Benzerlik aramasının doğruluğunu ve performansını geliştirmek için vektör uzunluklarının arama dizininde depolamadan önce normalleştirildiğinden emin olun. Önceden eğitilmiş modellerin çoğu zaten normalleştirilmiştir, ancak tümü değildir.

  • Modelde ince ayar yapma: Gerekirse, arama uygulamanızın performansını ve ilgi düzeyini artırmak için etki alanına özgü verilerinizde seçili modele ince ayar yapın.

  • Test edin ve yineleyin: İstenen arama performansını ve kullanıcı memnuniyetini elde etmek için ekleme modeli tümleştirmenizi sürekli test edin ve geliştirin.

Sonraki adımlar