Hızlı Başlangıç: Azure portalında bilgi deposu oluşturma
Bu hızlı başlangıçta, Azure AI Search'teki yapay zeka zenginleştirme işlem hattından oluşturulan çıkış için depo görevi görecek bir bilgi deposu oluşturacaksınız. Bilgi deposu, oluşturulan içeriği Azure Depolama'da arama dışındaki iş yükleri için kullanılabilir hale getirir.
İlk olarak, Azure Depolama'da bazı örnek veriler ayarlarsınız. Ardından, veri içeri aktarma sihirbazını çalıştırarak bilgi deposu da oluşturan bir zenginleştirme işlem hattı oluşturursunuz. Bilgi deposu, veri kaynağından çekilen özgün kaynak içeriği (bir otelin müşteri incelemeleri) yanı sıra yaklaşım etiketi, anahtar ifade ayıklama ve İngilizce olmayan müşteri yorumlarının metin çevirisini içeren yapay zeka tarafından oluşturulan içeriği içerir.
Önkoşullar
Başlamadan önce aşağıdaki önkoşulları uygulayın:
Etkin aboneliği olan bir Azure hesabı. Ücretsiz hesap oluşturun.
Azure AI Arama. Bir hizmet oluşturun veya hesabınızda mevcut bir hizmeti bulun. Bu hızlı başlangıç için ücretsiz bir hizmet kullanabilirsiniz.
Azure Depolama. Bir hesap oluşturun veya var olan bir hesabı bulun. Hesap türü StorageV2 (genel amaçlı V2) olmalıdır.
Azure Depolama'da barındırılan örnek veriler:
HotelReviews_Free.csv indirin. Bu CSV tek bir otel hakkında 19 müşteri geri bildirimi içerir (Kaggle.com kaynaklanır). Dosya, diğer örnek verileri içeren bir depoda yer alır. Deponun tamamını istemiyorsanız ham içeriği kopyalayın ve cihazınızdaki bir elektronik tablo uygulamasına yapıştırın.
Dosyayı Azure Depolama'daki bir blob kapsayıcısına yükleyin.
Bu hızlı başlangıçta yapay zeka zenginleştirmesi için Azure AI hizmetleri de kullanılır. İş yükü çok küçük olduğundan, Azure yapay zeka hizmetleri 20 adede kadar işlem için ücretsiz işleme için arka planda işlenir. Bu, ek bir Azure AI çoklu hizmet kaynağı oluşturmak zorunda kalmadan bu alıştırmayı tamamlayabileceğiniz anlamına gelir.
Sihirbazı başlatma
Azure hesabınızla Azure portalında oturum açın.
Arama hizmetinizi bulun ve Genel Bakış sayfasında, dört adımda bilgi deposu oluşturmak için komut çubuğunda verileri içeri aktar'ı seçin.
1. Adım: Veri kaynağı oluşturma
Veriler bir CSV dosyasında birden çok satır olduğundan ayrıştırma modunu her satır için bir arama belgesi alacak şekilde ayarlayın.
Verilerinize bağlanın bölümünde Azure Blob Depolama'ı seçin.
Ad alanına "hotel-reviews-ds" yazın.
Verilerin ayıklanması için İçerik ve Meta Veriler'i seçin.
Ayrıştırma modu için Sınırlandırılmış metin'i seçin ve ardından İlk Satır Üst Bilgi İçerir onay kutusunu seçin. Sınırlayıcı karakterinin virgül (,) olduğundan emin olun.
Depolama hesabı aynı abonelikteyse, Bağlantı Dizesi'nde mevcut bir bağlantıyı seçin. Aksi takdirde Azure Depolama hesabınıza bir bağlantı dizesi yapıştırın.
Bir bağlantı dizesi tam erişimli olabilir ve aşağıdaki biçime sahip olabilir:
DefaultEndpointsProtocol=https;AccountName=<YOUR-ACCOUNT-NAME>;AccountKey=<YOUR-ACCOUNT-KEY>;EndpointSuffix=core.windows.net
Bağlantı dizesi, Azure Depolama'da yapılandırılmış ve atanmış bir rol olduğu varsayılarak yönetilen kimliğe başvurabilir:
ResourceId=/subscriptions/<YOUR-SUBSCRIPTION-ID>/resourceGroups/<YOUR-RESOURCE-GROUP-NAME>/providers/Microsoft.Storage/storageAccounts/<YOUR-ACCOUNT-NAME>;
Kapsayıcılar'da, verileri tutan blob kapsayıcısının adını ("hotel-reviews") girin.
Sayfanız aşağıdaki ekran görüntüsüne benzer görünmelidir.
Sonraki sayfaya geçin.
2. Adım: Beceri ekleme
Bu sihirbaz adımında yapay zeka zenginleştirme becerileri ekleyin. Kaynak veriler, İngilizce ve Fransızca müşteri incelemelerinden oluşur. Bu veri kümesiyle ilgili beceriler arasında anahtar tümcecik ayıklama, yaklaşım algılama ve metin çevirisi yer alır. Sonraki bir adımda, bu zenginleştirmeler bir bilgi deposuna Azure tabloları olarak "yansıtılır".
Azure AI hizmetlerini ekleme seçeneğini genişletin. Ücretsiz (Sınırlı zenginleştirmeler) varsayılan olarak seçilidir. HotelReviews-Free.csv'daki kayıt sayısı 19 olduğundan ve bu ücretsiz kaynak günde en fazla 20 işleme izin verdiğinden bu kaynağı kullanabilirsiniz.
Zenginleştirme ekle'yi genişletin.
Skillset adı için "hotel-reviews-ss" yazın.
Kaynak veri alanı için reviews_text'ı seçin.
Zenginleştirme ayrıntı düzeyi için Sayfalar 'ı (5000 karakter öbekleri) seçin.
Metin Bilişsel Becerileri için aşağıdaki becerileri seçin:
- Anahtar ifadeleri ayıklama
- Metin çevirme
- Dil algılama
- Yaklaşımı algılama
Sayfanız aşağıdaki ekran görüntüsü gibi görünmelidir:
Ekranı aşağı kaydırın ve Zenginleştirmeleri bilgi deposuna kaydet'i genişletin.
Var olan bir bağlantıyı seçin'i ve ardından bir Azure Depolama hesabı seçin. Projeksiyonlar için bir kapsayıcı oluşturabilmeniz için Kapsayıcılar sayfası görüntülenir. Kaynak içerik ve bilgi deposu içeriği arasında ayrım yapmak için "kstore-hotel-reviews" gibi bir ön ek adlandırma kuralı benimsemenizi öneririz.
Verileri içeri aktarma sihirbazına döndüğünüzde aşağıdaki Azure tablosu projeksiyonlarını seçin. Sihirbaz her zaman Belgeler projeksiyonunu sunar. Seçtiğiniz becerilere (Anahtar ifadeler gibi) veya zenginleştirme ayrıntı düzeyine (Sayfalar) bağlı olarak diğer projeksiyonlar sunulur:
- Belgeler
- Sayfalar
- Anahtar ifadeler
Aşağıdaki ekran görüntüsünde sihirbazdaki tablo projeksiyon seçimleri gösterilmektedir.
Sonraki sayfaya geçin.
3. Adım: Dizini yapılandırma
Bu sihirbaz adımında, isteğe bağlı tam metin arama sorguları için bir dizin yapılandırın. Bilgi deposu için arama dizinine ihtiyacınız yoktur, ancak dizin oluşturucunun çalışması için bir dizin gerekir.
Bu adımda sihirbaz, alanları ve veri türlerini çıkarsamak için veri kaynağınızı örneklemektedir. Yalnızca istediğiniz davranış için öznitelikleri seçmeniz gerekir. Örneğin, Alınabilir özniteliği arama hizmetinin bir alan değeri döndürmesine izin verirken, Aranabilir özniteliği alanda tam metin aramayı etkinleştirir.
Dizin adı olarak "hotel-reviews-idx" yazın.
Öznitelikler için varsayılan seçimleri kabul edin: İşlem hattının oluşturduğu yeni alanlar için Alınabilir ve Aranabilir .
Dizininiz aşağıdaki görüntüye benzer görünmelidir. Liste uzun olduğundan, görüntüde tüm alanlar görünmez.
Sonraki sayfaya geçin.
4. Adım: Dizin oluşturucuyu yapılandırma ve çalıştırma
Bu sihirbaz adımında, önceki sihirbaz adımlarında tanımladığınız veri kaynağını, beceri kümesini ve dizini bir araya getiren bir dizin oluşturucu yapılandırın.
Ad alanına "hotel-reviews-idxr" yazın.
Zamanlama için varsayılan Bir Kez'i değiştirmeyin.
Dizin oluşturucuyu çalıştırmak için Gönder'i seçin. Veri ayıklama, dizin oluşturma, bilişsel becerilerin uygulanması bu adımda gerçekleşir.
5. Adım: Durumu denetleme
Genel Bakış sayfasında, sayfanın ortasındaki Dizin Oluşturucular sekmesini açın ve hotels-reviews-idxr öğesini seçin. Bir veya iki dakika içinde, durum sıfır hata ve uyarıyla "Devam ediyor" durumundan "Başarılı" durumuna geçmelidir.
Azure portalında tabloları denetleme
Azure portalında bilgi depoyu oluşturmak için kullanılan Depolama hesabını açın.
Yeni tabloları görüntülemek için depolama hesabının sol gezinti bölmesinde Depolama tarayıcısı'nı seçin.
"Zenginleştirme ekle" sayfasının "Zenginleştirmeleri kaydet" bölümünde sunulan her projeksiyon için bir tane olan üç tablo görmeniz gerekir.
"hotelReviewssDocuments", belgenin koleksiyon olmayan zenginleştirme ağacının ilk düzey düğümlerinin tümünü içerir.
"hotelReviewssKeyPhrases" tüm incelemelerden ayıklanan anahtar ifadelerin uzun bir listesini içerir. Anahtar ifadeler ve varlıklar gibi koleksiyonların (dizilerin) çıkışını tek başına bir tabloya gönderen beceriler.
"hotelReviewssPages", belgeden ayrılan her sayfa üzerinde oluşturulan zenginleştirilmiş alanlar içerir. Bu beceri kümesinde ve veri kaynağında, yaklaşım etiketlerinden ve çevrilmiş metinlerden oluşan sayfa düzeyinde zenginleştirmeler. Beceri kümesi tanımında "sayfalar" ayrıntı düzeyini seçtiğinizde sayfalar tablosu (veya belirli bir ayrıntı düzeyi belirtirseniz bir cümle tablosu) oluşturulur.
Bu tabloların tümü, diğer araçlarda ve uygulamalarda tablo ilişkilerini desteklemek için kimlik sütunları içerir. Tabloyu açtığınızda, işlem hattı tarafından eklenen içerik alanlarını görüntülemek için bu alanları kaydırın.
Bu hızlı başlangıçta, "hotelReviewssPages" tablosu aşağıdaki ekran görüntüsüne benzer görünmelidir:
Temizleme
Kendi aboneliğinizde çalışırken, projenin sonunda oluşturduğunuz kaynaklara hala ihtiyacınız olup olmadığını belirlemek iyi bir fikirdir. Çalışır durumda bırakılan kaynaklar maliyetlerin artmasına neden olabilir. Kaynakları teker teker silebilir veya tüm kaynak grubunu silerek kaynak kümesinin tamamını kaldırabilirsiniz.
Sol gezinti bölmesindeki Tüm kaynaklar veya Kaynak grupları bağlantısını kullanarak kaynakları portalda bulabilir ve yönetebilirsiniz.
Ücretsiz bir hizmet kullanıyorsanız üç dizin, dizin oluşturucu ve veri kaynağıyla sınırlı olduğunuzu unutmayın. Sınırın altında kalmak için portaldaki tek tek öğeleri silebilirsiniz.
İpucu
Bu alıştırmayı tekrarlamak veya farklı bir yapay zeka zenginleştirme kılavuzu denemek istiyorsanız, yeniden oluşturmak için hotel-reviews-idxr dizin oluşturucuyu ve ilgili nesneleri silin. Dizin oluşturucunun silinmesi, ücretsiz günlük işlem sayacını sıfıra sıfırlar.
Sonraki adımlar
Artık bir bilgi deposuyla tanışdığınıza göre REST API kılavuzuna geçerek her adıma daha yakından bakın. Sihirbazın dahili olarak işlediği görevler REST kılavuzunda açıklanmıştır.