Aracılığıyla paylaş


Azure AI Search'te güvenilirlik

Azure AI Search , heterojen içeriğin dizinini oluşturan ve API'ler, uygulamalar ve yapay zeka aracıları aracılığıyla alma olanağı sağlayan ölçeklenebilir bir arama altyapısıdır. Sohbet tamamlama modelleri aracılığıyla dinamik içerik oluşturma gerektiren kurumsal arama senaryoları ve yapay zeka destekli müşteri deneyimleri için uygundur. Bir Azure hizmeti olarak, AI Search güvenilirlik gereksinimlerinizi desteklemek için çeşitli özellikler sağlar.

Azure'ı kullandığınızda güvenilirlik paylaşılan bir sorumluluktır. Microsoft, dayanıklılık ve kurtarmayı desteklemek için çeşitli özellikler sunar. Bu özelliklerin kullandığınız tüm hizmetler içinde nasıl çalıştığını anlamak ve iş hedeflerinize ve çalışma süresi hedeflerinize ulaşmak için ihtiyacınız olan özellikleri seçmek sizin sorumluluğunuzdadır.

Bu makalede, Azure AI Search'ün geçici hatalar, kullanılabilirlik alanı kesintileri, bölge kesintileri ve hizmet bakımı gibi çeşitli olası kesintilere ve sorunlara karşı nasıl dayanıklı hale getirilmeye başlandığı açıklanır. Ayrıca diğer sorun türlerinden kurtarmak için yedeklemeleri nasıl kullanabileceğinizi açıklar ve Azure AI Search hizmet düzeyi sözleşmesi (SLA) hakkında bazı önemli bilgileri vurgular.

Güvenilirlik için üretim dağıtımı önerileri

Üretim iş yükleri için şunları yapmanızı öneririz:

  • En az iki çoğaltması olan faturalanabilir bir katman kullanın. Bu yapılandırma, arama hizmetinizi geçici hatalara ve bakım işlemlerine karşı daha dayanıklı hale getirir. Ayrıca yapay zeka araması için hizmet düzeyi sözleşmesini (SLA) da karşılar. SLA, yalnızca okuma iş yükleri için iki çoğaltma ve okuma-yazma iş yükleri için üç veya daha fazla çoğaltma talep eder.
  • Üretim kullanımı için Ücretsiz katmanı kullanmayın. AI Search, Ücretsiz katmanı için yedek sayısı bir ile sınırlı olan bir SLA sağlamaz.

Güvenilirlik mimarisine genel bakış

Yapay Zeka Arama'yı kullandığınızda bir arama hizmeti oluşturursunuz. Her arama hizmeti, aranabilir içeriğinizi depolayan birçok arama dizinini destekler.

AI Search birincil veri deposu olarak tasarlanmamıştır. Bunun yerine, arama hizmetinizi dış veri kaynaklarına bağlamak için dizin oluşturucuları kullanırsınız. Dizin oluşturucu kaynak verileri tarar, işleme ve zenginleştirme gerçekleştiren becerileri çağırır ve dizininizi beceri çıkışlarıyla doldurur.

Hizmetiniz için çoğaltma sayısını da yapılandırabilirsiniz. AI Arama’da, replika hizmetinizin arama motorunun bir kopyasıdır. Bir çoğaltmayı, tek bir sanal makineyi (VM) temsil eden bir nesne olarak düşünebilirsiniz. Her arama hizmetinin 1 ile 12 arasında replikası olabilir.

Birden çok çoğaltmanın eklenmesi yapay zeka aramasının şunları yapmasına olanak tanır:

  • Arama hizmetinizin kullanılabilirliğini artırın.

  • Bir çoğaltmada bakım yaparken, diğer çoğaltmalarda sorgular çalışmaya devam eder.

  • Daha yüksek dizin oluşturma ve sorgu iş yüklerini işleme.

  • Bölgeniz destekliyorsa farklı erişilebilirlik bölgelerinde replika sağlamaya çalışarak dayanıklılığı geliştirin.

AI Search otomatik olarak bir çoğaltmayı birincil çoğaltma olarak atar. Yazma işlemlerinin tümü bu kopya üzerinde gerçekleştirilir. Diğer replikalar okuma işlemleri için kullanılır.

Aşağıdaki diyagramda üç çoğaltması olan bir arama hizmetinin üç kullanılabilirlik alanına nasıl yayılabileceği gösterilmektedir:

Üç çoğaltması olan bir Yapay Zeka Arama hizmetini gösteren diyagram. Okuma işlemleri tüm çoğaltmalara, yazma işlemleri ise birincil çoğaltmaya gönderilir.

Ayrıca, arama dizinlerinin kullandığı depolama alanını temsil eden bölüm sayısını da yapılandırabilirsiniz.

Çoğaltma ve bölüm eklemenin etkisini anlamak önemlidir çünkü bunların her biri okuma ve yazma performansını farklı şekillerde etkiler. Çoğaltmalar (kopyalar) ve parçalar (bölümler) hakkında daha fazla bilgi için bkz. Arama hizmetinin kapasitesini tahmin ve yönetme.

Geçici hatalara dayanıklılık

Geçici hatalar, bileşenlerde kısa ve aralıklı hatalardır. Bunlar genellikle bulut gibi dağıtılmış bir ortamda gerçekleşir ve işlemlerin normal bir parçasıdır. Geçici hatalar kısa bir süre sonra kendilerini düzeltmektedir. Uygulamalarınızın genellikle etkilenen istekleri yeniden deneyerek geçici hataları işleyebileceği önemlidir.

Bulutta barındırılan tüm uygulamalar, bulutta barındırılan API'ler, veritabanları ve diğer bileşenlerle iletişim kurarken Azure geçici hata işleme yönergelerini izlemelidir. Daha fazla bilgi için bkz Geçici hataları ele alma önerileri.

AI Search dizin oluşturucuları yerleşik geçici hata işlemeye sahiptir. Bir veri kaynağı kısa bir süre kullanılamıyorsa, dizin oluşturucu kurtarılıp yeniden denenecek şekilde tasarlanmıştır. Başarıyla dizine alınan son belgeden dizin oluşturmayı sürdürmek için değişiklik izlemeyi kullanır.

Arama hizmetleri standart, zamanlanmamış bakım işlemleri sırasında geçici hatalarla karşılaşabilir. Azure AI Search önceden bildirim sağlamaz veya belirli zamanlarda bakım zamanlaması yapılmasına izin vermez. Tek yedekli hizmetler için bile kapalı kalma sürelerini en aza indirmek için her çaba gösteriliyor olsa da, kısa kesintiler meydana gelebilir. Bu geçici hatalara karşı dayanıklılığı artırmak için iki veya daha fazla çoğaltma kullanmanızı öneririz.

AI Search ile etkileşim kuran herhangi bir uygulama oluşturursanız, bunlar geçici hataları işlemelidir. Hem okuma hem de yazma işlemleri için üstel geri çekilme stratejisi ile bir yeniden deneme stratejisi kullanın.

Kullanılabilirlik alanı hatalarına dayanıklılık

Kullanılabilirlik alanları , bir Azure bölgesi içindeki veri merkezlerinin fiziksel olarak ayrı gruplarıdır. Bir bölge başarısız olduğunda hizmetler kalan bölgelerden birine devredilebilir.

AI Search alan yedekliliği sağlanmış olarak çalışır, bu da çoğaltmalarınızın arama hizmeti bölgesindeki birden çok kullanılabilirlik alanına dağıtıldığı anlamına gelir.

Hizmetinize iki veya daha fazla çoğaltma eklediğinizde, AI Search her çoğaltmayı farklı bir kullanılabilirlik alanına yerleştirmeyi dener. Kullanılabilir bölgelerden daha fazla çoğaltması olan hizmetler için çoğaltmalar bölgeler arasında mümkün olduğunca eşit bir şekilde dağıtılır.

Aşağıdaki diyagramda, dört çoğaltmaya sahip örnek bir arama hizmetinin üç kullanılabilirlik alanına nasıl dağıtılacağı gösterilmektedir:

Üç erişilebilirlik bölgesine dağıtılmış dört replika içeren bir Yapay Zeka Arama hizmetini gösteren diyagram.

Önemli

Yapay Zeka Araması, kopyaların tam olarak konumlandırılmasını garanti etmez. Yerleştirme, kapasite kısıtlamalarına, ölçeklendirme işlemlerine ve diğer faktörlere tabidir.

Gereksinimler

Arama hizmetiniz aşağıdaki ölçütlerin tümünü karşıladığında alanlar arası yedeklilik otomatik olarak etkinleştirilir:

  • Bölge desteği: Kullanılabilirlik alanları desteği altyapıya ve depolamaya bağlıdır. Desteklenen bölgelerin listesi için bkz. AI Araması için bölge seçme.

  • Katmanı: Hizmetiniz Temel katmanda veya daha yüksek bir katmanda olmalıdır

  • Çoğaltma sayısı: Hizmetinizde en az iki çoğaltma olmalıdır

    Uyarı

    AI Search, iki veya daha fazla çoğaltmaya sahip olduğunuzda, bu çoğaltmaları birden çok bölgeye dağıtmaya çalışır. Ancak, okuma-yazma iş yükleri için mümkün olan en yüksek kullanılabilirlik SLA'sını almak için üç veya daha fazla çoğaltma kullanmanız gerekir.

Bölgeler arasında örnek dağıtımı

AI Search, replikaları farklı erişilebilirlik alanlarına yerleştirmeye çalışır. Ancak, ara sıra bir arama hizmetinin tüm çoğaltmalarının aynı kullanılabilirlik alanına yerleştirilebileceği durumlar vardır. Hizmetinizden çoğaltmaları kaldırdığınızda, örneğin hizmetinizi daha az çoğaltma kullanacak şekilde yapılandırarak ölçek azalttığınızda bu durum oluşabilir. Çoğaltma kaldırılması, kalan çoğaltmaların kullanılabilirlik alanları arasında yeniden dengelenmesini tetiklemez.

Tüm çoğaltmalarınızın tek bir kullanılabilirlik bölgesine yerleştirilmesi olasılığını azaltmak için, ölçek küçültme işleminden hemen sonra bir ölçeği genişletme işlemini manuel olarak başlatabilirsiniz. Örneğin, arama hizmetinizin 10 kopyası olduğunu ve kopya sayısını 7'ye düşürmek istediğinizi varsayalım. Tek bir ölçeklendirme işlemi gerçekleştirmek yerine geçici olarak 6 örneğe ölçeklendirin ve ardından bölge yeniden dengelemeyi tetiklemek için hemen 7 örneğe ölçeklendirin.

Maliyet

Her arama hizmeti bir replika ile başlar. Bölge yedekliliği iki veya daha fazla kopya gerektirir ve bu da hizmeti çalıştırma maliyetini artırır. Replikaların faturalama üzerindeki etkilerini anlamak için fiyatlandırma hesaplayıcısı kullanın.

Kullanılabilirlik alanı desteğini yapılandırma

Arama hizmetiniz alanlar arası yedeklilik gereksinimlerini karşılıyorsa ek yapılandırma gerekmez. Mümkün olduğunda Yapay Zeka Arama, çoğaltmalarınızı farklı kullanılabilirlik alanlarına yerleştirmeye çalışır.

Kapasite planlaması ve yönetimi

Kullanılabilirlik alanı hatasına hazırlanmak için çoğaltma sayısını fazla sağlamayı göz önünde bulundurun. Fazla sağlama, arama hizmetinin bazı kapasite kayıplarını tolere etmesine ve performansı düşürmeden çalışmaya devam etmesine olanak tanır. Kesinti sırasında çoğaltma eklemek zordur, bu nedenle fazla sağlama, kapasite azaldığında bile arama hizmetinizin normal istek hacimlerini işleyebilmesini sağlamaya yardımcı olur. Daha fazla bilgi için bkz. Fazla sağlama yaparak kapasiteyi yönetme.

Tüm bölgeler sağlıklı olduğunda davranış

Bu bölümde, arama hizmetleri alanlar arası yedeklilik için yapılandırıldığında ve tüm kullanılabilirlik alanları çalışır durumda olduğunda neler bekleyebileceğiniz açıklanmaktadır.

  • Bölgeler arasında trafik yönlendirme: AI Search, tüm kullanılabilir çoğaltmalarda tüm sorguların ve yazma işlemlerinin otomatik yük dengelemesini gerçekleştirir. AI Search, herhangi bir kullanılabilirlik alanındaki herhangi bir çoğaltmaya okuma işlemleri gönderebilir. Yazma işlemlerini Yapay Zeka Arama Hizmetinin seçtiği tek bir ana kopyaya gönderir.

  • Bölgeler arasında veri çoğaltma: Verilerdeki değişiklikler, kullanılabilirlik alanları arasında çoğaltmalar arasında otomatik olarak çoğaltılır. Zaman uyumsuz olarak çoğaltma gerçekleşir, yani yazma işlemleri diğer yedeklere çoğaltılmadan önce bir birincil yedeğe taahhüt edilir.

Bölge hatası sırasındaki davranış

Bu bölümde, arama hizmetleri alanlar arası yedeklilik için yapılandırıldığında ve kullanılabilirlik alanı kesintisi oluştuğunda neler bekleyebileceğiniz açıklanmaktadır.

  • Algılama ve yanıt: Yapay Zeka Arama, kullanılabilirlik alanındaki bir hatayı algılamaktan sorumludur. Bölge yük devretmesini başlatmak için herhangi bir işlem yapmanız gerekmez.
  • Bildirim: Bir bölge kapatıldığında Microsoft sizi otomatik olarak bilgilendirmez. Ancak, tek bir kaynağın durumunu izlemek için Azure Kaynak Durumu'nı kullanabilir ve sorunları size bildirmek için Kaynak Durumu uyarıları ayarlayabilirsiniz. Azure Hizmet Durumu'nı , bölge hataları dahil olmak üzere hizmetin genel durumunu anlamak için de kullanabilir ve sorunları size bildirmek için Hizmet Durumu uyarıları ayarlayabilirsiniz.
  • Etkin istekler: Çoğaltmaların başarısız bölgede işlenmesine yönelik istekler sonlandırılır. İstemciler , geçici hataları işleme yönergelerini izleyerek istekleri yeniden denemelidir.

  • Beklenen veri kaybı: Etkilenen kullanılabilirlik alanı yalnızca okuma amaçlı çoğaltmalar içeriyorsa veri kaybı beklenmiyordur.

    Birincil replika, etkilenen bölgede olduğu için kaybolursa, henüz çoğaltılmamış yazma işlemleri kaybolabilir.

  • Beklenen kesinti süresi: Çoğu durumda, diğer erişilebilirlik bölgelerindeki okuma replikaları isteklere hizmet etmeye devam ettiğinden, bir bölge arızasının okuma işlemleri için arama hizmetinizin kesintiye uğramasını beklemiyoruz.

    Birincil çoğaltma etkilenen bölgede olduğu için kaybolursa, AI Search otomatik olarak başka bir çoğaltmayı yeni birincil olacak şekilde yükselterek yazma işlemlerinin sürdürülebilmesini sağlar. Kopya yükseltmesinin gerçekleşmesi genellikle birkaç saniye sürer. Bu süre boyunca yazma işlemleri başarılı olmayabilir. Geçici hata işleme yönergelerini izleyerek uygulamalarınızın hazır olduğundan emin olun.

    Ancak, arama hizmetinizin tüm çoğaltmalarının tek bir kullanılabilirlik alanında olması olası olmayan bazı durumlar vardır. Bu senaryoda, bölge kurtarılana kadar kapalı kalma süresiyle karşılaşabilirsiniz. Daha fazla bilgi edinmek ve geçici çözümü anlamak için Örnek dağıtımı bölümüne bakın.

  • Trafik yeniden yönlendirme: Bir bölge başarısız olduğunda, AI Search hatayı algılar ve istekleri hayatta kalan bölgelerdeki etkin çoğaltmalara yönlendirir. Birincil replik kaybolursa, başka bir replik yeni birincil olarak yükseltilir.

Bölge kurtarma

Kullanılabilirlik bölgesi kurtarıldığında, AI Search normal operasyonları otomatik olarak yeniden başlatır ve trafiği, kurtarılan bölge de dahil, tüm bölgelerdeki kullanılabilir replikalara yönlendirmeye başlar.

Bölge hataları için test

AI Search, alanlar arası yedekli hizmetler için trafik yönlendirmesini yönetir. Herhangi bir bölge arıza sürecini başlatmanız veya doğrulamanız gerekmez.

Bölge genelindeki hatalara dayanıklılık

AI Search tek bölgeli bir hizmettir. Bölge kullanılamaz duruma gelirse, arama hizmetiniz de kullanılamaz duruma gelir.

Dayanıklılık için özel çok bölgeli çözümler

İsteğe bağlı olarak farklı bölgelerde birden çok AI Search hizmeti dağıtabilirsiniz. Her bölgede ayrı hizmetler dağıtmak ve yapılandırmak sizin sorumluluğundadır. Çok bölgeli mimari kullanan ikincil bir Azure bölgesinde aynı dağıtımı oluşturursanız, uygulamanız tek bölgeli olağanüstü durumlara karşı daha az duyarlı hale gelir.

Bu yaklaşımı uyguladığınızda, son uygulama durumunu kurtarmak için dizinleri bölgeler arasında eşitlemeniz gerekir. Yük dengeleme ve yük devretme ilkelerini de yapılandırmanız gerekir.

Genel çözümünüzün performansını iyileştirmek için veri kaynaklarınızın salt okunur çoğaltmalarında dizin oluşturma fırsatı arayın. Örneğin, bazı indeksleyiciler coğrafi olarak dağıtılmış bir veri kaynağının okuma replikalarından veri okumayı destekler.

Daha fazla bilgi için bkz. Azure AI Search'te çok bölgeli dağıtımlar.

Yedekleme ve geri yükleme

AI Search birincil veri depolama çözümü olmadığından self servis yedekleme ve geri yükleme seçenekleri sağlamaz. Bununla birlikte, dizin tanımınızı ve belgelerini daha sonra dizini geri yüklemek için kullanılan bir dizi JSON dosyasına yedeklemek için index-backup-restore veya Python örneğini kullanabilirsiniz.

Ancak, dizini yanlışlıkla silerseniz ve yedeğiniz yoksa dizini yeniden oluşturabilirsiniz. Yeniden derleme, arama hizmetinizde dizini yeniden oluşturmayı ve ardından birincil veri deponuzdan veri alarak yeniden yüklemeyi içerir.

Hizmet düzeyi sözleşmesi

Azure hizmetleri için hizmet düzeyi sözleşmesi (SLA), her hizmetin beklenen kullanılabilirliğini ve bu kullanılabilirlik beklentisini elde etmek için çözümünüzün karşılaması gereken koşulları açıklar. Daha fazla bilgi için çevrimiçi hizmetler için SLA'lar sayfasına bakın.

AI Search'te kullanılabilirlik SLA'sı aşağıdaki arama hizmetleri için geçerlidir:

  • Faturalanabilir katman kullanacak şekilde yapılandırılmıştır.
  • Salt okunur yükler (sorgular) için en az iki kopyaya sahip olun.
  • Yazma-okuma iş yükleri (sorgular ve dizin oluşturma) için en az üç çoğaltmaya sahip olun.