Aracılığıyla paylaş


HPC enerji ortamları için Depolama

Büyük ölçekli HPC iş yükleri, geleneksel bulut dosya sistemlerinin özelliklerini aşan veri depolama ve erişim taleplerine sahiptir.

Hangi depolama çözümünü kullanacağınıza karar vermek için uygulama gereksinimlerinizi göz önünde bulundurmanız ve tanımlamanız gereken faktörler aşağıdadır

  • Gecikme
  • IOP
  • Verim
  • Dosya boyutları ve sayısı,
  • İş çalıştırma süresi
  • Maliyetle ilişkili
  • Depolama konumu benzitesi – şirket içi ve Azure

Azure'da seçilen HPC depolamayı etkileyen faktörleri daha fazla anlamak için bkz. "Azure'da HPC depolama seçimini etkileyen faktörleri anlama".

Belirli HPC depolama sistemi seçimi için karar ağacı.

Depolama çözümü seçerken dikkat edilmesi gereken karar ağacını gösteren diyagram.

HPC Tasarımında dikkat edilmesi gerekenler

Petrol ve gaz şirketleri eksabaytlarca sismik veriyi, iyi verileri, haritaları, kiralamaları ve daha fazlasını etkili bir şekilde yönetebilmeli ve depolayabilmelidir. Bu verileri kullanmak için, üretimi iyileştirmeye, çevresel riskleri azaltmaya ve operasyonel güvenliği artırmaya yardımcı olmak için gerçek zamanlı analiz işleyebilen ve sunabilen yüksek performanslı bir altyapıya ihtiyaçları vardır.

Veri depolama ve erişim gereksinimleri, iş yükü ölçeğine bağlı olarak büyük ölçüde farklılık gösterir. Azure desteği HPC uygulamalarının hızını ve kapasitesini yönetmek için çeşitli yaklaşımlar vardır.

Enerji sektöründeki büyük ölçekli Batch ve HPC iş yükleri, geleneksel bulut dosya sistemlerinin özelliklerini aşan veri depolama ve erişim taleplerine sahiptir. Yüksek performanslı bilgi işlemin (HPC) yüksek performanslı G/Ç gereksinimleri ve yüksek ölçeklenebilirlik gereksinimleri, veri depolama ve erişim için benzersiz zorluklar sunar.

HPC, sismik ve Rezervuar simülasyonu ve modelleme gibi geleneksel bilgi işlem teknikleriyle başa çıkmak için pratik veya uygun maliyetli olmayan karmaşık sorunları çözmek için kullanılır. Bunu, büyük ve karmaşık bilgi işlem görevlerini hızlı, verimli ve güvenilir bir şekilde gerçekleştirmek için paralel işleme ve yüksek düzeyde ölçeklenebilirlik birleşimiyle yapar.

Ayrıca Azure HPC kümelerinde işlem düğümleri, kümenin atandığı işleri gerçekleştirmek için gerektiğinde artırılabilen sanal makinelerdir. Bu düğümler, HPC'nin uygulandığı karmaşık sorunları çözmek için gereken yüksek performanslı paralel işlemeyi elde etmek için hesaplama görevlerini kümeye yayar. İşlem düğümlerinin işleri yürütürken paylaşılan çalışma depolama alanında okuma/yazma işlemleri gerçekleştirmesi gerekir. Düğümlerin bu depolamaya erişme yöntemi şu iki senaryo arasında bir devamlılık oluşturur:

  • Birçok işlem düğümüne yönelik bir veri kümesi - Bu senaryoda, ağdaki tüm işlem düğümlerinin çalışan veriler için erişebileceği tek bir veri kaynağı vardır. Yapısal olarak basit olsa da, tüm G/Ç işlemleri depolama konumunun G/Ç kapasitesiyle sınırlıdır.
  • Birçok işlem düğümüne yönelik birçok veri kümesi - Bu senaryoda, ağdaki tüm işlem düğümlerinin çalışan veriler için erişebileceği tek bir veri kaynağı vardır. Yapısal olarak basit olsa da, tüm G/Ç işlemleri depolama konumunun G/Ç kapasitesiyle sınırlıdır.

HPC Tasarım Öneriler

Benzersiz G/Ç ve kapasite gereksinimlerinize en uygun çözümü seçin.

Ağ dosya sistemi (NFS)

NFS, paylaşılan depolama konumlarına erişim sağlamak için yaygın olarak kullanılır. NFS ile sunucu VM'leri yerel dosya sistemini paylaşır. Azure söz konusu olduğunda Azure Depolama'de barındırılan bir veya daha fazla sanal sabit diskte (VHD) depolanır. İstemciler daha sonra sunucunun paylaşılan dosyalarını bağlayabilir ve paylaşılan konuma doğrudan erişebilir.

Ağ Dosya Sistemi (NFS) genellikle tüm düğümlere bağlı giriş dizinleri ve proje alanı için kullanılır. Ayrıca genellikle veri paylaşan araştırma grupları için bir alan sağlayabilir. Genel olarak, aktarım hızı iş yükleri tek tek görevler arasında çok az bağımlılıkla yatay olarak ölçeklenebilir. İş zamanlayıcıları, işi düğümler arasında böler ve etkinliği koordine eder. NFS, TCP/IP ağları aracılığıyla erişilen düğümler arasında tipik paylaşılan depolama alanıdır.

NFS, kurulumu ve bakımı kolay olma avantajına sahiptir ve hem Linux hem de Windows işletim sistemlerinde desteklenir. Depolamayı bir ağa yaymak için birden çok NFS sunucusu kullanılabilir, ancak tek tek dosyalara yalnızca tek bir sunucu üzerinden erişilebilir.

Düşük ölçekli iş yükleri için gereksinimlerinize bağlı olarak büyük kısa ömürlü disklere sahip Depolama İyileştirilmiş VM veya Azure Premium Depolama ile D serisi VM'ler kullanarak baş düğümde NFS çalıştırmayı göz önünde bulundurun. Bu çözüm, 500 veya daha az çekirdeğe sahip iş yüklerine uygundur.

HPC senaryolarında, dosya sunucusu genellikle genel performansı azaltan bir performans sorunu olarak görev yapabilir. Tek bir NFS sunucusundan, belgelenen VM başına maksimum IOPS ve aktarım hızına göre daha yüksek hızlarda önbelleğe alınamayan verilere erişme girişimleri azaltmaya neden olur.

Onlarca istemcinin tek bir NFS sunucusunda depolanan veriler üzerinde çalışmaya çalıştığı bir senaryoda, bu sınırlara kolayca ulaşılabilir ve bu da uygulamanızın tüm performansının düşmesine neden olur. HPC uygulamanızın kullandığı saf bire çok senaryosuna ne kadar yakın olursa, bu sınırlamalara karşı o kadar erken çalışırsınız.

Azure'da paralel dosya sistemleri

Paralel dosya sistemleri blok düzeyinde depolamayı birden çok ağa bağlı depolama düğümü arasında dağıtır. Dosya verileri bu düğümler arasında yayılır, yani dosya verileri birden çok depolama cihazına yayılır. Bu, ortak bir ad alanı üzerinden erişilebilen birden çok depolama düğümünde tek tek depolama G/Ç isteklerini havuza alır.

Birden çok depolama cihazı ve birden çok veri yolu, yüksek düzeyde paralellik sağlamak için kullanılır ve aynı anda yalnızca tek bir düğüme erişilerek oluşan performans sorunlarını azaltır. Ancak, doğrudan API veya POSIX G/Ç Arabirimi düzeyinde çalışıyorsa paralel G/Ç'nin koordine edilmesi ve iyileştirilmesi zor olabilir. Paralel dosya sistemleri, ara veri erişimi ve koordinasyon katmanlarını kullanıma sunarak uygulama geliştiricilerine uygulama katmanı ile G/Ç katmanı arasında üst düzey bir arabirim sağlar.

Enerji MPI iş yükleri, düğümler arasında düşük gecikme süreli iletişim gereksinimiyle benzersiz gereksinimlere sahiptir. Düğümler yüksek hızlı bağlantı yoluyla bağlanır ve diğer iş yükleriyle paylaşılamaz. MPI uygulamaları, sanallaştırılmış ortamlarda Geçiş modunu kullanarak yüksek performanslı bağlantıların tamamında kullanılır. MPI düğümleri için Depolama genellikle Yüksek hızlı bağlantı üzerinden de erişilen Lustre gibi paralel bir dosya sistemidir. Lustre/BeeGFS genellikle öncelikle sismik işlemenin (aynı zamanda rezervuar simülasyonu) büyük aktarım hızı gereksinimlerini karşılamak için kullanılır.

Lustre gibi paralel dosya sistemleri, büyük dosyalara, birden çok işlem düğümünden eşzamanlı erişime ve çok miktarda veriye erişim gerektiren HPC enerji iş yükleri için kullanılır. Paralel dosya sistemlerinin uygulanması, yetenek ve performans açısından ölçeklendirmeyi kolaylaştırır. Bu tür dosya sistemleri, büyük bant genişliğine ve daha az CPU kullanımına sahip RDMA aktarımlarından yararlanılır. Paralel dosya sistemi genellikle karalama alanı olarak kullanılır ve iyileştirilmiş G/Ç gerektiren çalışma için tasarlanmıştır. örnek olarak iş yükü kurulumu, ön işleme, çalıştırma ve işlem sonrası verilebilir.

Azure Managed Lustre gibi yönetilen bir paralel dosya hizmeti kullanmak, 500 GB/sn'ye kadar okuma/yazma hızları ve 2,5 PB depolama alanı ile 50.000 veya daha fazla çekirdek için çalışır.

Azure'da Paralel Sanal dosya sistemi hakkında daha fazla bilgi için bkz . Microsoft Azure'da Paralel Sanal Dosya Sistemleri - Bölüm 1: Genel Bakış - Microsoft Teknoloji Topluluğu.

  • Azure NetApp Files ve yerel diskler genellikle sismik yorumlama, model hazırlama ve görselleştirme gibi gecikme süresine/IOPS'ye duyarlı iş yüklerini işlemek için kullanılır. 6,5 GiB/sn'ye kadar aktarım hızına sahip 4.000 çekirdeğe kadar olan iş yüklerini ve aynı veri kümesine çok protokollü (NFS/SMB) erişimimizden yararlanan iş yüklerini kullanmayı göz önünde bulundurun.
  • Azure Managed Lustre, HPC iş yükleri için daha hızlı ve daha yüksek kapasitede depolama sağlar. Bu çözüm orta ve çok büyük iş yükleri için çalışır ve 500 GB/sn'ye kadar aktarım hızı ve 2,5 PiB'a kadar depolama kapasitesi ile 50.000 veya daha fazla çekirdeği destekleyebilir.
  • Standart veya Premium Blob, en düşük maliyetli bulut teklifi olan uygun maliyetli bir tekliftir. Bu hizmet gerektiğinde eksabayt ölçeği, yüksek aktarım hızı, düşük gecikme süresi erişimi, tanıdık dosya sistemi ve çok protokollü erişim (REST, HDFS, NFS) sağlar. Yüksek aktarım hızı için blob hizmet uç noktasında NFS v3.0'ı kullanabilir ve ağır iş yüklerini okuyabilirsiniz. Son güncelleştirme/son erişim süresiyle yaşam döngüsü yönetimi, özelleştirilebilir ilkelerle akıllı katmanlama özelliğiyle daha serin katmanlara geçerek maliyetleri iyileştirebilirsiniz.
  • Petrol ve Gaz enerji iş yükleri ayrıca şirket içinden Bulut'a büyük veri boyutu ve hacim aktarım mekanizması gerektirebilir ve bunun tersi de
    • Çevrimdışı - cihaz tabanlı geçiş (DataBox)
    • Çevrimiçi - ağ üzerinden (ExpressRoute) tabanlı geçiş.

Sonraki adımlar

Aşağıdaki makale listesi, enerji HPC ortamları için bulut benimseme senaryosunda başarılı olmanıza yardımcı olmak için bulut benimseme yolculuğu boyunca belirli noktalarda bulunan yönergelere götürür.