Aracılığıyla paylaş


Çevrimiçi analitik işleme

Çevrimiçi analitik işleme (OLAP), karmaşık hesaplamalar ve eğilim analizi gerçekleştirmek için büyük iş veritabanlarını düzenleyen bir teknolojidir. Bu yöntem, işlem sistemlerini kesintiye uğratmadan karmaşık sorgular sağlar.

İş işlemleri ve kayıtları, tek tek kayıt girişleri için iyileştirilmiş çevrimiçi işlem işleme (OLTP) veritabanları olarak bilinen veritabanlarında depolanır. Bu veritabanları değerli bilgiler içerir, ancak analiz için tasarlanmamıştır, bu nedenle veri alımı zaman alır ve zordur.

Olap sistemleri bu sorunu çözmek için verilerden iş zekasını verimli bir şekilde ayıklar. OLAP veritabanları yoğun okuma ve düşük yazma görevleri için iyileştirilmiştir. Etkili analiz için veriler önce modellenmiş, ardından temizlenmiştir. OLAP veritabanları genellikle zaman serisi analizi için geçmiş verileri korur.

OLAP sistemleri, verileri karmaşık sorguları ve çözümlemeyi destekleyecek şekilde düzenlemek için geleneksel olarak çok boyutlu veri küpleri kullanır. Aşağıdaki diyagramda geleneksel bir OLAP sistem mimarisi gösterilmektedir.

Azure'da Analysis Services kullanan geleneksel OLAP mantıksal mimarisini gösteren diyagram.

Teknoloji ilerledikçe ve hem veri hem de hesaplama ölçekleri arttıkça, OLAP sistemleri Microsoft Fabric'in desteklediği yüksek düzeyde paralel işleme (MPP) mimarilerine geçiş yapabilir. Daha fazla bilgi için bkz Fabric analitik veri deposu.

Aşağıdaki diyagramda modern bir OLAP sistem mimarisi gösterilmektedir.

Azure'da Doku kullanan modern bir OLAP mantıksal mimarisini gösteren diyagram.

Anlam modelleme

Anlamsal veri modeli, içerdiği veri öğelerinin anlamını açıklayan kavramsal bir modeldir. Kuruluşların genellikle öğeler için kendi terimleri vardır ve bazen bu terimlerin eş anlamlıları vardır. Kuruluşların aynı terim için farklı anlamları da olabilir. Örneğin, envanter veritabanı varlık kimliği ve seri numarası kullanarak bir ekipman parçasını izleyebilir. Ancak satış veritabanı, seri numarasına varlık kimliği olarak başvurabilir. İlişkiyi açıklayan bir model olmadan bu değerleri ilişkilendirmenin basit bir yolu yoktur.

Anlamsal modelleme, kullanıcıların temel alınan veri yapılarını bilmesi gerekmemesi için veritabanı şeması üzerinde bir soyutlama düzeyi sağlar. Son kullanıcılar, temel alınan şema üzerinde toplama ve birleştirme gerçekleştirmeden verileri kolayca sorgulayabilir. Verilerin bağlamını ve anlamını daha belirgin hale getirmek için sütunlar genellikle daha kolay adlara yeniden adlandırılır.

Anlamsal modelleme, ağırlıklı olarak yoğun yazma işlemi içeren işlemsel veri işleme (OLTP) yerine analiz ve iş zekası (OLAP) gibi yoğun okumalı senaryolar için kullanılır. Anlamsal modelleme, tipik bir anlam katmanının özellikleri nedeniyle okuma ağırlıklı senaryolara uygundur:

  • Toplama davranışları, raporlama araçlarının bunları düzgün görüntüleyebilmesi için ayarlanır.
  • İş mantığı ve hesaplamaları tanımlanır.
  • Zaman odaklı hesaplamalar dahil edilir.
  • Veriler genellikle birden çok kaynaktan tümleştirilir.
  • Gerçek zamanlı analiz desteklenir.

Geleneksel olarak, anlam katmanı bu nedenlerden dolayı bir veri ambarı üzerine yerleştirilir.

Veri ambarı ile raporlama aracı arasındaki anlam katmanını gösteren diyagram.

İki birincil semantik model türü vardır:

  • Tablosal modeller , modeller, tablolar ve sütunlar gibi ilişkisel modelleme yapılarını kullanır. Meta veriler dahili olarak küpler, boyutlar ve ölçüler gibi OLAP modelleme yapılarından devralınır. Kod ve betik OLAP meta verilerini kullanır.

  • Çok boyutlu modeller küpler, boyutlar ve ölçüler gibi geleneksel OLAP modelleme yapılarını kullanır.

Analysis Services ve Fabric , anlamsal modellemeyi etkili bir şekilde uygulamak için gerekli altyapıyı ve araçları sağlar.

Örnek kullanım örneği

Kuruluş verileri büyük bir veritabanında depolar. Bu verileri işletme kullanıcılarının ve müşterilerinin kendi raporlarını oluşturması ve analiz yapması için kullanılabilir hale getirmek istiyor.

Bu kullanıcılara veritabanına doğrudan erişim verebilirler, ancak bu seçeneğin güvenlik yönetimi ve erişim denetimi gibi dezavantajları vardır. Ayrıca kullanıcılar, tabloların ve sütunların adları da dahil olmak üzere veritabanının tasarımını anlamakta zorlanabilir. Bu seçenek, kullanıcıların hangi tabloları sorgulaması gerektiğini, bu tabloların nasıl birleştirileceği ve doğru sonuçları almak için diğer iş mantığının nasıl uygulanacağını bilmelerini gerektirir. Kullanıcıların SQL gibi bir sorgu dilini de bilmesi gerekir. Bu seçenek genellikle aynı ölçümleri bildiren ancak farklı sonuçlara sahip birden çok kullanıcıya yol açar.

Kullanıcıların ihtiyaç duyduğu tüm bilgileri anlamsal bir modelde kapsüllemek daha iyi bir seçenektir. Kullanıcılar, tercih ettikleri bir raporlama aracını kullanarak semantik modeli daha kolay sorgulayabilir. Anlam modelinin sağladığı veriler, tüm kullanıcıların tek bir gerçek kaynağını görüntülemesini sağlayan bir veri ambarından gelir. Anlam modeli ayrıca kullanıcı dostu tablo ve sütun adları sağlar, tablolar arasındaki ilişkileri tanımlar, açıklamalar ve hesaplamalar içerir ve satır düzeyi güvenliği zorunlu kılar.

Anlamsal modellemenin tipik özellikleri

Anlamsal modelleme ve analitik işleme aşağıdaki özelliklere sahip olma eğilimindedir.

Gereksinim Açıklama
Şema Yazma sırasında şema, güçlü bir şekilde uygulanmış
İşlemleri kullanır Hayı
Kilitleme stratejisi Hiç kimse
Güncelleştirilebilir Hayır, genellikle küpü yeniden hesaplamayı gerektirir
Eklenebilir Hayır, genellikle küpü yeniden hesaplamayı gerektirir
İş yükü Ağır okumalar, salt okunur
Dizinleme Çok boyutlu dizin oluşturma
Datum boyutu Küçükten devasa büyüklüğe kadar
Örnek Tablosal veya çok boyutlu
Veri şekli Küp, yıldız veya kar tanesi şeması
Sorgu esnekliği Son derece esnek
Ölçek Büyük, yüzlerce gigabayt (GB) ile birden çok petabayt (KB) arasında

Bu çözümün ne zaman kullanılacağı

Aşağıdaki senaryolar için OLAP kullanmayı göz önünde bulundurun:

  • OLTP sistemlerinizi olumsuz etkilemeden karmaşık analiz ve isteğe bağlı sorguları hızla çalıştırmanız gerekir.

  • İş kullanıcılarına verilerinizden rapor oluşturmanın basit bir yolunu sağlamak istiyorsunuz.

  • Kullanıcıların hızlı ve tutarlı sonuçlar almasına olanak sağlayan çeşitli toplamalar sağlamak istiyorsunuz.

OLAP özellikle büyük miktarlardaki veriler üzerinde toplama hesaplamaları uygulamak için kullanışlıdır. OLAP sistemleri yoğun okuma senaryoları için iyileştirilmiştir. OLAP ayrıca kullanıcıların çok boyutlu verileri özet tablo gibi iki boyutta görüntüleyebileceği dilimler halinde segmentlere ayırmasına da olanak tanır. Ya da verileri belirli değerlere göre filtreleyebilirler. Kullanıcılar, verilerin çeşitli veri kaynakları arasında bölümlenip bölümlenmediğine bakılmaksızın verileri dilimleme ve sıralama olarak bilinen bu işlemleri gerçekleştirebilir. Kullanıcılar, geleneksel veri analizinin ayrıntılarını bilmeden verileri kolayca keşfedebilir.

Anlamsal modeller, iş kullanıcılarının ilişki karmaşıklıklarını soyutlamalarına yardımcı olabilir ve verileri hızla çözümlemeyi kolaylaştırabilir.

Zorluklar

OLAP sistemleri de zorluklara neden olur:

  • Çeşitli kaynaklardan gelen işlemler OLTP sistemlerindeki verileri sürekli güncelleştirir. OLAP veri depoları genellikle iş gereksinimlerine bağlı olarak çok daha yavaş aralıklarla yenilenir. OLAP sistemleri, değişikliklere anında yanıt vermek yerine stratejik iş kararlarına uygundur. OLAP veri depolarını up-togüncel tutmak için bazı veri temizleme ve düzenleme düzeylerini de planlamanız gerekir.

  • OLTP sistemlerindeki geleneksel, normalleştirilmiş ilişkisel tabloların aksine OLAP veri modelleri çok boyutlu olma eğilimindedir. Bu nedenle, bunları her özniteliğin bir sütuna karşılık geldiği varlık ilişkisi veya nesne odaklı modellerle doğrudan eşlemek zor veya imkansızdır. Bunun yerine, OLAP sistemleri genellikle geleneksel normalleştirme yerine bir yıldız veya kar tanesi şeması kullanır.

Azure'da OLAP

Azure'da, Azure SQL Veritabanı gibi OLTP sistemlerindeki veriler Doku veya Analysis Services gibi OLAP sistemlerine kopyalanır. Power BI, Excel ve Microsoft dışı seçenekler gibi veri araştırma ve görselleştirme araçları Analysis Services sunucularına bağlanır ve kullanıcılara modellenmiş veriler hakkında yüksek düzeyde etkileşimli ve görsel olarak zengin içgörüler sağlar. OLTP sistemlerinden OLAP sistemlerine veri akışını yönetmek için SQL Server Integration Services'ı kullanabilirsiniz. SQL Server Integration Services'ı uygulamak için Azure Data Factory'yi kullanın.

Aşağıdaki Azure veri depoları OLAP için temel gereksinimleri karşılar:

SQL Server Analysis Services, iş zekası uygulamaları için OLAP ve veri madenciliği işlevleri sağlar. SQL Server Analysis Services'i yerel sunuculara yükleyebilir veya Azure'daki bir sanal makinede (VM) barındırabilirsiniz. Analysis Services, SQL Server Analysis Services ile aynı ana özellikleri sağlayan tam olarak yönetilen bir hizmettir. Analysis Services, buluttaki ve kuruluşunuzdaki şirket içindeki çeşitli veri kaynaklarına bağlanmayı destekler.

Kümelenmiş columnstore dizinleri SQL Server 2014 ve üzeri ile SQL Veritabanı'nda kullanılabilir. Bu dizinler OLAP iş yükleri için idealdir. SQL Veritabanı da dahil olmak üzere SQL Server 2016'da başlayarak, güncelleştirilebilir, kümelenmemiş columnstore dizinleri aracılığıyla karma işlem ve analitik işlemeden (HTAP) yararlanabilirsiniz. Aynı platformda OLTP ve OLAP işleme gerçekleştirmek için HTAP kullanın. Bu yaklaşım, verilerinizin birden çok kopyasının ve ayrı OLTP ve OLAP sistemlerinin gereksinimini ortadan kaldırır. Daha fazla bilgi için bkz. Gerçek zamanlı operasyonel analiz için Columnstore.

Anahtar seçim ölçütleri

Seçenekleri daraltmak için aşağıdaki soruları yanıtlayın:

  • Kendi sunucularınızı yönetmek yerine yönetilen bir hizmet mi istiyorsunuz?

  • Güvenli kimlik doğrulaması için Microsoft Entra Id'ye ihtiyacınız var mı?

  • OLTP veri deponuzun dışındaki çeşitli kaynaklardan gelen verileri tümleştirmeniz gerekiyor mu?

  • Gerçek zamanlı analiz yapmak istiyor musunuz?

    Fabric Real-Time Intelligence, verilerinizden içgörüler elde etmek ve onları hareket halinde görselleştirmek için kullanabileceğiniz güçlü bir Fabric hizmetidir. Olay odaklı senaryolar, akış verileri ve veri günlükleri için uçtan uca bir çözüm sağlar. İster GB ister PB düzeyinde veriler yönetin, hareket halindeki tüm kuruluş verileri Real-Time hub'ında birleşiyor.

  • Önceden toplanmış verileri kullanmanız mı gerekiyor? Örneğin, iş kullanıcıları için analizi kolaylaştıran anlamsal modeller sağlamak için mi?

    Evet ise, çok boyutlu küpleri veya tablosal anlam modellerini destekleyen bir seçenek belirleyin.

    Kullanıcılara veri toplamlarını tutarlı bir şekilde hesaplamaları konusunda yardımcı olmak için bileşenler sağlayın. Önceden toplanmış veriler, birçok satırda birkaç sütun varsa büyük bir performans artışı da sağlayabilir. Çok boyutlu küplerde veya tablosal anlam modellerinde verileri önceden toplayabilirsiniz.

Yetenek matrisi

Aşağıdaki tablolarda, bu hizmetler arasındaki özelliklerdeki temel farklar özetlenmektedir:

  • Kumaş
  • Analiz Servisleri
  • SQL Server Analysis Services
  • SQL Server, kolon deposu dizinleriyle
  • Columnstore dizinleri içeren SQL Veritabanı

Genel özellikler

Kapasite Kumaş Analiz Servisleri SQL Server Analysis Services SQL Server, kolon deposu dizinleriyle Columnstore dizinleri içeren SQL Veritabanı
Yönetilen bir hizmet mi? Evet Evet Hayı Hayı Evet
MPP Evet Hayı Hayı Hayı Hayı
Çok boyutlu küpleri destekler Hayı Hayı Evet Hayı Hayı
Tablosal anlam modellerini destekler Evet Evet Evet Hayı Hayı
Birden çok veri kaynağını kolayca tümleştirir Evet Evet Evet Hayır 1 Hayır 1
Gerçek zamanlı analizi destekler Evet Hayı Hayı Evet Evet
Kaynaklardan veri kopyalama işlemi gerektirir İsteğe bağlı 3 Evet Evet Hayı Hayı
Microsoft Entra entegrasyonu Evet Evet Hayı 2 Yok Evet

[1] SQL Server ve SQL Veritabanı birden çok dış veri kaynağından sorgu yapamaz ve tümleştiremez, ancak SQL Server Integration Services veya Azure Data Factory kullanarak bu işlevleri gerçekleştirmek için bir işlem hattı oluşturabilirsiniz. Azure VM tarafından barındırılan SQL Server,bağlı sunucular ve PolyBase gibi daha fazla seçeneğe sahiptir. Daha fazla bilgi için bkz. Veri işlem hattı düzenleme teknolojisi seçme.

[2] Microsoft Entra hesabı, Azure VM tarafından barındırılan SQL Server'a bağlanmayı desteklemez. Bunun yerine bir Windows Server Active Directory etki alanı hesabı kullanın.

[3] Fabric, veri kaynaklarının tümleştirilmesine olanak tanıyarak veriyi Azure Data Factory pipeline'ları veya yansıtma yoluyla OneLake'e taşıma esnekliği sağlar. Ayrıca, verileri taşımadan kısayollar oluşturabilir veya veri akışlarında gerçek zamanlı analiz yapabilirsiniz.

Ölçeklenebilirlik özellikleri

Kapasite Kumaş Analiz Servisleri SQL Server Analysis Services SQL Server, kolon deposu dizinleriyle Columnstore dizinleri içeren SQL Veritabanı
Yüksek kullanılabilirlik için yedekli bölgesel sunucular Evet Evet Hayı Evet Evet
Sorgu ölçeği genişletmeyi destekler Evet Evet Hayı Evet Evet
Dinamik ölçeklenebilirlik, ölçeği artırma Evet Evet Hayı Evet Evet

Sonraki Adımlar