Aracılığıyla paylaş


Ölçüm görünümü oluştur

Bu sayfada, SQL veya kullanıcı arabirimi kullanılarak ölçüm görünümünün nasıl oluşturulacağını gösteren örneklerde kullanılan veri modeli ve dikkat edilmesi gerekenler açıklanmaktadır.

Örnek veri kümesine genel bakış

Ölçüm görünümlerini oluşturmak ve yönetmek için SQL kullanma veKatalog Gezgini kullanıcı arabirimini kullanarak ölçüm görünümü oluşturma bölümünde sağlanan örnekler, Unity Kataloğu veri kümelerinde varsayılan olarak kullanılabilen TPC-H veri kümesini kullanır.

TPC-H veri kümesi, karar destek sistemlerini ve sorgu performansını değerlendirmek için kullanılan standart bir karşılaştırma veri kümesidir. Toptan tedarik zinciri işletmesini modellemektedir ve siparişler, müşteriler, tedarikçiler ve parçalar gibi yaygın iş operasyonlarına göre yapılandırılmıştır. Müşterilerin farklı ülke ve bölgelerdeki çeşitli tedarikçiler tarafından sağlanan parçalar için sipariş verdiği bir satış ve dağıtım ortamını temsil eder.

Şemada 8 tablo vardır:

  • REGION ve NATION: Bu tablolar konumu tanımlar.

  • CUSTOMER ve SUPPLIER: Bu tablolar iş varlıklarını açıklar.

  • PART ve PARTSUPP: Bu tablolar ürün bilgilerini ve tedarikçi kullanılabilirliğini yakalar.

  • ORDERS ve LINEITEM: Bu tablolar, siparişlerin içindeki ürünleri ayrıntılı olarak gösteren satır öğeleriyle birlikte işlemleri temsil eder.

TPC-H veri kümesi ERD

Aşağıdaki diyagramda tablolar arasındaki ilişkiler açıklanmaktadır.

TPC-H varlık ilişkisi diyagramı tablolar arasındaki ilişkileri gösterir.

Açıklama:

  • Her tablo adını izleyen ayraçlar, o tablonun sütun adlarının ön ekini içerir;
  • Oklar tablolar arasındaki bire çok ilişkilerin yönünü gösterir;
  • Her tablo adının altındaki sayı/formül, tablonun kardinalitesini (satır sayısı) temsil eder. Bazıları, seçilen veritabanı boyutunu elde etmek için Ölçek Faktörü (SF) ile çarpılarak hesaplanır. LINEITEM tablosunun kardinalitesi yaklaşıktır (bkz. Yan Tümce 4.2.5).

(kaynak: TPC Benchmark H Standart Belirtimi)

Bir ölçüm görünümü tanımlayın

SQL DDL veya Katalog Gezgini kullanıcı arabirimini kullanarak bir ölçüm görünümü tanımlayabilirsiniz. Alternatif olarak, Databricks Yardımcısı ölçüm görünümünüzü oluşturmaya başlamanıza yardımcı olabilir. Ardından, sağlanan SQL DDL'yi düzenleyebilir veya önerilen tanımı daraltmak için kullanıcı arabirimindeki ölçüm görünümü düzenleyicisini kullanabilirsiniz.

Bu bölümdeki örnekler için tanımlanan ölçüm görünümü, şirketin siparişlerine ilişkin önemli performans göstergelerini (KPI) izlemek üzere bir satış veya finans analisti için tasarlanmıştır. Bu, şu gibi soruları yanıtlamaya yardımcı olabilir:

  • Toplam gelirimiz zaman içinde nasıl bir eğilime sahip?
  • Siparişlerimizin (Açık, İşleme, Karşılandı) durumlarına göre geçerli dağılımı nedir?
  • En fazla geliri hangi sipariş öncelikleri sağlar?
  • Şu anda ne kadar gelir 'risk altında' veya ödenmemiş (örneğin, Açık siparişlerden)?
  • Benzersiz müşteri başına oluşturulan ortalama gelir nedir?

Gerekli bileşenler aşağıdaki tabloda açıklanmıştır:

Bileşen YAML alanı/ifadesi İş anlamı
Kaynak tablo samples.tpch.orders Müşteri sipariş kayıtlarını içeren ham veriler.
Filter o_orderdate > '1990-01-01' Analiz, muhtemelen geçmiş veya arşivlenmiş verileri hariç tutarak yalnızca 1 Ocak 1990'dan sonra verilen siparişlere odaklanır.
Boyut: Sipariş Ayı (DATE_TRUNC('MONTH', o_orderdate)) Zaman içinde performansın nasıl değiştiğini izleyerek eğilim analizini (aydan yıla/Yıla göre ay) etkinleştirir.
Boyut: Sipariş Durumu CASE durumunu Open, Processing veya Fulfilled olarak çeviren ifade Yaşam döngüsü aşamasına göre segmentlere ayırmaya olanak tanır, gerçekleştirme ve geri sipariş yönetimi için yararlıdır.
Boyut: Sipariş Önceliği SPLIT sipariş önceliğini sayı olarak biçimlendiren deyim Performansı, siparişin stratejik önemine veya aciliyetine göre gruplandırmak için kullanılır.
Ölçü: Sipariş Sayısı COUNT(1) Birim satış etkinliğini ölçer
Ölçü: Toplam Gelir SUM(o_totalprice) Tüm siparişlerin brüt satış değeri
Ölçü: Müşteri Başına Toplam Gelir SUM(o_totalprice) / COUNT(DISTINCT o_custkey) Müşteri işlem kalitesini değerlendirmek için kullanışlı bir müşteri değeri ölçümü.
Ölçü: Açık Siparişler için Toplam Gelir SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') Kazanılmamış gelirin veya geçerli satış birikimi değeri. Tahmin ve risk değerlendirmesi için kullanılır.

Databricks Yardımcısı'na sorun

Databricks Yardımcısı, ölçüm görünümü tanımlamaya başlamanıza yardımcı olabilir.

  1. Sparkle dolgu simgesine tıklayın. Yardımcıyı açmak için Databricks çalışma alanınızın sağ üst köşesindeki Yardımcı simgesi.
  2. Oluşturmak istediğiniz ölçüm görünümünün açıklamasını yazın. Yardımcı, isteğinizi eşleştirmeye çalışan SQL DDL'yi döndürür.
  3. Sağlanan SQL'i kopyalayın ve SQL düzenleyicisine yapıştırın. Ardından Çalıştır'a tıklayın.
  4. Ayarlamalar yapmak için SQL'i düzenleyin veya ölçüm görünümü düzenleyicisini açın.

Yeni ölçüm görünümü oluşturma

Yeni bir ölçüm görünümü oluşturmak için aşağıdaki örneklerden birini kullanın: