Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfada, SQL veya kullanıcı arabirimi kullanılarak ölçüm görünümünün nasıl oluşturulacağını gösteren örneklerde kullanılan veri modeli ve dikkat edilmesi gerekenler açıklanmaktadır.
Örnek veri kümesine genel bakış
Ölçüm görünümlerini oluşturmak ve yönetmek için SQL kullanma veKatalog Gezgini kullanıcı arabirimini kullanarak ölçüm görünümü oluşturma bölümünde sağlanan örnekler, Unity Kataloğu veri kümelerinde varsayılan olarak kullanılabilen TPC-H veri kümesini kullanır.
TPC-H veri kümesi, karar destek sistemlerini ve sorgu performansını değerlendirmek için kullanılan standart bir karşılaştırma veri kümesidir. Toptan tedarik zinciri işletmesini modellemektedir ve siparişler, müşteriler, tedarikçiler ve parçalar gibi yaygın iş operasyonlarına göre yapılandırılmıştır. Müşterilerin farklı ülke ve bölgelerdeki çeşitli tedarikçiler tarafından sağlanan parçalar için sipariş verdiği bir satış ve dağıtım ortamını temsil eder.
Şemada 8 tablo vardır:
REGIONveNATION: Bu tablolar konumu tanımlar.CUSTOMERveSUPPLIER: Bu tablolar iş varlıklarını açıklar.PARTvePARTSUPP: Bu tablolar ürün bilgilerini ve tedarikçi kullanılabilirliğini yakalar.ORDERSveLINEITEM: Bu tablolar, siparişlerin içindeki ürünleri ayrıntılı olarak gösteren satır öğeleriyle birlikte işlemleri temsil eder.
TPC-H veri kümesi ERD
Aşağıdaki diyagramda tablolar arasındaki ilişkiler açıklanmaktadır.
Açıklama:
- Her tablo adını izleyen ayraçlar, o tablonun sütun adlarının ön ekini içerir;
- Oklar tablolar arasındaki bire çok ilişkilerin yönünü gösterir;
- Her tablo adının altındaki sayı/formül, tablonun kardinalitesini (satır sayısı) temsil eder. Bazıları, seçilen veritabanı boyutunu elde etmek için Ölçek Faktörü (SF) ile çarpılarak hesaplanır. LINEITEM tablosunun kardinalitesi yaklaşıktır (bkz. Yan Tümce 4.2.5).
(kaynak: TPC Benchmark H Standart Belirtimi)
Bir ölçüm görünümü tanımlayın
SQL DDL veya Katalog Gezgini kullanıcı arabirimini kullanarak bir ölçüm görünümü tanımlayabilirsiniz. Alternatif olarak, Databricks Yardımcısı ölçüm görünümünüzü oluşturmaya başlamanıza yardımcı olabilir. Ardından, sağlanan SQL DDL'yi düzenleyebilir veya önerilen tanımı daraltmak için kullanıcı arabirimindeki ölçüm görünümü düzenleyicisini kullanabilirsiniz.
Bu bölümdeki örnekler için tanımlanan ölçüm görünümü, şirketin siparişlerine ilişkin önemli performans göstergelerini (KPI) izlemek üzere bir satış veya finans analisti için tasarlanmıştır. Bu, şu gibi soruları yanıtlamaya yardımcı olabilir:
- Toplam gelirimiz zaman içinde nasıl bir eğilime sahip?
- Siparişlerimizin (Açık, İşleme, Karşılandı) durumlarına göre geçerli dağılımı nedir?
- En fazla geliri hangi sipariş öncelikleri sağlar?
- Şu anda ne kadar gelir 'risk altında' veya ödenmemiş (örneğin, Açık siparişlerden)?
- Benzersiz müşteri başına oluşturulan ortalama gelir nedir?
Gerekli bileşenler aşağıdaki tabloda açıklanmıştır:
| Bileşen | YAML alanı/ifadesi | İş anlamı |
|---|---|---|
| Kaynak tablo | samples.tpch.orders |
Müşteri sipariş kayıtlarını içeren ham veriler. |
| Filter | o_orderdate > '1990-01-01' |
Analiz, muhtemelen geçmiş veya arşivlenmiş verileri hariç tutarak yalnızca 1 Ocak 1990'dan sonra verilen siparişlere odaklanır. |
| Boyut: Sipariş Ayı | (DATE_TRUNC('MONTH', o_orderdate)) |
Zaman içinde performansın nasıl değiştiğini izleyerek eğilim analizini (aydan yıla/Yıla göre ay) etkinleştirir. |
| Boyut: Sipariş Durumu |
CASE durumunu Open, Processing veya Fulfilled olarak çeviren ifade |
Yaşam döngüsü aşamasına göre segmentlere ayırmaya olanak tanır, gerçekleştirme ve geri sipariş yönetimi için yararlıdır. |
| Boyut: Sipariş Önceliği |
SPLIT sipariş önceliğini sayı olarak biçimlendiren deyim |
Performansı, siparişin stratejik önemine veya aciliyetine göre gruplandırmak için kullanılır. |
| Ölçü: Sipariş Sayısı | COUNT(1) |
Birim satış etkinliğini ölçer |
| Ölçü: Toplam Gelir | SUM(o_totalprice) |
Tüm siparişlerin brüt satış değeri |
| Ölçü: Müşteri Başına Toplam Gelir | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
Müşteri işlem kalitesini değerlendirmek için kullanışlı bir müşteri değeri ölçümü. |
| Ölçü: Açık Siparişler için Toplam Gelir | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
Kazanılmamış gelirin veya geçerli satış birikimi değeri. Tahmin ve risk değerlendirmesi için kullanılır. |
Databricks Yardımcısı'na sorun
Databricks Yardımcısı, ölçüm görünümü tanımlamaya başlamanıza yardımcı olabilir.
-
Yardımcıyı açmak için Databricks çalışma alanınızın sağ üst köşesindeki Yardımcı simgesi.
- Oluşturmak istediğiniz ölçüm görünümünün açıklamasını yazın. Yardımcı, isteğinizi eşleştirmeye çalışan SQL DDL'yi döndürür.
- Sağlanan SQL'i kopyalayın ve SQL düzenleyicisine yapıştırın. Ardından Çalıştır'a tıklayın.
- Ayarlamalar yapmak için SQL'i düzenleyin veya ölçüm görünümü düzenleyicisini açın.
Yeni ölçüm görünümü oluşturma
Yeni bir ölçüm görünümü oluşturmak için aşağıdaki örneklerden birini kullanın: