Aracılığıyla paylaş


Synapse SQL'de GROUP BY seçenekleri

Synapse SQL, farklı GROUP BY seçenekleri uygulayarak çözüm geliştirmenize olanak tanır.

GROUP BY ne yapar?

GROUP BY T-SQL yan tümcesi verileri bir özet satır kümesine toplar.

Sunucusuz SQL havuzu GROUP BY seçeneklerini desteklemez. Ayrılmış SQL havuzu sınırlı sayıda GROUP BY seçeneğini destekler.

Ayrılmış SQL havuzunda desteklenen GROUP BY seçenekleri

GROUP BY,ayrılmış SQL havuzunun desteklemediği bazı seçeneklere sahiptir. Bu seçeneklerin geçici çözümleri şunlardır:

  • ROLLUP ile GROUP BY
  • GRUPLANDıRMA KÜMELERI
  • KÜP ile GROUP BY

Toplama ve gruplandırma kümeleri seçenekleri

Buradaki en basit seçenek, belirtik söz dizimine güvenmek yerine toplamayı yürütmek için UNION ALL kullanmaktır. Sonuç tamamen aynıdır

Aşağıdaki örnek, ROLLUP seçeneğiyle GROUP BY deyimini kullanır:

SELECT [SalesTerritoryCountry]
,      [SalesTerritoryRegion]
,      SUM(SalesAmount)             AS TotalSalesAmount
FROM  dbo.factInternetSales s
JOIN  dbo.DimSalesTerritory t       ON s.SalesTerritoryKey       = t.SalesTerritoryKey
GROUP BY ROLLUP (
                        [SalesTerritoryCountry]
                ,       [SalesTerritoryRegion]
                )
;

Önceki örnek ROLLUP kullanarak aşağıdaki toplamaları istemektedir:

  • Ülke ve Bölge
  • Ülke
  • Genel Toplam

ROLLUP'ı değiştirmek ve aynı sonuçları döndürmek için UNION ALL kullanabilir ve gerekli toplamaları açıkça belirtebilirsiniz:

SELECT [SalesTerritoryCountry]
,      [SalesTerritoryRegion]
,      SUM(SalesAmount) AS TotalSalesAmount
FROM  dbo.factInternetSales s
JOIN  dbo.DimSalesTerritory t     ON s.SalesTerritoryKey       = t.SalesTerritoryKey
GROUP BY
       [SalesTerritoryCountry]
,      [SalesTerritoryRegion]
UNION ALL
SELECT [SalesTerritoryCountry]
,      NULL
,      SUM(SalesAmount) AS TotalSalesAmount
FROM  dbo.factInternetSales s
JOIN  dbo.DimSalesTerritory t     ON s.SalesTerritoryKey       = t.SalesTerritoryKey
GROUP BY
       [SalesTerritoryCountry]
UNION ALL
SELECT NULL
,      NULL
,      SUM(SalesAmount) AS TotalSalesAmount
FROM  dbo.factInternetSales s
JOIN  dbo.DimSalesTerritory t     ON s.SalesTerritoryKey       = t.SalesTerritoryKey;

GRUPLANDıRMA KÜMELERİ'ni değiştirmek için örnek ilkesi geçerlidir. Yalnızca görmek istediğiniz toplama düzeyleri için UNION ALL bölümleri oluşturmanız gerekir.

Küp seçenekleri

UNION ALL yaklaşımını kullanarak BIR GROUP BY WITH CUBE oluşturmak mümkündür. Sorun, kodun hızlı bir şekilde hantal ve hantal hale gelmesidir. Bu sorunu azaltmak için bu daha gelişmiş yaklaşımı kullanabilirsiniz.

İlk adım, oluşturmak istediğimiz tüm toplama düzeylerini tanımlayan 'küp' tanımlamaktır. Tüm düzeyleri oluştururken türetilmiş iki tablonun CROSS JOIN'ini not edin. Kodun geri kalanı biçimlendirme için oradadır.

CREATE TABLE #Cube
WITH
(   DISTRIBUTION = ROUND_ROBIN
,   LOCATION = USER_DB
)
AS
WITH GrpCube AS
(SELECT    CAST(ISNULL(Country,'NULL')+','+ISNULL(Region,'NULL') AS NVARCHAR(50)) as 'Cols'
,          CAST(ISNULL(Country+',','')+ISNULL(Region,'') AS NVARCHAR(50))  as 'GroupBy'
,          ROW_NUMBER() OVER (ORDER BY Country) as 'Seq'
FROM       ( SELECT 'SalesTerritoryCountry' as Country
             UNION ALL
             SELECT NULL
           ) c
CROSS JOIN ( SELECT 'SalesTerritoryRegion' as Region
             UNION ALL
             SELECT NULL
           ) r
)
SELECT Cols
,      CASE WHEN SUBSTRING(GroupBy,LEN(GroupBy),1) = ','
            THEN SUBSTRING(GroupBy,1,LEN(GroupBy)-1)
            ELSE GroupBy
       END AS GroupBy  --Remove Trailing Comma
,Seq
FROM GrpCube;

Aşağıdaki görüntüde CREATE TABLE AS SELECT sonuçları gösterilmektedir:

Kübüne göre gruplandır

İkinci adım, ara sonuçları depolamak için bir hedef tablo belirtmektir:

DECLARE
 @SQL NVARCHAR(4000)
,@Columns NVARCHAR(4000)
,@GroupBy NVARCHAR(4000)
,@i INT = 1
,@nbr INT = 0
;
CREATE TABLE #Results
(
 [SalesTerritoryCountry] NVARCHAR(50)
,[SalesTerritoryRegion]  NVARCHAR(50)
,[TotalSalesAmount]      MONEY
)
WITH
(   DISTRIBUTION = ROUND_ROBIN
,   LOCATION = USER_DB
)
;

Üçüncü adım, toplamayı gerçekleştiren sütun küpü üzerinde döngü yapmaktır. Sorgu, #Cube geçici tablosundaki her satır için bir kez çalıştırılır. Sonuçlar #Results geçici tablosunda depolanır:

SET @nbr =(SELECT MAX(Seq) FROM #Cube);

WHILE @i<=@nbr
BEGIN
    SET @Columns = (SELECT Cols    FROM #Cube where seq = @i);
    SET @GroupBy = (SELECT GroupBy FROM #Cube where seq = @i);

    SET @SQL ='INSERT INTO #Results
              SELECT '+@Columns+'
              ,      SUM(SalesAmount) AS TotalSalesAmount
              FROM  dbo.factInternetSales s
              JOIN  dbo.DimSalesTerritory t  
              ON s.SalesTerritoryKey = t.SalesTerritoryKey
              '+CASE WHEN @GroupBy <>''
                     THEN 'GROUP BY '+@GroupBy ELSE '' END

    EXEC sp_executesql @SQL;
    SET @i +=1;
END

Son olarak, geçici #Results tablosundan okuyarak sonuçları döndürebilirsiniz:

SELECT *
FROM #Results
ORDER BY 1,2,3
;

Kodu bölümlere ayırıp döngü yapısı oluşturarak kod daha yönetilebilir ve sürdürülebilir hale gelir.

Sonraki adımlar

Daha fazla geliştirme ipucu için bkz. geliştirmeye genel bakış.