Ablakkeret záradéka

A következőkre vonatkozik:jelölje be az igennel jelölt jelölőnégyzetet Databricks SQL jelölje be az igennel jelölt jelölőnégyzetet Databricks Runtime

A partíción belüli sorok toló részhalmazát adja meg, amelyen az aggregátum- vagy elemzési ablakfüggvény működik.

Szintaxis

{ frame_mode frame_start |
  frame_mode BETWEEN frame_start AND frame_end } }

frame_mode
{ RANGE | ROWS }

frame_start
{ UNBOUNDED PRECEDING |
  offset_start PRECEDING |
  CURRENT ROW |
  offset_start FOLLOWING }

frame_end
{ offset_stop PRECEDING |
  CURRENT ROW |
  offset_stop FOLLOWING |
  UNBOUNDED FOLLOWING }

Paraméterek

  • frame_mode

    • SOROK

      Ha meg van adva, a tolóablak kerete az aktuális sort megelőző vagy követő sorokban van kifejezve.

    • TARTOMÁNY

      Ha meg van adva, az ablakfüggvénynek tartalmaznia kell egy ORDER BY záradékot egyetlen kifejezéssel obExpr.

      A tolóablak határait ezután az aktuális sor obExpr-tól való eltolásként fejezik ki.

      Ha hiányzik a ORDER BY záradék, Azure Databricks DATATYPE_MISMATCH. RANGE_FRAME_WITHOUT_ORDER. Ha a ORDER BY záradék több kifejezéssel is rendelkezik, Azure Databricks DATATYPE_MISMATCH. RANGE_FRAME_MULTI_ORDER.

  • frame_start

    A tolóablak keretének kiindulási pozíciója az aktuális sorhoz képest.

    • KÖTETLEN ELŐZŐ

      Megadja, hogy az ablakkeret a partíció elején kezdődik.

    • offset_start ELŐZŐ

      Ha a mód az ROWS, akkor a offset_start pozitív egész szám azt határozza meg, hogy hány sorral az aktuális sor előtt kezdődik a keret.

      Ha a mód az RANGE, offset_start egy pozitív literális érték, amely típusból obExpr kivonható. A keret annál a partíció első soránál kezdődik, amelynél a obExpr nagyobb vagy egyenlő az aktuális sorban lévő obExpr - offset_start-nél.

    • AKTUÁLIS SOR

      Azt adja meg, hogy a keret az aktuális sortól indul-e.

    • offset_start KÖVETKEZŐ

      Ha a mód az ROWS, offset_start az a pozitív egész szám, amely meghatározza, hogy hány sorral az aktuális sor után kezdődik a keret. Ha a mód az RANGE, akkor a offset_start egy olyan típusú pozitív literálérték, amelyhez hozzáadható a obExpr. A keret annál a partíció első soránál kezdődik, amelynél a obExpr nagyobb vagy egyenlő az aktuális sorban lévő obExpr + offset_start-nél.

  • frame_stop

    A tolóablak keretének vége az aktuális sorhoz képest.

    Ha nincs megadva, a keret az AKTUÁLIS SORnál áll meg. A tolóablak végének nagyobbnak kell lennie, mint az ablakkeret kezdete.

    • offset_stop ELŐZŐ

      Ha a frame_mode ROWS, akkor a offset_stop az a pozitív egész literálszám, amely meghatározza, hogy hány sorral az aktuális sor előtt áll meg a keret. Ha a frame_mode értéke RANGE, akkor a offset_stop egy pozitív literális érték, amely azonos típusú, mint a offset_start. A keret a partíció azon utolsó sorában végződik, amelyben a obExpr kisebb vagy egyenlő, mint az aktuális sorban lévő obExpr - offset_stop.

    • AKTUÁLIS SOR

      Megadja, hogy a keret az aktuális sorban áll-e meg.

    • offset_stop KÖVETKEZŐ

      Ha a frame_mode ROWS értéket vesz fel, akkor offset_stop az a pozitív egész literálszám, amely meghatározza, hogy a keret hány sorral az aktuális sor után ér véget. Ha a frame_mode értéke RANGE, akkor a offset_stop egy pozitív literális érték, amely azonos típusú, mint a offset_start. A keret az adott partíció utolsó sorában végződik, ahol obExpr kisebb vagy egyenlő az aktuális sor obExpr + offset_stop értéknél.

    • SZABAD KÖVETÉS

      Azt adja meg, hogy az ablakkeret a partíció végén leáll.

Gyakori hibafeltételek

Examples

> CREATE TABLE employees
   (name STRING, dept STRING, salary INT, age INT);
> INSERT INTO employees
   VALUES ('Lisa', 'Sales', 10000, 35),
          ('Evan', 'Sales', 32000, 38),
          ('Fred', 'Engineering', 21000, 28),
          ('Alex', 'Sales', 30000, 33),
          ('Tom', 'Engineering', 23000, 33),
          ('Jane', 'Marketing', 29000, 28),
          ('Jeff', 'Marketing', 35000, 38),
          ('Paul', 'Engineering', 29000, 23),
          ('Chloe', 'Engineering', 23000, 25);

-- ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW: cumulative sum of salary within each department.
> SELECT name,
         dept,
         salary,
         SUM(salary) OVER (PARTITION BY dept ORDER BY salary
                           ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS running_total
    FROM employees;
  Fred Engineering  21000  21000
 Chloe Engineering  23000  44000
   Tom Engineering  23000  67000
  Paul Engineering  29000  96000
  Jane   Marketing  29000  29000
  Jeff   Marketing  35000  64000
  Lisa       Sales  10000  10000
  Alex       Sales  30000  40000
  Evan       Sales  32000  72000

-- ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING: moving average over three adjacent rows.
> SELECT name,
         dept,
         salary,
         ROUND(AVG(salary) OVER (PARTITION BY dept ORDER BY salary
                                 ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING)) AS moving_avg
    FROM employees;
  Fred Engineering  21000  22000
 Chloe Engineering  23000  22333
   Tom Engineering  23000  25000
  Paul Engineering  29000  26000
  Jane   Marketing  29000  32000
  Jeff   Marketing  35000  32000
  Lisa       Sales  10000  20000
  Alex       Sales  30000  24000
  Evan       Sales  32000  31000

-- ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING: sum from the current row to the end of the partition.
> SELECT name,
         dept,
         salary,
         SUM(salary) OVER (PARTITION BY dept ORDER BY salary
                           ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) AS remaining_total
    FROM employees;
  Fred Engineering  21000  96000
 Chloe Engineering  23000  75000
   Tom Engineering  23000  52000
  Paul Engineering  29000  29000
  Jane   Marketing  29000  64000
  Jeff   Marketing  35000  35000
  Lisa       Sales  10000  72000
  Alex       Sales  30000  62000
  Evan       Sales  32000  32000

-- RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW: cumulative sum using value-based range.
-- Unlike ROWS mode, RANGE groups rows with equal `ORDER BY` values together.
> SELECT name,
         dept,
         salary,
         SUM(salary) OVER (PARTITION BY dept ORDER BY salary
                           RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS range_total
    FROM employees;
  Fred Engineering  21000  21000
 Chloe Engineering  23000  67000
   Tom Engineering  23000  67000
  Paul Engineering  29000  96000
  Jane   Marketing  29000  29000
  Jeff   Marketing  35000  64000
  Lisa       Sales  10000  10000
  Alex       Sales  30000  40000
  Evan       Sales  32000  72000

-- RANGE BETWEEN 5000 PRECEDING AND 5000 FOLLOWING: sum of salaries within +/- 5000 of the current row's salary.
> SELECT name,
         dept,
         salary,
         SUM(salary) OVER (PARTITION BY dept ORDER BY salary
                           RANGE BETWEEN 5000 PRECEDING AND 5000 FOLLOWING) AS nearby_total
    FROM employees;
  Fred Engineering  21000  67000
 Chloe Engineering  23000  67000
   Tom Engineering  23000  67000
  Paul Engineering  29000  75000
  Jane   Marketing  29000  64000
  Jeff   Marketing  35000  35000
  Lisa       Sales  10000  10000
  Alex       Sales  30000  92000
  Evan       Sales  32000  62000

-- Comparing ROWS vs RANGE: the difference is visible when there are duplicate `ORDER BY` values.
-- With ROWS, `Chloe` and `Tom` have different running totals because each row is counted individually.
-- With RANGE, `Chloe` and `Tom` have the same total because they share the same salary value.
> SELECT name,
         salary,
         SUM(salary) OVER (ORDER BY salary
                           ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)  AS rows_total,
         SUM(salary) OVER (ORDER BY salary
                           RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS range_total
    FROM employees
    WHERE dept = 'Engineering';
  Fred  21000  21000  21000
 Chloe  23000  44000  67000
   Tom  23000  67000  67000
  Paul  29000  96000  96000

-- `RANGE` frame requires exactly one `ORDER BY` expression.
> SELECT SUM(salary) OVER (ORDER BY salary, age
                           RANGE BETWEEN 1000 PRECEDING AND 1000 FOLLOWING)
    FROM employees;
  Error: DATATYPE_MISMATCH

-- `RANGE` frame requires an `ORDER BY` clause.
> SELECT SUM(salary) OVER (RANGE BETWEEN 1000 PRECEDING AND 1000 FOLLOWING)
    FROM employees;
  Error: DATATYPE_MISMATCH