mean statistische functie

Van toepassing op:controleren met ja Databricks SQL-controle gemarkeerd als ja Databricks Runtime

Retourneert het gemiddelde dat is berekend op basis van waarden van een groep. Deze functie is een synoniem voor gem. statistische functie.

Syntaxis

mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

Deze functie kan ook worden aangeroepen als een vensterfunctie met behulp van de OVER -component.

Argumenten

  • expr: Een expressie die resulteert in een numerieke expressie.
  • cond: een optionele booleaanse expressie die de rijen filtert die worden gebruikt voor aggregatie.

Retourneert

Het resultaattype wordt berekend op basis van de argumenten:

  • DECIMAL(p, s): Het resultaattype is een DECIMAL(p + 4, s + 4). Als de maximale precisie voor DECIMAAL wordt bereikt, wordt de schaalvergroting beperkt om verlies van significante cijfers te voorkomen.
  • interval jaar-maand: het resultaat is een INTERVAL YEAR TO MONTH.
  • dag-tijdinterval: het resultaat is een INTERVAL DAY TO SECOND.
  • In alle andere gevallen is het resultaat een DOUBLE.

Null-waarden in de groep worden genegeerd. Als een groep leeg is of alleen uit null-waarden bestaat, is het resultaat NULL.

Als DISTINCT is opgegeven, wordt het gemiddelde berekend nadat duplicaten zijn verwijderd.

Waarschuwing

Als in Databricks Runtime spark.sql.ansi.enabled is, wordt falseer een overloop geretourneerd NULL in plaats van een fout.

Voorbeelden

> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
 1.5

> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5