mean
statistische functie
Van toepassing op: Databricks Databricks Runtime
Retourneert het gemiddelde dat is berekend op basis van waarden van een groep. Deze functie is een synoniem voor gem. statistische functie.
Syntaxis
mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Deze functie kan ook worden aangeroepen als een vensterfunctie met behulp van de OVER
-component.
Argumenten
expr
: Een expressie die resulteert in een numerieke expressie.cond
: een optionele booleaanse expressie die de rijen filtert die worden gebruikt voor aggregatie.
Retourneert
Het resultaattype wordt berekend op basis van de argumenten:
DECIMAL(p, s)
: Het resultaattype is eenDECIMAL(p + 4, s + 4)
. Als de maximale precisie voor DECIMAAL wordt bereikt, wordt de schaalvergroting beperkt om verlies van significante cijfers te voorkomen.- interval jaar-maand: het resultaat is een
INTERVAL YEAR TO MONTH
. - dag-tijdinterval: het resultaat is een
INTERVAL DAY TO SECOND
. - In alle andere gevallen is het resultaat een DOUBLE.
Null-waarden in de groep worden genegeerd. Als een groep leeg is of alleen uit null-waarden bestaat, is het resultaat NULL.
Als DISTINCT
is opgegeven, wordt het gemiddelde berekend nadat duplicaten zijn verwijderd.
Waarschuwing
Als in Databricks Runtime spark.sql.ansi.enabled is, wordt false
er een overloop geretourneerd NULL
in plaats van een fout.
Voorbeelden
> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
1.5
> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5