مشاركة عبر


approx_count_distinct الدالة التجميعية

ينطبق على: وضع علامة Databricks SQL وضع علامة Databricks Runtime

إرجاع العدد المقدر للقيم المميزة في expr داخل المجموعة.

يستخدم التنفيذ الإصدار الكثيف من خوارزمية HyperLogLog++ (HLL++)، وهي حالة من خوارزمية تقدير العلاقة الأساسية.

تكون النتائج دقيقة ضمن قيمة افتراضية تبلغ 5٪، والتي تستمد من قيمة الحد الأقصى للانحراف المعياري النسبي، على الرغم من أن هذا قابل للتكوين باستخدام المعلمة relativeSD كما هو مذكور أدناه.

بناء الجملة

approx_count_distinct(expr[, relativeSD]) [FILTER ( WHERE cond ) ]

يمكن أيضا استدعاء هذه الدالة كدالة نافذة باستخدام العبارة OVER .

الوسيطات

  • expr: يمكن أن يكون من أي نوع يتم تعريف التكافؤ له.
  • relativeSD: يحدد الحد الأقصى للانحراف المعياري النسبي المسموح به.
  • cond: تعبير منطقي اختياري يقوم بتصفية الصفوف المستخدمة للتجميع.

المرتجعات

(بي جينت)

الأمثلة

> SELECT approx_count_distinct(col1) FROM VALUES (1), (1), (2), (2), (3) tab(col1);
 3

> SELECT approx_count_distinct(col1) FILTER(WHERE col2 = 10)
    FROM VALUES (1, 10), (1, 10), (2, 10), (2, 10), (3, 10), (1, 12) AS tab(col1, col2);
 3