Delen via


Visualisatietypen

Dit artikel bevat een overzicht van de typen visualisaties die beschikbaar zijn voor gebruik in Azure Databricks-notebooks en in Databricks SQL, en laat zien hoe u een voorbeeld van elk visualisatietype maakt.

Notitie

Zie Dashboardvisualisatietypen voor meer informatie over de visualisatietypen die beschikbaar zijn voor AI/BI-dashboards.

Staafdiagram

Staafdiagrammen vertegenwoordigen de wijziging in metrische gegevens in de loop van de tijd of om evenredigheid weer te geven, vergelijkbaar met een cirkeldiagram .

Notitie

Staafdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.

Voorbeeld van staafdiagram

Configuratiewaarden: Voor deze visualisatie van een staafdiagram zijn de volgende waarden ingesteld:

  • X-kolom:
    • Kolom gegevensset: o_orderdate
    • Datumniveau: Months
  • Y-kolommen:
    • Kolom gegevensset: o_totalprice
    • Aggregatietype: Sum
  • Groeperen op (kolom gegevensset): o_orderpriority
  • Stapelen: Stack
  • X-asnaam (standaardwaarde negeren): Order month
  • Y-asnaam (standaardwaarde negeren): Total price

Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor de configuratie van staafdiagrammen.

SQL-query: Voor deze staafdiagramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.orders

Lijndiagram

Lijndiagrammen presenteren de wijziging in een of meer metrische gegevens in de loop van de tijd.

Notitie

Lijndiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder afkapping van de resultatenset.

Voorbeeld van lijndiagram

Configuratiewaarden: Voor deze visualisatie van het lijndiagram zijn de volgende waarden ingesteld:

  • X-kolom:
    • Kolom gegevensset: o_orderdate
    • Datumniveau: Years
  • Y-kolommen:
    • Kolom gegevensset: o_totalprice
    • Aggregatietype: Average
  • Groeperen op (kolom gegevensset): o_orderpriority
  • X-asnaam (standaardwaarde negeren): Order year
  • Y-asnaam (standaardwaarde negeren): Average price

Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor configuratie van lijndiagrammen.

SQL-query: Voor deze visualisatie van het lijndiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.orders

Vlakdiagram

Vlakdiagrammen combineren het lijn- en staafdiagram om te laten zien hoe de numerieke waarden van een of meer groepen veranderen over de voortgang van een tweede variabele, meestal die van tijd. Ze worden vaak gebruikt om wijzigingen in de verkooptrechter in de loop van de tijd weer te geven.

Notitie

Vlakdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.

Voorbeeld van vlakdiagram

Configuratiewaarden: Voor deze visualisatie van het vlakdiagram zijn de volgende waarden ingesteld:

  • X-kolom:
    • Kolom gegevensset: o_orderdate
    • Datumniveau: Years
  • Y-kolommen:
    • Kolom gegevensset: o_totalprice
    • Aggregatietype: Sum
  • Groeperen op (kolom gegevensset): o_orderpriority
  • Stapelen: Stack
  • X-asnaam (standaardwaarde negeren): Order year
  • Y-asnaam (standaardwaarde negeren): Total price

Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor vlakdiagrammen.

SQL-query: Voor deze visualisatie van het vlakdiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.orders

Cirkeldiagrammen

Cirkeldiagrammen tonen evenredigheid tussen metrische gegevens. Ze zijn niet bedoeld voor het overbrengen van tijdreeksgegevens.

Notitie

Cirkeldiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.

Voorbeeld van cirkeldiagram

Configuratiewaarden: Voor deze visualisatie van het cirkeldiagram zijn de volgende waarden ingesteld:

  • X-kolom (gegevenssetkolom): o_orderpriority
  • Y-kolommen:
    • Kolom gegevensset: o_totalprice
    • Aggregatietype: Sum
  • Label (standaardwaarde overschrijven): Total price

Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor de configuratie van cirkeldiagrammen.

SQL-query: Voor deze cirkeldiagramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.orders

Histogrammen

In een histogram wordt de frequentie van een bepaalde waarde in een gegevensset weergegeven. Een histogram helpt u te begrijpen of een gegevensset waarden bevat die rond een klein aantal bereiken zijn geclusterd of meer zijn verdeeld. Een histogram wordt weergegeven als een staafdiagram waarin u het aantal afzonderlijke balken (ook wel bins genoemd) bepaalt.

Notitie

Histogrammen bieden ondersteuning voor back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.

Voorbeeld van histogram

Configuratiewaarden: Voor deze visualisatie van het histogram zijn de volgende waarden ingesteld:

  • X-kolom (gegevenssetkolom): o_totalprice
  • Aantal bins: 20
  • X-asnaam (standaardwaarde negeren): Total price

Configuratieopties: Zie configuratieopties voor histogramgrafiek voor opties voor histogramconfiguratie.

SQL-query: Voor deze histogramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.orders

Heatmapgrafiek

Heatmap-grafieken combineren functies van staafdiagrammen, stapelen en bellendiagrammen, zodat u numerieke gegevens kunt visualiseren met behulp van kleuren. Een gemeenschappelijk kleurenpalet voor een heatmap toont de hoogste waarden met warmere kleuren, zoals oranje of rood, en de laagste waarden met koelere kleuren, zoals blauw of paars.

Denk bijvoorbeeld aan de volgende heatmap die de meest voorkomende afstanden van taxiritten per dag visualiseert en de resultaten groepeert op de dag van de week, afstand en het totale tarief.

Notitie

Heatmapgrafieken ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder afkapping van de resultatenset.

Voorbeeld van heatmap

Configuratiewaarden: Voor deze heatmapgrafiekvisualisatie zijn de volgende waarden ingesteld:

  • X-kolom (gegevenssetkolom): o_orderpriority
  • Y-kolommen (gegevenssetkolom): o_orderstatus
  • Kleurkolom:
    • Kolom gegevensset: o_totalprice
    • Aggregatietype: Average
  • X-asnaam (standaardwaarde negeren): Order priority
  • Naam van Y-as (standaardwaarde overschrijven): Order status
  • Kleurenschema (standaardwaarde overschrijven): YIGnBu

Configuratieopties: Zie configuratieopties voor heatmapgrafieken voor opties voor heatmapconfiguratie.

SQL-query: Voor deze heatmapgrafiekvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.orders

Spreidingsdiagram

Spreidingsvisualisaties worden vaak gebruikt om de relatie tussen twee numerieke variabelen weer te geven. Daarnaast kan een derde dimensie worden gecodeerd met kleur om te laten zien hoe de numerieke variabelen verschillen tussen groepen.

Notitie

Spreidingsdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.

Voorbeeld van spreiding

Configuratiewaarden: Voor deze visualisatie van een spreidingsdiagram zijn de volgende waarden ingesteld:

  • X-kolom (gegevenssetkolom): l_quantity
  • Y-kolom (gegevenssetkolom): l_extendedprice
  • Groeperen op (kolom gegevensset): l_returnflag
  • X-asnaam (standaardwaarde negeren): Quantity
  • Y-asnaam (standaardwaarde negeren): Extended price

Configuratieopties: Zie configuratieopties voor spreidingsdiagrammen.

SQL-query: Voor deze visualisatie van een spreidingsdiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.lineitem

Bellendiagram

Bellendiagrammen zijn spreidingsdiagrammen waarbij de grootte van elke puntmarkering een relevante metrische waarde weergeeft.

Notitie

Bellendiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.

Voorbeeld van bellen

Configuratiewaarden: Voor deze visualisatie van bellendiagrammen zijn de volgende waarden ingesteld:

  • X (gegevenssetkolom): l_quantity
  • Y-kolommen (gegevenssetkolom): l_extendedprice
  • Groeperen op (kolom gegevensset): l-returnflag
  • Kolom met bellengrootte (gegevenssetkolom): l_tax
  • Belgroottecoëfficiënt: 20
  • X-asnaam (standaardwaarde negeren): Quantity
  • Y-asnaam (standaardwaarde negeren): Extended price

Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor configuratie van bellendiagrammen.

SQL-query: Voor deze visualisatie van bellendiagrammen is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.lineitem

Box chart

In de visualisatie van het vakdiagram ziet u het distributieoverzicht van numerieke gegevens, optioneel gegroepeerd op categorie. Met behulp van een visualisatie van een boxgrafiek kunt u snel de waardebereiken in categorieën vergelijken en de lokaliteit, spreiding en scheefheid van de waarden visualiseren via hun kwartielen. In elk vak toont de donkerdere lijn het interquartielbereik. Zie het boxgrafiekartikel op Wikipedia voor meer informatie over het interpreteren van boxplotvisualisaties.

Notitie

Box-grafieken ondersteunen alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.

Voorbeeld van boxgrafiek

Configuratiewaarden: Voor deze visualisatie van een boxdiagram zijn de volgende waarden ingesteld:

  • X-kolom (gegevenssetkolom): l-returnflag
  • Y-kolommen (gegevenssetkolom): l_extendedprice
  • Groeperen op (kolom gegevensset): l_shipmode
  • X-asnaam (standaardwaarde negeren): Return flag1
  • Y-asnaam (standaardwaarde negeren): Extended price

Configuratieopties: Zie de configuratieopties voor boxgrafieken voor opties voor de configuratie van boxgrafieken.

SQL-query: Voor deze grafiekvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.lineitem

Combinatiegrafiek

Combinatiegrafieken combineren lijn - en staafdiagrammen om de wijzigingen in de loop van de tijd te presenteren met evenredigheid.

Notitie

Combinatiegrafieken ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.

Voorbeeld van combinatie

Configuratiewaarden: Voor deze visualisatie van een combinatiegrafiek zijn de volgende waarden ingesteld:

  • X-kolom (gegevenssetkolom): l_shipdate
  • Y-kolommen:
    • Eerste kolom gegevensset: l_extendedprice
    • Aggregatietype: gemiddelde
    • Kolom tweede gegevensset: l_quantity
    • Aggregatietype: gemiddelde
  • X-asnaam (standaardwaarde negeren): Ship date
  • Naam van linker Y-as (standaardwaarde overschrijven): Quantity
  • Naam van rechter Y-as (standaardwaarde overschrijven): Average price
  • Reeks:
    • Order1 (kolom gegevensset): AVG(l_extendedprice)
    • Y-as: rechts
    • Type: Lijn
    • Order2 (kolom gegevensset): AVG(l_quantity)
    • Y-as: links
    • Type: Balk

Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor combinatiegrafieken.

SQL-query: Voor deze visualisatie van een combinatiegrafiek is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.lineitem

Cohortanalyse

Een cohortanalyse onderzoekt de resultaten van vooraf vastgestelde groepen, cohorten genoemd, terwijl ze door een reeks fasen gaan. De cohortvisualisatie aggregeert alleen over datums (dit maakt maandelijkse aggregaties mogelijk). Er worden geen andere aggregaties van gegevens in de resultatenset uitgevoerd. Alle andere aggregaties worden uitgevoerd binnen de query zelf.

Cohortvoorbeeld

Configuratiewaarden: Voor deze cohortvisualisatie zijn de volgende waarden ingesteld:

  • Datum (bucket) (databasekolom): cohort_month
  • Fase (databasekolom): months
  • Grootte van bucketpopulatie (databasekolom): size
  • Fasewaarde (databasekolom): active
  • Tijdsinterval: monthly

Configuratieopties: Zie opties voor cohortgrafiekconfiguratie voor cohortconfiguraties.

SQL-query: Voor deze cohortvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

-- match each customer with its cohort by month
with cohort_dates as (
  SELECT o_custkey, min(date_trunc('month', o_orderdate)) as cohort_month
  FROM samples.tpch.orders
  GROUP BY 1
),
-- find the size of each cohort
cohort_size as (
  SELECT cohort_month, count(distinct o_custkey) as size
  FROM cohort_dates
  GROUP BY 1
)
-- for each cohort and month thereafter, find the number of active customers
SELECT
  cohort_dates.cohort_month,
  ceil(months_between(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month)) as months,
  count(distinct samples.tpch.orders.o_custkey) as active,
  first(size) as size
FROM samples.tpch.orders
  left join cohort_dates on samples.tpch.orders.o_custkey = cohort_dates.o_custkey
  left join cohort_size on cohort_dates.cohort_month = cohort_size.cohort_month
WHERE datediff(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month) != 0
GROUP BY 1, 2
ORDER BY 1, 2

Tellerweergave

Tellers geven één enkele waarde prominent weer, met een optie om deze te vergelijken met een doelwaarde. Als u meteritems wilt gebruiken, geeft u op welke rij met gegevens moet worden weergegeven in de tellervisualisatie voor de waardekolom en doelkolom.

Notitie

Teller ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.

Voorbeeld van teller

Configuratiewaarden: Voor deze tellervisualisatie zijn de volgende waarden ingesteld:

  • Waardekolom
    • Kolom gegevensset: avg(o_totalprice)
    • Rij 1:
  • Doelkolom:
    • Kolom gegevensset: avg(o_totalprice)
    • Rij 2:
  • Doelwaarde opmaken: inschakelen

SQL-query: Voor deze tellervisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select o_orderdate, avg(o_totalprice)
from samples.tpch.orders
GROUP BY 1
ORDER BY 1 DESC

Trechtervisualisatie

De trechtervisualisatie helpt bij het analyseren van de wijziging in een metrische waarde in verschillende fasen. Als u de trechter wilt gebruiken, geeft u een step en een value kolom op.

Notitie

Trechter ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.

Trechtervoorbeeld

Configuratiewaarden: Voor deze trechtervisualisatie zijn de volgende waarden ingesteld:

  • Stapkolom (gegevenssetkolom): o_orderstatus
  • Waardekolom (gegevenssetkolom): Revenue

SQL-query: Voor deze trechtervisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

SELECT o_orderstatus, sum(o_totalprice) as Revenue
FROM samples.tpch.orders
GROUP BY 1

Choropleth-kaartvisualisatie

In choroplethvisualisaties worden geografische locaties, zoals landen of staten, gekleurd op basis van de geaggregeerde waarden van elke sleutelkolom. De query moet geografische locaties retourneren op naam.

Notitie

Choropleth-visualisaties voeren geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.

Voorbeeld van kaart choropleth

Configuratiewaarden: Voor deze choroplethvisualisatie zijn de volgende waarden ingesteld:

  • Kaart (gegevenssetkolom): Countries
  • Geografische kolom (gegevenssetkolom): Nation
  • Geografisch type: Korte naam
  • Waardekolom (gegevenssetkolom): revenue
  • Clustermodus: equidistant

Configuratieopties: Zie choropleth-configuratieopties voor choropleth-configuratieopties.

SQL-query: Voor deze choroplethvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1

Visualisatie van markeringskaart

In markeringsvisualisaties wordt een markering op een set coördinaten op de kaart geplaatst. Het queryresultaat moet breedte- en lengtegraadparen retourneren.

Notitie

Markering voert geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.

Voorbeeld van kaartmarkering

Dit voorbeeld van een markering wordt gegenereerd op basis van een gegevensset met waarden voor breedtegraad en lengtegraad, die niet beschikbaar zijn in de Databricks-voorbeeldgegevenssets. Zie configuratieopties voor markeringen voor choropleth-configuratieopties.

Visualisatie van draaitabel

Met een draaitabelvisualisatie worden records van een queryresultaat samengevoegd in een nieuwe tabelweergave. Het is vergelijkbaar met PIVOT of GROUP BY instructies in SQL. U configureert de draaitabelvisualisatie met velden voor slepen en neerzetten.

Notitie

Draaitabellen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt. Draaitabel (verouderd) ondersteunt echter alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.

Voorbeeld van draaitabel

Configuratiewaarden: Voor deze draaitabelvisualisatie zijn de volgende waarden ingesteld:

  • Rijen selecteren (gegevenssetkolom): l_retkurnflag
  • Kolommen selecteren (gegevenssetkolom): l_shipmode
  • Cel
    • Kolom gegevensset: l_quantity
    • Aggregatietype: Som

SQL-query: Voor deze draaitabelvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.lineitem

Sankey

Een sankey-diagram visualiseert de stroom van de ene set waarden naar de andere.

Notitie

Sankey-visualisaties voeren geen aggregaties van gegevens uit binnen de resultatenset. Alle aggregaties moeten worden berekend binnen de query zelf.

Voorbeeld van Sankey

SQL-query: Voor deze Sankey-visualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Zonnestraalreeks

Een zonnestraaldiagram helpt bij het visualiseren van hiërarchische gegevens met behulp van concentrische cirkels.

Notitie

Zonnestraalreeks voert geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.

Zonnestraalvoorbeeld

SQL-query: Voor deze zonnestraalvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Tabel

In de tabelvisualisatie worden gegevens in een standaardtabel weergegeven, maar met de mogelijkheid om de gegevens handmatig te ordenen, te verbergen en op te maken. Zie tabelopties.

Notitie

Tabelvisualisaties voeren geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.

Zie tabelconfiguratieopties voor opties voor tabelconfiguratie.

Word-cloud

Een woordwolk vertegenwoordigt de frequentie van een woord dat in de gegevens voorkomt.

Notitie

Word Cloud ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.

Voorbeeld van Word-cloud

Configuratiewaarden: Voor deze word cloudvisualisatie zijn de volgende waarden ingesteld: test

  • Kolom Woorden (gegevenssetkolom): o_comment
  • Lengtelimiet voor woorden: 5
  • Frequentielimiet: 2

SQL-query: Voor deze word cloudvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.

select * from samples.tpch.orders