Visualisatietypen
Dit artikel bevat een overzicht van de typen visualisaties die beschikbaar zijn voor gebruik in Azure Databricks-notebooks en in Databricks SQL, en laat zien hoe u een voorbeeld van elk visualisatietype maakt.
Notitie
Zie Dashboardvisualisatietypen voor meer informatie over de visualisatietypen die beschikbaar zijn voor AI/BI-dashboards.
Staafdiagram
Staafdiagrammen vertegenwoordigen de wijziging in metrische gegevens in de loop van de tijd of om evenredigheid weer te geven, vergelijkbaar met een cirkeldiagram .
Notitie
Staafdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van een staafdiagram zijn de volgende waarden ingesteld:
- X-kolom:
- Kolom gegevensset:
o_orderdate
- Datumniveau:
Months
- Kolom gegevensset:
- Y-kolommen:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Sum
- Kolom gegevensset:
- Groeperen op (kolom gegevensset):
o_orderpriority
- Stapelen:
Stack
- X-asnaam (standaardwaarde negeren):
Order month
- Y-asnaam (standaardwaarde negeren):
Total price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor de configuratie van staafdiagrammen.
SQL-query: Voor deze staafdiagramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Lijndiagram
Lijndiagrammen presenteren de wijziging in een of meer metrische gegevens in de loop van de tijd.
Notitie
Lijndiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder afkapping van de resultatenset.
Configuratiewaarden: Voor deze visualisatie van het lijndiagram zijn de volgende waarden ingesteld:
- X-kolom:
- Kolom gegevensset:
o_orderdate
- Datumniveau:
Years
- Kolom gegevensset:
- Y-kolommen:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Average
- Kolom gegevensset:
- Groeperen op (kolom gegevensset):
o_orderpriority
- X-asnaam (standaardwaarde negeren):
Order year
- Y-asnaam (standaardwaarde negeren):
Average price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor configuratie van lijndiagrammen.
SQL-query: Voor deze visualisatie van het lijndiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Vlakdiagram
Vlakdiagrammen combineren het lijn- en staafdiagram om te laten zien hoe de numerieke waarden van een of meer groepen veranderen over de voortgang van een tweede variabele, meestal die van tijd. Ze worden vaak gebruikt om wijzigingen in de verkooptrechter in de loop van de tijd weer te geven.
Notitie
Vlakdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van het vlakdiagram zijn de volgende waarden ingesteld:
- X-kolom:
- Kolom gegevensset:
o_orderdate
- Datumniveau:
Years
- Kolom gegevensset:
- Y-kolommen:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Sum
- Kolom gegevensset:
- Groeperen op (kolom gegevensset):
o_orderpriority
- Stapelen:
Stack
- X-asnaam (standaardwaarde negeren):
Order year
- Y-asnaam (standaardwaarde negeren):
Total price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor vlakdiagrammen.
SQL-query: Voor deze visualisatie van het vlakdiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Cirkeldiagrammen
Cirkeldiagrammen tonen evenredigheid tussen metrische gegevens. Ze zijn niet bedoeld voor het overbrengen van tijdreeksgegevens.
Notitie
Cirkeldiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van het cirkeldiagram zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
o_orderpriority
- Y-kolommen:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Sum
- Kolom gegevensset:
- Label (standaardwaarde overschrijven):
Total price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor de configuratie van cirkeldiagrammen.
SQL-query: Voor deze cirkeldiagramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Histogrammen
In een histogram wordt de frequentie van een bepaalde waarde in een gegevensset weergegeven. Een histogram helpt u te begrijpen of een gegevensset waarden bevat die rond een klein aantal bereiken zijn geclusterd of meer zijn verdeeld. Een histogram wordt weergegeven als een staafdiagram waarin u het aantal afzonderlijke balken (ook wel bins genoemd) bepaalt.
Notitie
Histogrammen bieden ondersteuning voor back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van het histogram zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
o_totalprice
- Aantal bins: 20
- X-asnaam (standaardwaarde negeren):
Total price
Configuratieopties: Zie configuratieopties voor histogramgrafiek voor opties voor histogramconfiguratie.
SQL-query: Voor deze histogramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Heatmapgrafiek
Heatmap-grafieken combineren functies van staafdiagrammen, stapelen en bellendiagrammen, zodat u numerieke gegevens kunt visualiseren met behulp van kleuren. Een gemeenschappelijk kleurenpalet voor een heatmap toont de hoogste waarden met warmere kleuren, zoals oranje of rood, en de laagste waarden met koelere kleuren, zoals blauw of paars.
Denk bijvoorbeeld aan de volgende heatmap die de meest voorkomende afstanden van taxiritten per dag visualiseert en de resultaten groepeert op de dag van de week, afstand en het totale tarief.
Notitie
Heatmapgrafieken ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder afkapping van de resultatenset.
Configuratiewaarden: Voor deze heatmapgrafiekvisualisatie zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
o_orderpriority
- Y-kolommen (gegevenssetkolom):
o_orderstatus
- Kleurkolom:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Average
- Kolom gegevensset:
- X-asnaam (standaardwaarde negeren):
Order priority
- Naam van Y-as (standaardwaarde overschrijven):
Order status
- Kleurenschema (standaardwaarde overschrijven):
YIGnBu
Configuratieopties: Zie configuratieopties voor heatmapgrafieken voor opties voor heatmapconfiguratie.
SQL-query: Voor deze heatmapgrafiekvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Spreidingsdiagram
Spreidingsvisualisaties worden vaak gebruikt om de relatie tussen twee numerieke variabelen weer te geven. Daarnaast kan een derde dimensie worden gecodeerd met kleur om te laten zien hoe de numerieke variabelen verschillen tussen groepen.
Notitie
Spreidingsdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van een spreidingsdiagram zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
l_quantity
- Y-kolom (gegevenssetkolom):
l_extendedprice
- Groeperen op (kolom gegevensset):
l_returnflag
- X-asnaam (standaardwaarde negeren):
Quantity
- Y-asnaam (standaardwaarde negeren):
Extended price
Configuratieopties: Zie configuratieopties voor spreidingsdiagrammen.
SQL-query: Voor deze visualisatie van een spreidingsdiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Bellendiagram
Bellendiagrammen zijn spreidingsdiagrammen waarbij de grootte van elke puntmarkering een relevante metrische waarde weergeeft.
Notitie
Bellendiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van bellendiagrammen zijn de volgende waarden ingesteld:
- X (gegevenssetkolom):
l_quantity
- Y-kolommen (gegevenssetkolom):
l_extendedprice
- Groeperen op (kolom gegevensset):
l-returnflag
- Kolom met bellengrootte (gegevenssetkolom):
l_tax
- Belgroottecoëfficiënt: 20
- X-asnaam (standaardwaarde negeren):
Quantity
- Y-asnaam (standaardwaarde negeren):
Extended price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor configuratie van bellendiagrammen.
SQL-query: Voor deze visualisatie van bellendiagrammen is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Box chart
In de visualisatie van het vakdiagram ziet u het distributieoverzicht van numerieke gegevens, optioneel gegroepeerd op categorie. Met behulp van een visualisatie van een boxgrafiek kunt u snel de waardebereiken in categorieën vergelijken en de lokaliteit, spreiding en scheefheid van de waarden visualiseren via hun kwartielen. In elk vak toont de donkerdere lijn het interquartielbereik. Zie het boxgrafiekartikel op Wikipedia voor meer informatie over het interpreteren van boxplotvisualisaties.
Notitie
Box-grafieken ondersteunen alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: Voor deze visualisatie van een boxdiagram zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
l-returnflag
- Y-kolommen (gegevenssetkolom):
l_extendedprice
- Groeperen op (kolom gegevensset):
l_shipmode
- X-asnaam (standaardwaarde negeren):
Return flag1
- Y-asnaam (standaardwaarde negeren):
Extended price
Configuratieopties: Zie de configuratieopties voor boxgrafieken voor opties voor de configuratie van boxgrafieken.
SQL-query: Voor deze grafiekvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Combinatiegrafiek
Combinatiegrafieken combineren lijn - en staafdiagrammen om de wijzigingen in de loop van de tijd te presenteren met evenredigheid.
Notitie
Combinatiegrafieken ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van een combinatiegrafiek zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
l_shipdate
- Y-kolommen:
- Eerste kolom gegevensset:
l_extendedprice
- Aggregatietype: gemiddelde
- Kolom tweede gegevensset:
l_quantity
- Aggregatietype: gemiddelde
- Eerste kolom gegevensset:
- X-asnaam (standaardwaarde negeren):
Ship date
- Naam van linker Y-as (standaardwaarde overschrijven):
Quantity
- Naam van rechter Y-as (standaardwaarde overschrijven):
Average price
- Reeks:
- Order1 (kolom gegevensset):
AVG(l_extendedprice)
- Y-as: rechts
- Type: Lijn
- Order2 (kolom gegevensset):
AVG(l_quantity)
- Y-as: links
- Type: Balk
- Order1 (kolom gegevensset):
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor combinatiegrafieken.
SQL-query: Voor deze visualisatie van een combinatiegrafiek is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Cohortanalyse
Een cohortanalyse onderzoekt de resultaten van vooraf vastgestelde groepen, cohorten genoemd, terwijl ze door een reeks fasen gaan. De cohortvisualisatie aggregeert alleen over datums (dit maakt maandelijkse aggregaties mogelijk). Er worden geen andere aggregaties van gegevens in de resultatenset uitgevoerd. Alle andere aggregaties worden uitgevoerd binnen de query zelf.
Configuratiewaarden: Voor deze cohortvisualisatie zijn de volgende waarden ingesteld:
- Datum (bucket) (databasekolom):
cohort_month
- Fase (databasekolom):
months
- Grootte van bucketpopulatie (databasekolom):
size
- Fasewaarde (databasekolom):
active
- Tijdsinterval:
monthly
Configuratieopties: Zie opties voor cohortgrafiekconfiguratie voor cohortconfiguraties.
SQL-query: Voor deze cohortvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
-- match each customer with its cohort by month
with cohort_dates as (
SELECT o_custkey, min(date_trunc('month', o_orderdate)) as cohort_month
FROM samples.tpch.orders
GROUP BY 1
),
-- find the size of each cohort
cohort_size as (
SELECT cohort_month, count(distinct o_custkey) as size
FROM cohort_dates
GROUP BY 1
)
-- for each cohort and month thereafter, find the number of active customers
SELECT
cohort_dates.cohort_month,
ceil(months_between(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month)) as months,
count(distinct samples.tpch.orders.o_custkey) as active,
first(size) as size
FROM samples.tpch.orders
left join cohort_dates on samples.tpch.orders.o_custkey = cohort_dates.o_custkey
left join cohort_size on cohort_dates.cohort_month = cohort_size.cohort_month
WHERE datediff(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month) != 0
GROUP BY 1, 2
ORDER BY 1, 2
Tellerweergave
Tellers geven één enkele waarde prominent weer, met een optie om deze te vergelijken met een doelwaarde. Als u meteritems wilt gebruiken, geeft u op welke rij met gegevens moet worden weergegeven in de tellervisualisatie voor de waardekolom en doelkolom.
Notitie
Teller ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: Voor deze tellervisualisatie zijn de volgende waarden ingesteld:
- Waardekolom
- Kolom gegevensset:
avg(o_totalprice)
- Rij 1:
- Kolom gegevensset:
- Doelkolom:
- Kolom gegevensset:
avg(o_totalprice)
- Rij 2:
- Kolom gegevensset:
- Doelwaarde opmaken: inschakelen
SQL-query: Voor deze tellervisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select o_orderdate, avg(o_totalprice)
from samples.tpch.orders
GROUP BY 1
ORDER BY 1 DESC
Trechtervisualisatie
De trechtervisualisatie helpt bij het analyseren van de wijziging in een metrische waarde in verschillende fasen. Als u de trechter wilt gebruiken, geeft u een step
en een value
kolom op.
Notitie
Trechter ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: Voor deze trechtervisualisatie zijn de volgende waarden ingesteld:
- Stapkolom (gegevenssetkolom):
o_orderstatus
- Waardekolom (gegevenssetkolom):
Revenue
SQL-query: Voor deze trechtervisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT o_orderstatus, sum(o_totalprice) as Revenue
FROM samples.tpch.orders
GROUP BY 1
Choropleth-kaartvisualisatie
In choroplethvisualisaties worden geografische locaties, zoals landen of staten, gekleurd op basis van de geaggregeerde waarden van elke sleutelkolom. De query moet geografische locaties retourneren op naam.
Notitie
Choropleth-visualisaties voeren geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.
Configuratiewaarden: Voor deze choroplethvisualisatie zijn de volgende waarden ingesteld:
- Kaart (gegevenssetkolom):
Countries
- Geografische kolom (gegevenssetkolom):
Nation
- Geografisch type: Korte naam
- Waardekolom (gegevenssetkolom):
revenue
- Clustermodus: equidistant
Configuratieopties: Zie choropleth-configuratieopties voor choropleth-configuratieopties.
SQL-query: Voor deze choroplethvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1
Visualisatie van markeringskaart
In markeringsvisualisaties wordt een markering op een set coördinaten op de kaart geplaatst. Het queryresultaat moet breedte- en lengtegraadparen retourneren.
Notitie
Markering voert geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.
Dit voorbeeld van een markering wordt gegenereerd op basis van een gegevensset met waarden voor breedtegraad en lengtegraad, die niet beschikbaar zijn in de Databricks-voorbeeldgegevenssets. Zie configuratieopties voor markeringen voor choropleth-configuratieopties.
Visualisatie van draaitabel
Met een draaitabelvisualisatie worden records van een queryresultaat samengevoegd in een nieuwe tabelweergave. Het is vergelijkbaar met PIVOT
of GROUP BY
instructies in SQL. U configureert de draaitabelvisualisatie met velden voor slepen en neerzetten.
Notitie
Draaitabellen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt. Draaitabel (verouderd) ondersteunt echter alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: Voor deze draaitabelvisualisatie zijn de volgende waarden ingesteld:
- Rijen selecteren (gegevenssetkolom):
l_retkurnflag
- Kolommen selecteren (gegevenssetkolom):
l_shipmode
- Cel
- Kolom gegevensset:
l_quantity
- Aggregatietype: Som
- Kolom gegevensset:
SQL-query: Voor deze draaitabelvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Sankey
Een sankey-diagram visualiseert de stroom van de ene set waarden naar de andere.
Notitie
Sankey-visualisaties voeren geen aggregaties van gegevens uit binnen de resultatenset. Alle aggregaties moeten worden berekend binnen de query zelf.
SQL-query: Voor deze Sankey-visualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
Zonnestraalreeks
Een zonnestraaldiagram helpt bij het visualiseren van hiërarchische gegevens met behulp van concentrische cirkels.
Notitie
Zonnestraalreeks voert geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.
SQL-query: Voor deze zonnestraalvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
Tabel
In de tabelvisualisatie worden gegevens in een standaardtabel weergegeven, maar met de mogelijkheid om de gegevens handmatig te ordenen, te verbergen en op te maken. Zie tabelopties.
Notitie
Tabelvisualisaties voeren geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.
Zie tabelconfiguratieopties voor opties voor tabelconfiguratie.
Word-cloud
Een woordwolk vertegenwoordigt de frequentie van een woord dat in de gegevens voorkomt.
Notitie
Word Cloud ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: Voor deze word cloudvisualisatie zijn de volgende waarden ingesteld: test
- Kolom Woorden (gegevenssetkolom):
o_comment
- Lengtelimiet voor woorden: 5
- Frequentielimiet: 2
SQL-query: Voor deze word cloudvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders