Hisztogramok ábrázolása Pythonban

A következőkre vonatkozik:SQL Server Azure SQL Database Felügyelt Azure SQL-példány SQL-adatbázis a Microsoft Fabricben

Ez a cikk azt ismerteti, hogyan ábrázolhat adatokat a Python-csomag pandas'.hist() használatával. Az SQL Server-adatbázis az egymást követő, nem egymást átfedő értékekkel rendelkező hisztogramadat-intervallumok vizualizációjára szolgál.

Prerequisites

SQL Server Windowshoz vagy Linuxhoz

Azure SQL-adatbázis

SQL-adatbázis a Fabricben

Felügyelt Azure SQL-példány
SQL Server Management Studio a mintaadatbázis azure SQL Managed Instance-re való visszaállításához.

Azure Data Studio. A telepítéshez tekintse meg az Azure Data Studiót.
Állítsa vissza a DW-mintaadatbázist a cikkben használt mintaadatok lekéréséhez.

Visszaállított adatbázis ellenőrzése

A visszaállított adatbázis meglétét a tábla lekérdezésével Person.CountryRegion ellenőrizheti:

USE AdventureWorksDW;
SELECT * FROM Person.CountryRegion;

Python-csomagok telepítése

Töltse le és telepítse az Azure Data Studiót.

Telepítse a következő Python-csomagokat:

pyodbc
pandas
sqlalchemy
matplotlib

A csomagok telepítése:

Az Azure Data Studio-jegyzetfüzetben válassza a Csomagok kezelése lehetőséget.
A Csomagok kezelése panelen válassza az Új hozzáadása lapot.
Az alábbi csomagok mindegyikéhez adja meg a csomag nevét, válassza a Keresés lehetőséget, majd a Telepítés lehetőséget.

Hisztogram ábrázolása

A hisztogramban megjelenített elosztott adatok egy SQL-lekérdezésen alapulnak.AdventureWorksDW2025 A hisztogram megjeleníti az adatokat és az adatértékek gyakoriságát.

Szerkessze a kapcsolati sztring változóit: server, database, username, és password, azért, hogy csatlakozzon az SQL Server-adatbázishoz.

Új jegyzetfüzet létrehozása:

Az Azure Data Studióban válassza a Fájl lehetőséget, majd az Új jegyzetfüzet lehetőséget.
A jegyzetfüzetben válassza a Python3 kernelt, majd a +kódot.

Kód beillesztése a jegyzetfüzetbe. Válassza az összes futtatása lehetőséget.

import pyodbc 
import pandas as pd
import matplotlib
import sqlalchemy

from sqlalchemy import create_engine

matplotlib.use('TkAgg', force=True)
from matplotlib import pyplot as plt

# Some other example server values are
# server = 'localhost\sqlexpress' # for a named instance
# server = 'myserver,port' # to specify an alternate port
server = 'servername'
database = 'AdventureWorksDW2022'
username = 'yourusername'
password = 'databasename'

url = 'mssql+pyodbc://{user}:{passwd}@{host}:{port}/{db}?driver=SQL+Server'.format(user=username, passwd=password, host=server, port=port, db=database)
engine = create_engine(url)

sql = "SELECT DATEDIFF(year, c.BirthDate, GETDATE()) AS Age FROM [dbo].[FactInternetSales] s INNER JOIN dbo.DimCustomer c ON s.CustomerKey = c.CustomerKey"

df = pd.read_sql(sql, engine)
df.hist(bins=50)

plt.show()

A kijelzőn az ügyfelek életkor szerinti eloszlása látható a FactInternetSales táblázatban.

A Pandas hisztogram eloszlását bemutató ábra.

Visszajelzés

Hasznosnak találta ezt az oldalt?

Last updated on 2025-11-18