Demodata för flygankomster för handledningar i SQL Server, Python och R.

gäller för: SQL Server 2016 (13.x) och senare versioner

I den här övningen skapar du en SQL Server-databas för att lagra importerade data från inbyggda R- eller Python-demodatauppsättningar för Airline. R- och Python-distributioner ger motsvarande data som du kan importera till en SQL Server-databas med hjälp av Management Studio.

För att slutföra den här övningen bör du ha SQL Server Management Studio (SSMS) eller ett annat verktyg som kan köra T-SQL-frågor.

Självstudier och snabbstarter med hjälp av den här datauppsättningen omfattar följande:

Skapa databasen

  1. Starta SQL Server Management Studio, anslut till en databasmotorinstans som har R- eller Python-integrering.

  2. Högerklicka på Databaser i Object Explorer och skapa en ny databas med namnet flightdata.

  3. Högerklicka på flightdata, klicka på Uppgifter, klicka på Importera flat fil.

  4. Öppna den AirlineDemoData.csv fil som anges i R- eller Python-distributionen, beroende på vilket språk du har installerat.

    För R letar du efter AirlineDemoSmall.csv på C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR\SampleData

    För Python letar du efter AirlineDemoSmall.csv på C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\PYTHON_SERVICES\Lib\site-packages\revoscalepy\data\sample_data

När du väljer filen fylls standardvärdena i för tabellnamn och schema.

Importguiden för platt fil visar standardvärden för flygbolagsdemo

Klicka igenom de återstående sidorna och acceptera standardinställningarna för att importera data.

Fråga efter data

Som ett valideringssteg kör du en fråga för att bekräfta att data har laddats upp.

  1. Högerklicka på databasen flightdata under Databaser i Object Explorer och starta en ny fråga.

  2. Kör några enkla frågor:

    SELECT TOP(10) * FROM AirlineDemoSmall;
    SELECT COUNT(*) FROM AirlineDemoSmall;
    

Nästa steg

I följande lektion skapar du en linjär regressionsmodell baserat på dessa data.