Sdílet prostřednictvím


Kurz Pythonu: Předpověď půjčování lyží pomocí lineární regrese pomocí strojového učení SQL

Platí pro: SQL Server 2017 (14.x) a novější verze Azure SQL Managed Instance

V této čtyřdílné sérii kurzů použijete Python a lineární regresi ve službě SQL Server Machine Learning Services nebo v clusterech s velkými objemy dat SQL Serveru 2019 k predikci počtu půjčoven lyží. Tento kurz používá poznámkový blok Pythonu v Nástroji Azure Data Studio.

V této čtyřdílné sérii kurzů budete používat Python a lineární regresi ve službě SQL Server Machine Learning Services k predikci počtu půjčovny lyží. Tento kurz používá poznámkový blok Pythonu v Nástroji Azure Data Studio.

V této čtyřdílné sérii kurzů budete používat Python a lineární regresi ve službě Azure SQL Managed Instance Machine Learning Services k predikci počtu půjčovny lyží. Tento kurz používá poznámkový blok Pythonu v Nástroji Azure Data Studio.

Představte si, že vlastníte půjčovnu lyží a chcete předpovědět počet půjčoven, které budete mít v budoucnu. Tyto informace vám pomůžou připravit vaše zásoby, personál a zařízení.

V první části této série si nastavíte předpoklady. Ve dvou a třech částech vytvoříte v poznámkovém bloku některé skripty Pythonu, které připraví data a vytrénují model strojového učení. Ve třetí části pak tyto skripty Pythonu spustíte uvnitř databáze pomocí uložených procedur T-SQL.

V tomto článku se naučíte:

  • Import ukázkové databáze

V druhé části se dozvíte, jak načíst data z databáze do datového rámce Pythonu a připravit data v Pythonu.

Ve třetí části se naučíte trénovat model lineární regrese v Pythonu.

Ve čtvrté části se dozvíte, jak model uložit do databáze a pak vytvořit uložené procedury ze skriptů Pythonu, které jste vytvořili ve dvou a třech částech. Uložené procedury budou spuštěny na serveru, aby vytvořily předpovědi na základě nových dat.

Požadavky

  • Integrované vývojové prostředí Pythonu – Tento kurz používá poznámkový blok Pythonu v nástroji Azure Data Studio. Další informace najdete v tématu Použití poznámkových bloků v nástroji Azure Data Studio.

  • Dotazovací nástroj SQL – Tento kurz předpokládá, že používáte Azure Data Studio.

  • Další balíčky Pythonu – Příklady v této sérii kurzů používají následující balíčky Pythonu, které nemusí být ve výchozím nastavení nainstalovány:

    • pandas
    • pyodbc
    • scikit-learn

    Instalace těchto balíčků:

    1. V poznámkovém bloku Azure Data Studio vyberte Spravovat balíčky.
    2. V podokně Spravovat balíčky vyberte kartu Přidat novou .
    3. Pro každý z následujících balíčků zadejte název balíčku, vyberte Hledat a pak vyberte Nainstalovat.

    Alternativně můžete otevřít příkazový řádek, změnit instalační cestu pro verzi Pythonu, kterou používáte v Nástroji Azure Data Studio (například cd %LocalAppData%\Programs\Python\Python37-32), a pak spustit pip install pro každý balíček.

Obnovení ukázkové databáze

Ukázková databáze použitá v tomto kurzu byla uložena do záložního .bak souboru databáze, který můžete stáhnout a použít.

Poznámka:

Pokud používáte službu Machine Learning Services v clusterech s velkými objemy dat SQL Serveru 2019, podívejte se, jak obnovit databázi do hlavní instance clusteru pro velké objemy dat.

  1. Stáhněte soubor TutorialDB.bak.

  2. Postupujte podle pokynů v části Obnovení databáze ze záložního souboru v Nástroji Azure Data Studio pomocí těchto podrobností:

    • Importujte ze staženého TutorialDB.bak souboru.
    • Pojmenujte cílovou databázi TutorialDB.
  3. Obnovenou databázi můžete ověřit dotazem na dbo.rental_data tabulku:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Stáhněte soubor TutorialDB.bak.

  2. Postupujte podle pokynů v tématu Obnovení databáze do služby Azure SQL Managed Instance v aplikaci SQL Server Management Studio pomocí těchto podrobností:

    • Importujte ze staženého TutorialDB.bak souboru.
    • Pojmenujte cílovou databázi TutorialDB.
  3. Obnovenou databázi můžete ověřit dotazem na dbo.rental_data tabulku:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Vyčistěte zdroje

Pokud nebudete pokračovat v tomto kurzu, odstraňte TutorialDB databázi.

Další krok

V první části této série kurzů jste dokončili tyto kroky:

  • Nainstalovány nezbytné předpoklady
  • Import ukázkové databáze

Pokud chcete připravit data z databáze TutorialDB, postupujte podle druhé části této série kurzů: