Megosztás a következőn keresztül:


Python-oktatóanyag: NYC taxidíjak előrejelzése bináris besorolással

A következőkre vonatkozik: Sql Server 2017 (14.x) és újabb verziók Felügyelt Azure SQL-példány

Ebben az ötrészes, SQL-programozók számára készült oktatóanyag-sorozatban megismerheti az SQL Server Machine Learning Servicesben vagy a Big Data-fürtökben való Python-integrációt.

Ebben az ötrészes, SQL-programozók számára készült oktatóanyag-sorozatban megismerheti az SQL Server Machine Learning Services Python-integrációját.

Ebben az ötrészes, SQL-programozók számára készült oktatóanyag-sorozatban megismerheti a Python integrálását a Machine Learning Servicesben a felügyelt Azure SQL-példányban.

Python-alapú gépi tanulási megoldást fog létrehozni és üzembe helyezni egy mintaadatbázis használatával az SQL Serveren. A T-SQL, az Azure Data Studio vagy az SQL Server Management Studio használatára lesz szüksége, valamint egy SQL-gépi tanulás és Python-nyelv támogatással rendelkező adatbázis-példányra.

Ez az oktatóanyag-sorozat bemutatja az adatmodellezési munkafolyamatokban használt Python-függvényeket. A részek közé tartozik az adatfeltárás, a bináris besorolási modell létrehozása és betanítása, valamint a modell üzembe helyezése. A New York-i Taxi és Limousine Bizottság mintaadatait fogja használni. A model, amelyet felépítesz, előrejelzi, hogy az utazás valószínűleg eredményez-e borravalót a napszak, a megtett távolság és az átvételi hely alapján.

A sorozat első részében telepíti az előfeltételeket, és visszaállítja a mintaadatbázist. A második és a harmadik részben néhány Python-szkriptet fog fejleszteni az adatok előkészítéséhez és egy gépi tanulási modell betanítása érdekében. Ezután a negyedik és az ötödik részben ezeket a Python-szkripteket fogja futtatni az adatbázisban A T-SQL által tárolt eljárások használatával.

Ebben a cikkben a következőket fogja megismerni:

  • Előfeltételek telepítése
  • A mintaadatbázis visszaállítása

A második részben megismerheti a mintaadatokat, és létrehozhat néhány diagramot.

A harmadik részben megtanulhatja, hogyan hozhat létre funkciókat nyers adatokból egy Transact-SQL függvény használatával. Ezután meghívja ezt a függvényt egy tárolt eljárásból, hogy létrehozhasson egy táblát, amely tartalmazza a funkcióértékeket.

A negyedik részben betölti a modulokat, és meghívja a szükséges függvényeket a modell létrehozásához és betanítása egy SQL Server által tárolt eljárás használatával.

Az ötödik részben megtanulhatja, hogyan lehet üzembe helyezni a negyedik részben betanított és mentett modelleket.

Megjegyzés:

Ez az oktatóanyag R-ben és Pythonban is elérhető. Az R-verzióhoz lásd az R-oktatóanyagot: NyC taxidíjak előrejelzése bináris besorolással.

Előfeltételek

Minden feladat elvégezhető Transact-SQL tárolt eljárások használatával az Azure Data Studióban vagy a Management Studióban.

Ez az oktatóanyag-sorozat feltételezi az alapvető adatbázis-műveletek, például adatbázisok és táblák létrehozását, adatok importálását és SQL-lekérdezések írását. Nem feltételezi, hogy ismeri a Pythont, és minden Python-kód meg van adva.

Háttér SQL-fejlesztőknek

A gépi tanulási megoldás létrehozásának folyamata egy összetett folyamat, amely több eszközt is magában foglalhat, és a téma szakértőinek koordinálása több fázisban:

  • adatok beszerzése és tisztítása
  • az adatok feltárása és a modellezéshez hasznos funkciók létrehozása
  • a modell betanítása és finomhangolása
  • üzembe helyezés éles környezetben

A tényleges kód fejlesztése és tesztelése a legjobban dedikált fejlesztői környezettel végezhető el. A szkript teljes tesztelése után azonban egyszerűen üzembe helyezheti az SQL Serveren Transact-SQL tárolt eljárások használatával az Azure Data Studio vagy a Management Studio ismerős környezetében. A külső kód burkolása a tárolt eljárásokban a kód SQL Serveren való üzembe helyezése elsődleges mechanizmusa.

Miután mentette a modellt az adatbázisba, tárolt eljárások használatával meghívhatja a modellt az Transact-SQL előrejelzéseihez.

Akár a Python új SQL-programozója, akár az SQL-ben új Python-fejlesztő, ez az ötrészes oktatóanyag-sorozat egy tipikus munkafolyamatot mutat be az adatbázison belüli elemzések Pythonnal és SQL Serverrel való elvégzéséhez.

Következő lépések

Ebben a cikkben a következőt találja:

  • Telepített előfeltételek
  • A mintaadatbázis visszaállítása