Az Apache Spark MLlib használata az Azure Databricksben
Ez az oldal az MLlib Azure Databricksen való használatát bemutató példajegyzetfüzeteket tartalmaz.
Az Apache Spark MLlib az Apache Spark skálázható gépi tanulási kódtára, amely gyakran használt tanulási algoritmusokat és segédeszközöket tartalmaz, beleértve a besorolást, regressziót, fürtözést, együttműködési szűrést, dimenziócsökkentést és mögöttes optimalizálási primitíveket. Az MLlib-funkciókkal kapcsolatos referenciainformációkért az Azure Databricks a következő Apache Spark API-referenciákat javasolja:
Az Apache Spark MLlib R-ből való használatával kapcsolatos információkért tekintse meg az R gépi tanulási dokumentációját.
Bináris besorolási példajegyzetfüzet
Ez a jegyzetfüzet bemutatja, hogyan hozhat létre bináris osztályozási alkalmazást az Apache Spark MLlib Pipelines API-val.
Bináris osztályozási jegyzetfüzet
Döntési fák példajegyzetfüzetei
Ezek a példák a döntési fák különböző alkalmazásait szemléltetik az Apache Spark MLlib Pipelines API használata esetén.
Döntési fák
Ezek a jegyzetfüzetek bemutatják, hogyan hajthat végre osztályozásokat a döntési fák segítségével.
Döntési fák számjegyfelismerési jegyzetfüzetekhez
Döntési fák SFO-felmérési jegyzetfüzetekhez
GBT-regresszió MLlib-folyamatok használatával
Ebből a jegyzetfüzetből megtudhatja, hogyan használhatja az MLlib-folyamatokat regresszió végrehajtására gradient boosting technikán alapuló fák használatával, a kerékpárkölcsönzések (óránkénti) számának előrejelzéséhez, olyan információk alapján, mint például a hét napjai, az időjárás, az évszak stb.
Közösségi kerékpáros rendszer regressziós jegyzetfüzete
Speciális Apache Spark MLlib-jegyzetfüzet– példa
Ez a jegyzetfüzet bemutatja, hogyan hozhat létre egyéni átalakítót.