Scikit-learn használata az Azure Databricksben
Ez a lap példákat tartalmaz arra, hogyan taníthat be gépi tanulási modelleket az Azure Databricksben a scikit-learn
csomag használatával. A scikit-learn az egycsomópontos gépi tanulás egyik legnépszerűbb Python-kódtára, amely a Databricks Runtime és a Databricks Runtime ML része. Tekintse meg a Databricks Runtime kiadási megjegyzéseit a fürt futtatókörnyezetében található scikit-learn kódtár verziójához.
Importálhatja ezeket a jegyzetfüzeteket, és futtathatja őket az Azure Databricks-munkaterületen.
További példajegyzetfüzetek az Azure Databricks gyors használatbavételéhez: Oktatóanyagok: Ismerkedés az AI-vel és a gépi tanulással.
Egyszerű példa a scikit-learn használatával
Ez a jegyzetfüzet gyors áttekintést nyújt az Azure Databricks gépi tanulási modelljeinek betanításáról. A csomag használatával scikit-learn
betanítja az egyszerű besorolási modellt. Emellett bemutatja az MLflow használatát a modellfejlesztési folyamat nyomon követésére, az Optuna pedig a hiperparaméterek finomhangolásának automatizálására.
Ha a munkaterület engedélyezve van a Unity Cataloghoz, használja a jegyzetfüzet ezen verzióját:
scikit-learn besorolási jegyzetfüzet (Unity Catalog)
Ha a munkaterület nincs engedélyezve a Unity Catalogban, használja a jegyzetfüzet ezen verzióját:
scikit-learn besorolási jegyzetfüzet
Végpontok közötti példa scikit-learn használatával az Azure Databricksben
Ez a jegyzetfüzet scikit-learn használatával szemlélteti az adatok betöltésének teljes körű példáját, a modell betanítását, az elosztott hiperparaméter-finomhangolást és a modell következtetését. Emellett bemutatja a modell életciklusának kezelését az MLflow Modellregisztrációs adatbázis használatával a modell naplózásához és regisztrálásához.
Ha a munkaterület engedélyezve van a Unity Cataloghoz, használja a jegyzetfüzet ezen verzióját:
Scikit-learn használata MLflow-integrációval a Databricksben (Unity Catalog)
Ha a munkaterület nincs engedélyezve a Unity Catalogban, használja a jegyzetfüzet ezen verzióját: