Oplær modeller til maskinel indlæring

Apache Spark – en del af Microsoft Fabric – muliggør maskinel indlæring i stor skala. Brug den til at få indsigt fra store mængder strukturerede, ustrukturerede og streamingdata. Oplær modeller i Microsoft Fabric med biblioteker med åben kildekode, f.eks. Apache Spark, MLlib, SynapseML og andre.

Apache SparkML og MLlib

Apache Spark – en del af Microsoft Fabric – er en samlet parallel databehandlingsstruktur med åben kildekode. Den bruger in-memory-behandling til at fremskynde big data-analyser. Spark er bygget til hastighed, brugervenlighed og avancerede analyser. Sparks in-memory, distribuerede beregning passer til iterativ maskinlæring og grafalgoritmer.

MLlib- og SparkML-skalerbare biblioteker til maskinel indlæring giver mulighed for at udforme algoritmer i dette distribuerede miljø. MLlib leverer den originale RDD-baserede API. SparkML er en nyere pakke, der indeholder en DataFrame-baseret API på højere niveau til opbygning af ML-pipelines. Den indeholder en API på et højere niveau, der er bygget oven på DataFrames til oprettelse af ML-pipelines. SparkML understøtter endnu ikke alle MLlib-funktioner, men det erstatter MLlib som standard Spark-maskinlæringsbibliotek.

Bemærk

Få mere at vide i Oplær modeller med Apache Spark MLlib.

Populære biblioteker

Microsoft Fabric-kørslen til Apache Spark indeholder flere populære open source-pakker til træning af modeller til maskinel indlæring. Disse biblioteker leverer genanvendelig kode til dine projekter. Runtime omfatter disse biblioteker til maskinel indlæring:

Scikit-learn - et populært bibliotek med en enkelt node til klassiske maskinlæringsalgoritmer. Det understøtter de fleste overvågede og uovervågede algoritmer og håndterer datamining og dataanalyse.
XGBoost - et populært bibliotek med optimerede algoritmer til træning af beslutningstræer og tilfældige skove.
PyTorch og Tensorflow er effektive Python-biblioteker til dyb læring. Med disse biblioteker kan du angive antallet af eksekveringsfiler på din gruppe til nul for at bygge modeller med en enkelt maskine. Selvom denne konfiguration ikke understøtter Apache Spark, er det en enkel og omkostningseffektiv måde at oprette modeller med en enkelt maskine på.

SynapseML

SynapseML-biblioteket med åben kildekode (tidligere kendt som MMLSpark) hjælper dig med at oprette skalerbare pipelines til maskinel indlæring (ML). Det fremskynder eksperimentering og giver dig mulighed for at anvende avancerede teknikker, herunder dyb læring, på store datasæt.

SynapseML leverer et lag over SparkML-API'er på lavt niveau, når du bygger skalerbare ML-modeller. Disse API'er dækker strengindeksering, funktionsvektorassembly, tvang af data til layout, der er relevante for algoritmer til maskinel indlæring og meget mere. SynapseML-biblioteket forenkler disse og andre almindelige opgaver for bygning af modeller i PySpark.

Udforsk mulighederne for oplæring af modeller til maskinel indlæring i Apache Spark i Microsoft Fabric. Du kan finde flere oplysninger i:

Brug AI-eksempler til at bygge modeller til maskinel indlæring: Brug AI-eksempler
Spor kørsler af maskinel indlæring ved hjælp af eksperimenter: Eksperimenter med maskinel indlæring

Feedback

Var denne side nyttig?

Last updated on 2025-09-29