Delen via


Gegevenstransformatie

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel worden de modules vermeld die in Machine Learning Studio (klassiek) voor gegevenstransformatie worden geleverd. Voor machine learning omvat gegevenstransformatie enkele zeer algemene taken, zoals het samenvoegen van gegevenssets of het wijzigen van kolomnamen. Maar het bevat ook veel taken die specifiek zijn voor machine learning, zoals normalisering, binning en groepering, en de deferatie van ontbrekende waarden.

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Belangrijk

Gegevens die u in Machine Learning Studio (klassiek) gebruikt, worden doorgaans 'netjes' verwacht voordat u deze in Machine Learning Studio (klassiek) importeert. Gegevensvoorbereiding kan bijvoorbeeld zijn om ervoor te zorgen dat de gegevens de juiste codering gebruiken en controleren of de gegevens een consistent schema hebben.

Modules voor gegevenstransformatie worden gegroepeerd in de volgende op taken gebaseerde categorieën:

  • Filters maken voor digitale signaalverwerking: Digitale signaalfilters kunnen worden toegepast op numerieke gegevens ter ondersteuning van machine learning-taken zoals afbeeldingsherkenning, spraakherkenning en waveform-analyse.
  • Functies op basis van tellingen genereren en gebruiken: op telling gebaseerde featurization-modules helpen u bij het ontwikkelen van compacte functies voor gebruik in machine learning.
  • Algemene gegevensmanipulatie en -voorbereiding: het samenvoegen van gegevenssets, het opsommen van ontbrekende waarden, het groeperen en samenvatten van gegevens, het wijzigen van kolomnamen en gegevenstypen, of het aangeven van welke kolom een label of een functie is.
  • Steekproeven nemen en gegevenssets splitsen: Verdeel uw gegevens in trainings- en testsets, splits gegevenssets op percentage of op basis van een filtervoorwaarde of voer steekproeven uit.
  • Gegevens schalen en verminderen: bereid numerieke gegevens voor op analyse door normalisatie toe te passen of door te schalen. Gegevens in groepen opslaan, uitbijten verwijderen of vervangen, of PCA (Principal Component Analysis) uitvoeren.

Lijst met modules

De volgende modulecategorieën zijn opgenomen in de categorie Gegevenstransformatie :

Zie ook