Transformatieonderdeel toepassen

In dit artikel wordt een onderdeel in Azure Machine Learning Designer beschreven.

Gebruik dit onderdeel om een invoergegevensset te wijzigen op basis van een eerder berekende transformatie. Dit onderdeel is nodig als u transformaties in deductiepijplijnen moet bijwerken.

Als u bijvoorbeeld z-scores hebt gebruikt om uw trainingsgegevens te normaliseren met behulp van het onderdeel Gegevens normaliseren , wilt u ook de z-scorewaarde gebruiken die is berekend voor training tijdens de scorefase. In Azure Machine Learning kunt u de normalisatiemethode opslaan als een transformatie en vervolgens de Z-score toepassen op de invoergegevens voordat u scoren.

Transformaties opslaan

Met de ontwerpfunctie kunt u gegevenstransformaties opslaan als gegevenssets , zodat u ze in andere pijplijnen kunt gebruiken.

  1. Selecteer een gegevenstransformatieonderdeel dat is uitgevoerd.

  2. Selecteer het tabblad Uitvoer en logboeken.

  3. Zoek de transformatie-uitvoer en selecteer de gegevensset Registreren om deze op te slaan als onderdeel onder de categorie Gegevenssets in het onderdeelpalet.

Transformatie toepassen gebruiken

  1. Voeg het onderdeel Transformatie toepassen toe aan uw pijplijn. U vindt dit onderdeel in de sectie Modelscore en evaluatie van het onderdeelpalet.

  2. Zoek de opgeslagen transformatie die u wilt gebruiken onder Gegevenssets in het onderdelenpalet.

  3. Verbinding maken de uitvoer van de opgeslagen transformatie naar de linkerinvoerpoort van de Het onderdeel Transformatie toepassen.

    De gegevensset moet precies hetzelfde schema hebben (aantal kolommen, kolomnamen, gegevenstypen) als de gegevensset waarvoor de transformatie voor het eerst is ontworpen.

  4. Verbinding maken de uitvoer van de gegevensset van het gewenste onderdeel naar de juiste invoerpoort van de Het onderdeel Transformatie toepassen.

  5. Als u een transformatie wilt toepassen op de nieuwe gegevensset, dient u de pijplijn in.

Belangrijk

Om ervoor te zorgen dat de bijgewerkte transformatie in trainingspijplijnen ook haalbaar is in deductiepijplijnen, moet u de onderstaande stappen volgen telkens wanneer de transformatie in de trainingspijplijn wordt bijgewerkt:

  1. Registreer in de trainingspijplijn de uitvoer van de transformatie Kolommen selecteren als een gegevensset. Register dataset of component output
  2. Verwijder het TD-onderdeel in de deductiepijplijn en vervang dit door de geregistreerde gegevensset in de vorige stap. Replace TD component

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.