Transformatieonderdeel toepassen

In dit artikel wordt een onderdeel in Azure Machine Learning designer beschreven.

Gebruik dit onderdeel om een invoergegevensset te wijzigen op basis van een eerder berekende transformatie. Dit onderdeel is nodig als u transformaties in deductiepijplijnen moet bijwerken.

Als u bijvoorbeeld z-scores hebt gebruikt om uw trainingsgegevens te normaliseren met behulp van het onderdeel Normalize Data , wilt u ook de z-scorewaarde gebruiken die tijdens de scorefase is berekend voor training. In Azure Machine Learning kunt u de normalisatiemethode opslaan als een transformatie en vervolgens transformatie toepassen om de z-score toe te passen op de invoergegevens voordat u gaat scoren.

Transformaties opslaan

Met de ontwerpfunctie kunt u gegevenstransformaties opslaan als gegevenssets , zodat u ze in andere pijplijnen kunt gebruiken.

  1. Selecteer een onderdeel voor gegevenstransformatie dat is uitgevoerd.

  2. Selecteer het tabblad Uitvoer en logboeken .

  3. Zoek de transformatie-uitvoer en selecteer de gegevensset Registreren om deze op te slaan als onderdeel onder de categorie Gegevenssets in het onderdeelpalet.

Transformatie toepassen gebruiken

  1. Voeg het onderdeel Transformatie toepassen toe aan uw pijplijn. U vindt dit onderdeel in de sectie Modelscore-evaluatie & van het onderdeelpalet.

  2. Zoek de opgeslagen transformatie die u wilt gebruiken onder Gegevenssets in het onderdeelpalet.

  3. Verbinding maken de uitvoer van de opgeslagen transformatie naar de linkerinvoerpoort van het onderdeel Transformatie toepassen.

    De gegevensset moet precies hetzelfde schema hebben (aantal kolommen, kolomnamen, gegevenstypen) als de gegevensset waarvoor de transformatie voor het eerst is ontworpen.

  4. Verbinding maken de uitvoer van de gegevensset van het gewenste onderdeel naar de juiste invoerpoort van het onderdeel Transformatie toepassen.

  5. Als u een transformatie wilt toepassen op de nieuwe gegevensset, dient u de pijplijn in.

Belangrijk

Om ervoor te zorgen dat de bijgewerkte transformatie in trainingspijplijnen ook haalbaar is in deductiepijplijnen, moet u de onderstaande stappen volgen telkens wanneer de transformatie in de trainingspijplijn wordt bijgewerkt:

  1. Registreer in de trainingspijplijn de uitvoer van de transformatie Kolommen selecteren als een gegevensset. Register dataset of component output
  2. Verwijder het TD-onderdeel in de deductiepijplijn en vervang het door de geregistreerde gegevensset in de vorige stap. Replace TD component

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.