Gegevens koppelen
In dit artikel wordt beschreven hoe u het onderdeel Join Data in Azure Machine Learning Designer gebruikt om twee gegevenssets samen te voegen met behulp van een samenvoegbewerking in databasestijl.
Join-gegevens configureren
Als u een join wilt uitvoeren op twee gegevenssets, moeten deze worden gerelateerd door een sleutelkolom. Samengestelde sleutels die meerdere kolommen gebruiken, worden ook ondersteund.
Voeg de gegevenssets toe die u wilt combineren en sleep het onderdeel Join Data naar uw pijplijn.
U vindt het onderdeel in de categorie Gegevenstransformatie onder Manipulatie.
Verbind de gegevenssets met het onderdeel Join Data .
Selecteer kolomkiezer starten om sleutelkolom(s) te kiezen. Vergeet niet om kolommen te kiezen voor zowel de linker- als rechterinvoer.
Voor één sleutel:
Selecteer een kolom met één sleutel voor beide invoerwaarden.
Voor een samengestelde sleutel:
Selecteer alle sleutelkolommen in de linkerinvoer en rechterinvoer in dezelfde volgorde. Het onderdeel Join Data voegt de tabellen toe wanneer alle sleutelkolommen overeenkomen. Schakel de optie Duplicaten toestaan in en behoud de kolomvolgorde in de selectie als de kolomvolgorde niet hetzelfde is als de oorspronkelijke tabel.
Selecteer de optie Identieke hoofdletters als u hoofdlettergevoeligheid voor een tekstkolomdeelname wilt behouden.
Gebruik de vervolgkeuzelijst Join-type om op te geven hoe de gegevenssets moeten worden gecombineerd.
Inner Join: Een inner join is de meest voorkomende joinbewerking. De gecombineerde rijen worden alleen geretourneerd wanneer de waarden van de sleutelkolommen overeenkomen.
Left Outer Join: Een left outer join retourneert gekoppelde rijen voor alle rijen uit de linkertabel. Wanneer een rij in de linkertabel geen overeenkomende rijen bevat in de rechtertabel, bevat de geretourneerde rij ontbrekende waarden voor alle kolommen die afkomstig zijn uit de rechtertabel. U kunt ook een vervangende waarde opgeven voor ontbrekende waarden.
Full Outer Join: Een volledige outer join retourneert alle rijen uit de linkertabel (tabel1) en van de rechtertabel (tabel2).
Voor elk van de rijen in beide tabellen zonder overeenkomende rijen in de andere tabel bevat het resultaat een rij met ontbrekende waarden.
Left Semi-Join: Een linker semi-join retourneert alleen de waarden uit de linkertabel wanneer de waarden van de sleutelkolommen overeenkomen.
Voor de optie Sleutelkolommen rechts in gekoppelde tabel behouden:
- Selecteer deze optie om de sleutels uit beide invoertabellen weer te geven.
- Schakel de selectie uit om alleen de sleutelkolommen uit de linkerinvoer te retourneren.
Verzend de pijplijn.
Als u de resultaten wilt weergeven, klikt u met de rechtermuisknop op de joingegevens en selecteert u Visualiseren.
Volgende stappen
Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.