Delen via


Draaitransformatie in toewijzingsgegevensstroom

VAN TOEPASSING OP: Azure Data Factory Azure Synapse Analytics

Tip

Probeer Data Factory uit in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .

Gegevensstromen zijn beschikbaar in Zowel Azure Data Factory als Azure Synapse Pipelines. Dit artikel is van toepassing op toewijzingsgegevensstromen. Als u geen ervaring hebt met transformaties, raadpleegt u het inleidende artikel Gegevens transformeren met behulp van een toewijzingsgegevensstroom.

Gebruik de draaitransformatie om meerdere kolommen te maken op basis van de unieke rijwaarden van één kolom. Pivot is een aggregatietransformatie waarbij u groepeert op kolommen en draaikolommen genereert met behulp van statistische functies.

Configuratie

Voor de draaitransformatie zijn drie verschillende invoer vereist: groeperen op kolommen, de draaitoets en het genereren van de gedraaide kolommen

Groeperen op

Group by options

Selecteer welke kolommen u wilt samenvoegen om de door u gekozen kolommen te aggregeren. De uitvoergegevens groeperen alle rijen met dezelfde groep op waarden in één rij. De aggregatie die in de kolom pivoted wordt uitgevoerd, vindt plaats voor elke groep.

Deze sectie is optioneel. Als er geen groeperen op kolommen is geselecteerd, wordt de hele gegevensstroom samengevoegd en wordt er slechts één rij uitgevoerd.

Draaitoets

Pivot key

De draaitoets is de kolom waarvan de rijwaarden worden ingevoerd in nieuwe kolommen. Standaard maakt de draaitransformatie een nieuwe kolom voor elke unieke rijwaarde.

In de sectie gelabelde waarde kunt u specifieke rijwaarden invoeren die moeten worden gepistemd. Alleen de rijwaarden die in deze sectie worden ingevoerd, worden pivoted. Als u null-waarde inschakelt, wordt een kolom met pivoted voor de null-waarden in de kolom gemaakt.

Kolommen met pivoted

Pivoted columns

Genereer voor elke unieke draaitabelwaarde die een kolom wordt een geaggregeerde rijwaarde voor elke groep. U kunt meerdere kolommen per draaitabelsleutel maken. Elke draaikolom moet ten minste één statistische functie bevatten.

Kolomnaampatroon: Selecteer hoe u de kolomnaam van elke draaitabelkolom opmaken. De naam van de uitvoerkolom is een combinatie van de sleutelwaarde van de draaitabel, het kolomvoorvoegsel en het optionele voorvoegsel, het achtervoegsel, de middelste tekens.

Kolomopstelling: Als u meer dan één draaitabelkolom per draaitabelsleutel genereert, kiest u hoe u de kolommen wilt rangschikken.

Kolomvoorvoegsel: Als u meer dan één draaikolom per draaisleutel genereert, voert u een kolomvoorvoegsel voor elke kolom in. Deze instelling is optioneel als u slechts één pivoted kolom hebt.

Help-afbeelding

In de onderstaande Help-afbeelding ziet u hoe de verschillende draaitabelonderdelen met elkaar communiceren

Pivot help graphics

Draaimetagegevens

Als er geen waarden zijn opgegeven in de configuratie van de draaisleutel, worden de gepikte kolommen dynamisch gegenereerd tijdens runtime. Het aantal gedraaide kolommen is gelijk aan het aantal unieke draaitabelwaarden vermenigvuldigd met het aantal draaikolommen. Omdat dit een veranderend getal kan zijn, worden de kolommetagegevens niet weergegeven op het tabblad Inspecteren en wordt er geen kolomdoorgifte uitgevoerd. Als u deze kolommen wilt transformeren, gebruikt u de mogelijkheden van het kolompatroon van de toewijzingsgegevensstroom.

Als er specifieke draaitabelwaarden zijn ingesteld, worden de kolommen met pivoted weergegeven in de metagegevens. De kolomnamen zijn beschikbaar in de toewijzing Inspect en Sink.

Metagegevens genereren op basis van gedrifte kolommen

Pivot genereert dynamisch nieuwe kolomnamen op basis van rijwaarden. U kunt deze nieuwe kolommen toevoegen aan de metagegevens waarnaar later in uw gegevensstroom kan worden verwezen. Hiervoor gebruikt u de snel uitgevoerde snelle actie van de kaart in de voorbeeldweergave van gegevens.

Pivot columns

Gesinkte kolommen

Hoewel pivoted columns dynamisch zijn, kunnen ze nog steeds worden weggeschreven naar uw doelgegevensarchief. Schakel schemadrift toestaan in uw sink-instellingen in. Hiermee kunt u kolommen schrijven die niet zijn opgenomen in metagegevens. U ziet de nieuwe dynamische namen niet in de metagegevens van uw kolom, maar met de schemadriftoptie kunt u de gegevens landen.

Oorspronkelijke velden opnieuw toevoegen

De draaitransformatie projecteert alleen de groep op en pivoted-kolommen. Als u wilt dat uw uitvoergegevens andere invoerkolommen bevatten, gebruikt u een self join-patroon .

Script voor gegevensstroom

Syntaxis

<incomingStreamName>
    pivot(groupBy(Tm),
        pivotBy(<pivotKeyColumn, [<specifiedColumnName1>,...,<specifiedColumnNameN>]),
        <pivotColumnPrefix> = <pivotedColumnValue>,
        columnNaming: '< prefix >< $N | $V ><middle >< $N | $V >< suffix >',
        lateral: { 'true' | 'false'}
    ) ~> <pivotTransformationName

Opmerking

De schermen die worden weergegeven in de configuratiesectie, hebben het volgende gegevensstroomscript:

BasketballPlayerStats pivot(groupBy(Tm),
    pivotBy(Pos),
    {} = count(),
    columnNaming: '$V$N count',
    lateral: true) ~> PivotExample

Probeer de draaitabeltransformatie uit te voeren om kolomwaarden om te zetten in rijwaarden.