gebeurtenis
31 mrt, 23 - 2 apr, 23
De grootste fabric-, Power BI- en SQL-leerevenement. 31 maart – 2 april. Gebruik code FABINSIDER om $ 400 te besparen.
Zorg dat u zich vandaag nog registreertDeze browser wordt niet meer ondersteund.
Upgrade naar Microsoft Edge om te profiteren van de nieuwste functies, beveiligingsupdates en technische ondersteuning.
VAN TOEPASSING OP: Azure Data Factory
Azure Synapse Analytics
Tip
Probeer Data Factory uit in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .
Met de Azure Synapse Notebook-activiteit in een pijplijn wordt een Synapse-notebook uitgevoerd in uw Azure Synapse Analytics-werkruimte. Dit artikel is gebaseerd op het artikel over activiteiten voor gegevenstransformatie , waarin een algemeen overzicht wordt weergegeven van de gegevenstransformatie en de ondersteunde transformatieactiviteiten.
U kunt een Azure Synapse Analytics-notebookactiviteit rechtstreeks maken via de gebruikersinterface van Azure Data Factory Studio. Raadpleeg het volgende voor een stapsgewijze procedure voor het maken van een Synapse-notebookactiviteit met behulp van de gebruikersinterface.
Voer de volgende stappen uit om een Notebook-activiteit voor Synapse in een pijplijn te gebruiken:
Selecteer het tabblad Azure Synapse Analytics (Artefacten) om een nieuwe gekoppelde Azure Synapse Analytics-service te selecteren of te maken waarmee de notebookactiviteit wordt uitgevoerd.
Selecteer de nieuwe Synapse Notebook-activiteit op het canvas als deze nog niet is geselecteerd.
Selecteer het tabblad Instellingen.
Vouw de lijst Notebook uit. U kunt een bestaand notitieblok selecteren in de gekoppelde Azure Synapse Analytics (Artefacten).
Klik op de knop Openen om de pagina van de gekoppelde service te openen waar het geselecteerde notitieblok zich bevindt.
Notitie
Als de resource-id van de werkruimte in de gekoppelde service leeg is, wordt de knop Openen uitgeschakeld.
Selecteer het tabblad Instellingen en kies het notitieblok en optionele basisparameters die u wilt doorgeven aan het notitieblok.
(Optioneel) U kunt informatie invullen voor Synapse-notebook. Als de volgende instellingen leeg zijn, worden de instellingen van het Synapse-notebook zelf gebruikt om uit te voeren; als de volgende instellingen niet leeg zijn, vervangen deze instellingen de instellingen van het Synapse-notebook zelf.
Eigenschappen | Beschrijving |
---|---|
Spark-pool | Verwijzing naar de Spark-pool. U kunt Een Apache Spark-pool selecteren in de lijst. |
Grootte van uitvoerder | Aantal kernen en geheugen dat moet worden gebruikt voor uitvoerders die zijn toegewezen in de opgegeven Apache Spark-pool voor de sessie. Geldige waarden voor dynamische inhoud zijn Small/Medium/Large/XLarge/XXLarge. |
Uitvoerders dynamisch toewijzen | Deze instelling wordt toegewezen aan de eigenschap dynamische toewijzing in de Spark-configuratie voor toewijzing van spark-toepassingsexecutors. |
Min.uitvoerders | Minimum aantal uitvoerders dat moet worden toegewezen in de opgegeven Spark-pool voor de taak. |
Maximum aantal uitvoerders | Maximum aantal uitvoerders dat moet worden toegewezen in de opgegeven Spark-pool voor de taak. |
Grootte van stuurprogramma | Aantal kernen en het geheugen die moet worden gebruikt voor het stuurprogramma dat in de gespecificeerde Apache Spark-pool voor de taak is opgegeven. |
Hier volgt de JSON-voorbeelddefinitie van een Azure Synapse Analytics Notebook-activiteit:
{
"activities": [
{
"name": "demo",
"description": "description",
"type": "SynapseNotebook",
"dependsOn": [],
"policy": {
"timeout": "7.00:00:00",
"retry": 0,
"retryIntervalInSeconds": 30,
"secureOutput": false,
"secureInput": false
},
"userProperties": [
{
"name": "testproperties",
"value": "test123"
}
],
"typeProperties": {
"notebook": {
"referenceName": {
"value": "Notebookname",
"type": "Expression"
},
"type": "NotebookReference"
},
"parameters": {
"test": {
"value": "testvalue",
"type": "string"
}
},
"snapshot": true,
"sparkPool": {
"referenceName": {
"value": "SampleSpark",
"type": "Expression"
},
"type": "BigDataPoolReference"
}
},
"linkedServiceName": {
"referenceName": "AzureSynapseArtifacts1",
"type": "LinkedServiceReference"
}
}
]
}
In de volgende tabel worden de JSON-eigenschappen beschreven die worden gebruikt in de JSON-definitie:
Azure Data Factory zoekt naar de parametercel en gebruikt de waarden als standaardwaarden voor de parameters die tijdens de uitvoering zijn doorgegeven. De uitvoeringsengine voegt een nieuwe cel toe onder de parametercel met invoerparameters om de standaardwaarden te overschrijven. U kunt gegevens transformeren door een Synapse-notebook uit te voeren.
U kunt de uitvoerwaarde van notebookcellen lezen in activiteit. Voor dit deelvenster kunt u verwijzen naar Gegevens transformeren door een Synapse-notebook uit te voeren.
U kunt verwijzen naar andere notebooks in een Synapse-notebookactiviteit via het aanroepen van %run magic of mssparkutils notebook utilities. Beide ondersteunen geneste functie-aanroepen. De belangrijkste verschillen van deze twee methoden die u moet overwegen op basis van uw scenario zijn:
%run notebook2
en notebook2 wordt een mssparkutils.notebook.exit-functie aangeroepen, wordt de uitvoering van de cel in notebook1 gestopt. U wordt aangeraden %run magic te gebruiken wanneer u een notebookbestand wilt 'opnemen'.mssparkutils.notebook.run("notebook2")
en notebook2 wordt een mssparkutils.notebook.exit-functie aangeroepen, wordt de uitvoering van de cel in notebook1 voortgezet. U wordt aangeraden mssparkutils notebook-hulpprogramma's te gebruiken wanneer u een notebook wilt 'importeren'.Ga naar Pijplijnuitvoeringen op het tabblad Monitor . U ziet de pijplijn die u hebt geactiveerd. Open de pijplijn met notebookactiviteit om de uitvoeringsgeschiedenis te bekijken.
Voor momentopnamen van open notitieblokken wordt deze functie momenteel niet ondersteund.
U kunt de invoer of uitvoer van de notebookactiviteit zien door de invoer- of uitvoerknop te selecteren. Als uw pijplijn is mislukt met een gebruikersfout, selecteert u de uitvoer om het resultaatveld te controleren om de gedetailleerde tracering van gebruikersfouten te bekijken.
gebeurtenis
31 mrt, 23 - 2 apr, 23
De grootste fabric-, Power BI- en SQL-leerevenement. 31 maart – 2 april. Gebruik code FABINSIDER om $ 400 te besparen.
Zorg dat u zich vandaag nog registreertTraining
Module
Spark Notebooks gebruiken in een Azure Synapse-pijplijn - Training
In deze module wordt beschreven hoe Apache Spark-notebooks kunnen worden geïntegreerd in een Azure Synapse Analytics-pijplijn.
Certificering
Microsoft Gecertificeerd: Azure Data Engineer Associate - Certifications
Demonstreer inzicht in algemene data engineering-taken voor het implementeren en beheren van data engineering-workloads in Microsoft Azure met behulp van een aantal Azure-services.
Documentatie
Gegevens transformeren door een Synapse-notebook uit te voeren - Azure Synapse Analytics
In dit artikel leert u hoe u een Synapse-notebookactiviteit en een Synapse-pijplijn maakt en ontwikkelt.
Synapse-pijplijn aanroepen met een notebookactiviteit - Azure Data Factory
Meer informatie over het gebruik van een oplossingssjabloon om een Synapse-pijplijn aan te roepen met een notebookactiviteit in Azure Data Factory.
Gegevens transformeren met behulp van de scriptactiviteit - Azure Data Factory & Azure Synapse
Hierin wordt uitgelegd hoe u de scriptactiviteit gebruikt om gegevens te transformeren in een Azure Data Factory- of Synapse Analytics-pijplijn.