Slik konfigurerer du SFTP i en kopiaktivitet
Denne artikkelen beskriver hvordan du bruker kopieringsaktiviteten i datasamlebåndet til å kopiere data fra SFTP.
Viktig
Microsoft Fabric er for øyeblikket i FORHÅNDSVERSJON. Denne informasjonen er knyttet til et forhåndsutgitt produkt som kan endres vesentlig før det utgis. Microsoft gir ingen garantier, uttrykt eller underforstått, med hensyn til informasjonen som er oppgitt her. Se Azure Data Factory dokumentasjon for tjenesten i Azure.
Format som støttes
SFTP støtter følgende filformater. Se hver artikkel for formatbaserte innstillinger.
- Avro-format
- Binært format
- Tekstformat med skilletegn
- Excel-format
- JSON-format
- ORC-format
- Parquet-format
- XML-format
Støttet konfigurasjon
Hvis du vil ha konfigurasjonen av hver fane under kopieringsaktivitet, kan du gå til følgende inndelinger.
Generelt
Se veiledningen for generelle innstillinger for å konfigurere fanen Generelle innstillinger.
Kilde
Gå til Kilde-fanen for å konfigurere kopiaktivitetskilden. Se følgende innhold for detaljert konfigurasjon.
Følgende tre egenskaper kreves:
Datalagertype: Velg Ekstern.
Tilkobling: Velg en SFTP-tilkobling fra tilkoblingslisten. Hvis det ikke finnes noen tilkobling, kan du opprette en ny SFTP-tilkobling ved å velge Ny.
Filtype: Velg fra Filbane, Jokertegn-filbane og Liste over filer basert på måten du vil lese filer på.
Filbane: Hvis du velger denne typen, angir du kildefilbanen. Du kan velge Bla gjennom for å velge kildefilene eller angi filbanen manuelt.
Bane til vill fil: Hvis du velger denne typen, angir du jokertegnbanene for å filtrere kildemappene eller -filene.
Tillatte jokertegn er
*
(samsvarer med null eller flere tegn) og?
(samsvarer med null eller enkelttegn). Brukes^
til å unnslippe hvis mappenavnet har et jokertegn eller dette escape-tegnet inni. Hvis du vil ha flere eksempler, kan du gå til eksempler på mappe- og filfiltre.Bane til jokertegnmappe: Angi mappebanen med jokertegn for å filtrere kildemapper.
Navn på jokertegnfil: Angi filnavnet med jokertegn under den angitte mappebanen/jokertegnmappebanen for å filtrere kildefiler.
Liste over filer: Hvis du velger denne typen, angir du mappebanen og banen til fillisten som angir at et gitt filsett skal kopieres. Pek på en tekstfil som inneholder en liste over filer du vil kopiere, én fil per linje. Hvis du vil ha flere eksempler, kan du gå til eksempler på filliste.
Mappebane: Angi banen til kildemappen. Det er nødvendig.
Bane til filliste: Angi banen til tekstfilen som inneholder en liste over filer du vil kopiere.
Filformat: Velg filformatet som brukes fra rullegardinlisten. Velg Innstillinger for å konfigurere filformatet. Hvis du vil ha informasjon om innstillinger for ulike filformater, kan du se artikler i støttet format for detaljert informasjon.
Under Avansert kan du angi følgende felt:
Filtrer etter sist endret: Filer filtreres basert på de siste endringsdatoene du angav. Denne egenskapen gjelder ikke når du konfigurerer filtypen som liste over filer.
- Starttidspunkt (UTC): Filene velges hvis siste endringstid er større enn eller lik det konfigurerte tidspunktet.
- Sluttidspunkt (UTC): Filene velges hvis siste endringstid er mindre enn det konfigurerte tidspunktet.
Når starttidspunkt (UTC) har datetime-verdi, men sluttidspunkt (UTC) er NULL, betyr det at filene som sist endret attributtet er større enn eller lik datetime-verdien, vil bli valgt. Når sluttidspunkt (UTC) har datetime-verdi, men starttidspunkt (UTC) er NULL, betyr det at filene som sist endret attributtet er mindre enn datetime-verdien, vil bli valgt. Egenskapene kan være NULL, noe som betyr at ingen filattributtfilter vil bli brukt på dataene.
Deaktiver deling: Delingen er utformet for å optimalisere ytelsen og skjer under. Med dette alternativet kan du deaktivere deling i hver fil. Når du kopierer data fra SFTP, prøver tjenesten å få fillengden først, og deretter deler du filen i flere deler og leser dem parallelt. Angi om SFTP-serveren støtter å få fillengde eller søker å lese fra en bestemt forskyvning. Den er ikke merket som standard.
Aktiver partisjonssøk: Angi om du vil analysere partisjonene fra filbanen og legge dem til som flere kildekolonner. Det er ikke merket av som standard og støttes ikke når du bruker binært filformat.
Partisjonsrotbane: Når partisjonssøk er aktivert, angir du den absolutte rotbanen for å lese partisjonerte mapper som datakolonner.
Hvis det ikke er angitt, som standard,- Når du bruker filbanen eller listen over filer på kilden, er partisjonsrotbanen banen du konfigurerte.
- Når du bruker jokertegnmappefilter, er partisjonsrotbanen underbanen foran det første jokertegnet.
Hvis du for eksempel konfigurerer banen som
root/folder/year=2020/month=08/day=27
:- Hvis du angir partisjonsrotbane som
root/folder/year=2020
, vil kopieringsaktivitet generere to kolonner måned og dag med verdien henholdsvis 08 og 27, i tillegg til kolonnene i filene. - Hvis partisjonsrotbanen ikke er angitt, genereres ingen ekstra kolonne.
Maksimalt antall samtidige tilkoblinger: Denne egenskapen angir den øvre grensen for samtidige tilkoblinger som ble opprettet i datalageret under aktivitetskjøringen. Angi en verdi bare når du vil begrense samtidige tilkoblinger.
Flere kolonner: Legg til flere datakolonner for å lagre kildefilens relative bane eller statiske verdi. Uttrykket støttes for sistnevnte. Hvis du vil ha mer informasjon, kan du gå til Legg til flere kolonner under kopieringen.
Mål
Gå til Mål-fanen for å konfigurere målet for kopiaktiviteten. Se følgende innhold for detaljert konfigurasjon.
- Datalagertype: Velg Ekstern.
- Tilkobling: Velg en SFTP-tilkobling fra tilkoblingslisten. Hvis det ikke finnes noen tilkobling, kan du opprette en ny SFTP-tilkobling ved å velge Ny.
- Filbane: Angi filbanen du vil skrive dataene til. Du kan velge Bla gjennom for å velge kildefilene eller angi filbanen manuelt.
- Filformat: Velg filformatet som brukes fra rullegardinlisten. Velg Innstillinger for å konfigurere filformatet. Hvis du vil ha informasjon om innstillinger for ulike filformater, kan du se artikler i støttet format for detaljert informasjon.
Under Avansert kan du angi følgende felt:
Kopier virkemåte: Angi kopieringsvirkemåten når kilden er filer fra et filbasert datalager. Velg blant følgende egenskaper.
- Flate ut hierarki: Alle filer fra kildemappen er på det første nivået i målmappen. Målfilene har automatisk genererte navn.
- Flette filer: Fletter alle filer fra kildemappen til én fil. Hvis filnavnet er angitt, er det flettede filnavnet det angitte navnet. Ellers er det et automatisk generert filnavn.
- Behold hierarki (standard): Bevarer filhierarkiet i målmappen. Den relative banen til kildefilen til kildemappen er identisk med den relative banen til målfilen til målmappen.
- Legg til dynamisk innhold: Velg dette for å angi kopieringsvirkemåten ved hjelp av dynamisk innhold.
Maksimalt antall samtidige tilkoblinger: Den øvre grensen for samtidige tilkoblinger som ble opprettet i datalageret under aktivitetskjøringen. Angi en verdi bare når du vil begrense samtidige tilkoblinger.
Tidsavbrudd for operasjon (minutter): Angi tidsavbruddet for skriving av hver del til SFTP-serveren. Standardverdien er 60 minutter.
Last opp med midlertidig fil: Angi om du vil laste opp til midlertidige filer og gi dem nytt navn, eller skrive direkte til målmappen eller filplasseringen. Som standard er den valgt, og tjenesten skriver først til midlertidige filer og gir dem deretter nytt navn når opplastingen er fullført.
Denne sekvensen bidrar til å (1) unngå konflikter som kan føre til en skadet fil hvis du har andre prosesser som skriver til samme fil, og (2) sikrer at den opprinnelige versjonen av filen finnes under overføringen. Hvis SFTP-serveren ikke støtter en gi nytt navn-operasjon, deaktiverer du dette alternativet og kontrollerer at du ikke har en samtidig skriving til målfilen.
Tips
Hvis du får feilmeldingen «UserErrorSftpPathNotFound», «UserErrorSftpPermissionDenied» eller «SftpOperationFail» når du skriver data til SFTP, og SFTP-brukeren du bruker, har de riktige tillatelsene, kontrollerer du om SFTP-serverens navneendringsoperasjon fungerer. Hvis den ikke er det, deaktiverer du alternativet Last opp med midlertidig fil og prøver på nytt.
Kartlegging
Hvis du vil ha informasjon om konfigurasjon av tilordningsfanen, kan du se Konfigurere tilordningene under tilordningsfanen. Hvis du velger Binær som filformat, støttes ikke tilordning.
Innstillinger
Gå til Konfigurer de andre innstillingene under Innstillinger-fanen for konfigurasjon av Innstillinger-fanen.
Tabellsammendrag
Tabellen nedenfor inneholder mer informasjon om kopieringsaktiviteten i SFTP.
Kilde
Navn | Beskrivelse | Verdi | Obligatorisk | JSON-skriptegenskap |
---|---|---|---|---|
Datalagertype | Datalagertypen. | Eksterne | Ja | / |
Tilkobling | SFTP-tilkoblingen til kildedatalageret. | < SFTP-tilkoblingen > | Ja | Tilkobling |
Filtype | Filtypen som brukes til å hente kildedata. | • Filbane • Bane til jokertegnfil • Liste over filer |
Ja | / |
Filbane | Banen til kildefilen. | < filbane> | Ja | Filnavn folderPath |
Jokertegnbaner | Jokertegnbanen til kildefilen. | < banen til jokertegnfilen > | Ja for jokertegnfilnavn | wildcardFolderPath wildcardFileName |
Mappebane | Banen til kildemappen. | < mappebanen> | Ja | folderPath |
Bane til filliste | Angir at et gitt filsett skal kopieres. Pek på en tekstfil som inneholder en liste over filer du vil kopiere, én fil per linje. | < fillistebane > | Nei | fileListPath |
Filformat | Filformatet for kildedataene. Hvis du vil ha informasjon om ulike filformater, kan du se artikler i støttet format for detaljert informasjon. | / | Ja | / |
Filtrer etter sist endret | Filene med siste endringstidspunkt i området [Starttidspunkt, sluttidspunkt) filtreres for videre behandling. Klokkeslettet brukes på UTC-tidssone i formatet yyyy-mm-ddThh:mm:ss.fffZ . Disse egenskapene kan hoppes over, noe som betyr at ingen filattributtfilter vil bli brukt. Denne egenskapen gjelder ikke når du konfigurerer filtypen som liste over filer. |
datetime | Nei | modifiedDatetimeStart modifiedDatetimeEnd |
Deaktiver deling | Delingen er utformet for å optimalisere ytelsen og skjer under. Med dette alternativet kan du deaktivere deling i hver fil. Når du kopierer data fra SFTP, prøver tjenesten å få fillengden først, og deretter deler du filen inn i flere deler og leser dem parallelt. Angi om SFTP-serveren støtter henting av fillengde eller forsøk på å lese fra en bestemt forskyvning. | merket eller umerket (standard) | Nei | disableChunking: sann eller usann (standard) |
Aktiver partisjonsoppdagelse | Angir om du vil analysere partisjonene fra filbanen og legge dem til som flere kildekolonner. | merket eller umerket (standard) | Nei | enablePartitionDiscovery: sann eller usann (standard) |
Partisjonsrotbane | Den absolutte partisjonsrotbanen for å kunne lese partisjonerte mapper som datakolonner. Angi den når partisjonsoppdagelse er aktivert. | < partisjonsrotbane > | Nei | partitionRootPath |
Maksimalt antall samtidige tilkoblinger | Den øvre grensen for samtidige tilkoblinger som ble opprettet i datalageret under aktivitetskjøringen. Angi en verdi bare når du vil begrense samtidige tilkoblinger. | < øvre grense for samtidige tilkoblinger > (heltall) |
Nei | maxConcurrentConnections |
Flere kolonner | Legg til flere datakolonner for å lagre kildefilens relative bane eller statiske verdi. Uttrykket støttes for sistnevnte. Hvis du vil ha mer informasjon, kan du gå til Legg til flere kolonner under kopi | •Navn •Verdi |
Nei | additionalColumns: •navn •Verdi |
Mål
Navn | Beskrivelse | Verdi | Obligatorisk | JSON-skriptegenskap |
---|---|---|---|---|
Datalagertype | Datalagertypen. | Eksterne | Ja | / |
Tilkobling | Tilkoblingen til kilde-SFTP. | < tilkoblingen > | Ja | Tilkobling |
Filbane | Filbanen til måldataene. | Filbane for målet | Ja | folderPath Filnavn |
Filformat | Filformatet for kildedataene. Hvis du vil ha informasjon om ulike filformater, kan du se artikler i støttet format for detaljert informasjon. | / | Ja | / |
Kopier virkemåte | Definerer kopieringsvirkemåten når kilden er filer fra et filbasert datalager. | • Flate ut hierarki • Slå sammen filer • Bevare hierarki |
Nei | copyBehavior: - FlattenHierarchy - MergeFiles - PreserveHierarchy |
Maksimalt antall samtidige tilkoblinger | Den øvre grensen for samtidige tilkoblinger som ble opprettet i datalageret under aktivitetskjøringen. Angi en verdi bare når du vil begrense samtidige tilkoblinger. | < maks samtidige tilkoblinger > | Nei | maxConcurrentConnections |
Tidsavbrudd for operasjon (minutter) | Tidsavbruddet for å skrive hver del til SFTP-serveren. | < tidsavbrudd for operasjonen > Standardverdien er 60 |
Nei | operationTimeout |
Last opp med midlertidig fil | Angir om midlertidige filer skal lastes opp og gis nytt navn. Deaktiver dette alternativet hvis SFTP-serveren ikke støtter operasjonen gi nytt navn. | merket (standard) eller umerket | Nei | brukTempFileRename: sann (standard) eller usann |
Neste trinn
Tilbakemeldinger
Send inn og vis tilbakemelding for