JSON-format i Data Factory i Microsoft Fabric
I denne artikel beskrives det, hvordan du konfigurerer JSON-format i datapipelinen for Data Factory i Microsoft Fabric.
JSON-format understøttes for følgende aktiviteter og forbindelser som kilde og destination.
Kategori | Connector/aktivitet |
---|---|
Understøttet connector | Amazon S3 |
Amazon S3-kompatibel | |
Azure Blob Storage | |
Azure Data Lake-lagring Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Filsystem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse-filer | |
Oracle Cloud Storage | |
SFTP | |
Understøttet aktivitet | Kopiér aktivitet (kilde/destination) |
Opslagsaktivitet | |
GetMetadata-aktivitet | |
Slet aktivitet |
Hvis du vil konfigurere JSON-format, skal du vælge din forbindelse i kilden eller destinationen for kopieringsaktiviteten for datapipelinen og derefter vælge JSON på rullelisten i Filformat. Vælg Indstillinger for yderligere konfiguration af dette format.
Når du har valgt Indstillinger i afsnittet Filformat, vises følgende egenskaber i dialogboksen Indstillinger for pop op-filformat.
Komprimeringstype: Vælg det komprimeringscodec, der skal bruges til at læse JSON-filer på rullelisten. Du kan vælge mellem None, bzip2, gzip, deflate, ZipDeflate, TarGzip eller tar.
Hvis du vælger ZipDeflate som komprimeringstype, vises Bevar zip-filnavnet som mappe under Avancerede indstillinger under fanen Kilde.
- Bevar zip-filnavnet som mappe: Angiver, om kilde-zip-filnavnet skal bevares som en mappestruktur under kopien.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten ikke-udpakkede filer til
<specified file path>/<folder named as source zip file>/
. - Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten ikke-pakkede filer direkte til
<specified file path>
. Sørg for, at du ikke har duplikerede filnavne i forskellige kilde zip-filer for at undgå væddeløb eller uventet funktionsmåde.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten ikke-udpakkede filer til
Hvis du vælger TarGzip/tar som komprimeringstype, vises Bevar komprimeringsfilnavnet som mappe under Avancerede indstillinger under fanen Kilde.
- Bevar komprimeringsfilnavnet som mappe: Angiver, om det komprimerede kildefilnavn skal bevares som en mappestruktur under kopiering.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten dekomprimerede filer til
<specified file path>/<folder named as source compressed file>/
. - Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten dekomprimerede filer direkte til
<specified file path>
. Sørg for, at du ikke har duplikerede filnavne i forskellige kildefiler for at undgå væddeløb eller uventet funktionsmåde.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten dekomprimerede filer til
- Bevar zip-filnavnet som mappe: Angiver, om kilde-zip-filnavnet skal bevares som en mappestruktur under kopien.
Komprimeringsniveau: Komprimeringsforholdet. Du kan vælge mellem Hurtigste eller Optimal.
Hurtigst: Komprimeringshandlingen skal fuldføres så hurtigt som muligt, selvom den resulterende fil ikke komprimeres optimalt.
Optimal: Komprimeringshandlingen skal komprimeres optimalt, selvom handlingen tager længere tid at fuldføre. Du kan få flere oplysninger i artiklen Komprimeringsniveau .
Kodning: Angiv den kodningstype, der skal bruges til at læse testfiler. Vælg én type på rullelisten. Standardværdien er UTF-8.
Når du har valgt Indstillinger, vises følgende egenskaber i dialogboksen Indstillinger for pop op-filformat.
Komprimeringstype: Vælg det komprimeringscodec, der skal bruges til at skrive JSON-filer på rullelisten. Du kan vælge mellem None, bzip2, gzip, deflate, ZipDeflate, TarGzip eller tar.
Komprimeringsniveau: Komprimeringsforholdet. Du kan vælge mellem Optimal eller Hurtigst.
Hurtigst: Komprimeringshandlingen skal fuldføres så hurtigt som muligt, selvom den resulterende fil ikke komprimeres optimalt.
Optimal: Komprimeringshandlingen skal komprimeres optimalt, selvom handlingen tager længere tid at fuldføre. Du kan få flere oplysninger i artiklen Komprimeringsniveau .
Kodning: Angiv den kodningstype, der skal bruges til at skrive testfiler. Vælg én type på rullelisten. Standardværdien er UTF-8.
Under Avancerede indstillinger under fanen Destination vises følgende egenskaber for JSON-format.
- Filmønster: Angiv mønsteret for de data, der er gemt i hver JSON-fil. Tilladte værdier er: Sæt af objekter (JSON Lines) og Matrix af objekter. Standardværdien er Sæt af objekter. Se afsnittet JSON-filmønstre for at få oplysninger om disse mønstre.
Når du kopierer data fra JSON-filer, kan kopiaktivitet automatisk registrere og fortolke følgende mønstre for JSON-filer. Når du skriver data til JSON-filer, kan du konfigurere filmønsteret på kopiaktivitetsdestinationen.
Type I: setOfObjects
Hver fil indeholder enkelte objekter, JSON-linjer eller sammenkædede objekter.
JSON-eksempel på et enkelt objekt
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }
JSON-linjer (standard for destination)
{"time":"2015-04-29T07:12:20.9100000Z","callingimsi":"466920403025604","callingnum1":"678948008","callingnum2":"567834760","switch1":"China","switch2":"Germany"} {"time":"2015-04-29T07:13:21.0220000Z","callingimsi":"466922202613463","callingnum1":"123436380","callingnum2":"789037573","switch1":"US","switch2":"UK"} {"time":"2015-04-29T07:13:21.4370000Z","callingimsi":"466923101048691","callingnum1":"678901578","callingnum2":"345626404","switch1":"Germany","switch2":"UK"}
sammenkædet JSON-eksempel
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" } { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" } { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" }
Type II: arrayOfObjects
Hver fil indeholder en matrix af objekter.
[ { "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }, { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" }, { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" } ]
Følgende egenskaber understøttes i afsnittet kopiaktivitetskilde, når JSON-formatet bruges.
Navn | Beskrivelse | Værdi | Obligatorisk | JSON-scriptegenskab |
---|---|---|---|---|
Filformat | Det filformat, du vil bruge. | JSON | Ja | type (under datasetSettings ):Json |
Komprimeringstype | Den komprimeringscodec, der bruges til at læse JSON-filer. | Vælg mellem: Ingen bzip2 gzip Deflatere ZipDeflate TarGzip tjære |
Nr. | type (under compression ): bzip2 gzip Deflatere ZipDeflate TarGzip tjære |
Komprimeringsniveau | Komprimeringsforholdet. | Hurtigste Optimal |
Nr. | niveau (under compression ): Hurtigste Optimal |
Kodning | Den kodningstype, der bruges til at læse testfiler. | "UTF-8" (som standard),"UTF-8 without BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM 869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nej | encodingName |
Bevar zip-filnavnet som mappe | Angiver, om zip-kildefilnavnet skal bevares som en mappestruktur under kopiering. | Markeret (standard) eller fravælg | Nr. | preserveZipFileNameAsFolder (under compressionProperties ->type som ZipDeflateReadSettings ):true (standard) eller false |
Bevar komprimering af filnavnet som mappe | Angiver, om kildens komprimerede filnavn skal bevares som en mappestruktur under kopiering. | Markeret (standard) eller fravælg | Nr. | preserveCompressionFileNameAsFolder (under compressionProperties ->type som TarGZipReadSettings eller TarReadSettings ):true (standard) eller false |
Følgende egenskaber understøttes i afsnittet Destination for kopiaktivitet, når JSON-formatet bruges.
Navn | Beskrivelse | Værdi | Obligatorisk | JSON-scriptegenskab |
---|---|---|---|---|
Filformat | Det filformat, du vil bruge. | JSON | Ja | type (under datasetSettings ):Json |
Komprimeringstype | Den komprimeringscodec, der bruges til at skrive JSON-filer. | Vælg mellem: Ingen bzip2 gzip Deflatere ZipDeflate TarGzip tjære |
Nr. | type (under compression ): bzip2 gzip Deflatere ZipDeflate TarGzip tjære |
Komprimeringsniveau | Komprimeringsforholdet. | Hurtigste Optimal |
Nr. | niveau (under compression ): Hurtigste Optimal |
Kodning | Den kodningstype, der bruges til at skrive testfiler. | "UTF-8" (som standard),"UTF-8 without BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM 869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nej | encodingName |
Filmønster | Angiv det datamønster, der er gemt i hver JSON-fil. | Sæt af objekter Matrix af objekter |
Nr. | filePattern: setOfObjects arrayOfObjects |