Formát JSON v službe Data Factory v službe Microsoft Fabric
Tento článok popisuje, ako nakonfigurovať formát JSON v kanáli údajov služby Data Factory v službe Microsoft Fabric.
Formát JSON je podporovaný pre nasledujúce aktivity a konektory ako zdroj a cieľ.
Kategória | Konektor/aktivita |
---|---|
Podporovaný konektor | Amazon S3 |
Amazon S3 Kompatibilné | |
Ukladací priestor objektov BLOB na platforme Azure | |
Azure Data Lake Storage 1. generácie | |
Azure Data Lake Storage Gen2 | |
Súbory Azure | |
Systém súborov | |
FTP | |
Google Cloud Storage | |
HTTP (http) | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Podporovaná aktivita | Kopírovať aktivitu (zdroj/cieľ) |
Aktivita vyhľadávania | |
Aktivita GetMetadata | |
Odstránenie aktivity |
Ak chcete nakonfigurovať formát JSON, vyberte pripojenie v zdroji alebo cieli aktivity kopírovania kanála údajov a potom v rozbaľovacom zozname Formát súboru vyberte položku JSON. Vyberte položku Nastavenia pre ďalšiu konfiguráciu tohto formátu.
Po výbere položky Nastavenia v časti Formát súboru sa v kontextovom okne Nastavenia formátu súboru zobrazia nasledujúce vlastnosti.
Typ kompresie: Vyberte kompresný kodek používaný na čítanie súborov JSON v rozbaľovacom zozname. Môžete si vybrať z možností Žiadne, bzip2, gzip, deflate, ZipDeflate, TarGzip alebo decht.
Ak ako typ kompresie vyberiete možnosť ZipDeflate , položka Zachovať názov súboru zip ako priečinok sa zobrazí na karte Rozšírené nastavenia na karte Zdroj .
- Zachovať názov súboru zip ako priečinok: udáva, či sa má zachovať názov zdrojového súboru zip ako štruktúra priečinka počas kopírovania.
- Ak je toto políčko začiarknuté (predvolené), služba zapíše rozbalené súbory do
<specified file path>/<folder named as source zip file>/
. - Ak toto políčko nie je začiarknuté, služba zapíše rozbalené súbory priamo do
<specified file path>
. Dbajte na to, aby ste v rôznych zdrojových súboroch ZIP nemali duplicitné názvy súborov, aby ste sa vyhli pretekaniu alebo neočakávanému správaniu.
- Ak je toto políčko začiarknuté (predvolené), služba zapíše rozbalené súbory do
Ak ako typ kompresie vyberiete tarGzip /tar , funkcia Zachovať názov kompresného súboru ako priečinok sa zobrazí na karte Rozšírené nastavenia na karte Zdroj .
- Zachovať názov kompresného súboru ako priečinok: udáva, či sa má zachovať komprimovaný názov zdroja ako štruktúra priečinkov počas kopírovania.
- Ak je toto políčko začiarknuté (predvolené), služba zapíše dekomprimované súbory do
<specified file path>/<folder named as source compressed file>/
. - Ak toto políčko nie je začiarknuté, služba zapíše dekomprimované súbory priamo do
<specified file path>
. Dbajte na to, aby ste v rôznych zdrojových súboroch nemali duplicitné názvy súborov, aby ste sa vyhli pretekaniu alebo neočakávanému správaniu.
- Ak je toto políčko začiarknuté (predvolené), služba zapíše dekomprimované súbory do
- Zachovať názov súboru zip ako priečinok: udáva, či sa má zachovať názov zdrojového súboru zip ako štruktúra priečinka počas kopírovania.
Úroveň kompresie: Kompresný pomer. Môžete si vybrať z najrýchlejších alebo optimálnych.
Najrýchlejšie: Kompresná operácia by sa mala dokončiť čo najrýchlejšie, dokonca aj vtedy, ak výsledný súbor nie je optimálne komprimovaný.
Optimálna: Operácia kompresie by mala byť optimálne komprimovaná, dokonca aj vtedy, ak dokončenie operácie trvá dlhšie. Ďalšie informácie nájdete v článku Úroveň kompresie.
Kódovanie: zadajte typ kódovania, ktorý sa používa na čítanie testovacích súborov. Z rozbaľovacieho zoznamu vyberte jeden typ. Predvolená hodnota je UTF-8.
Po výbere položky Nastavenia sa v kontextovom okne Nastavenia formátu súboru zobrazia nasledujúce vlastnosti.
Typ kompresie: Vyberte kompresný kodek používaný na zápis súborov JSON v rozbaľovacom zozname. Môžete si vybrať z možností Žiadne, bzip2, gzip, deflate, ZipDeflate, TarGzip alebo decht.
Úroveň kompresie: Kompresný pomer. Môžete si vybrať možnosť Optimálny alebo Najrýchlejší.
Najrýchlejšie: Kompresná operácia by sa mala dokončiť čo najrýchlejšie, dokonca aj vtedy, ak výsledný súbor nie je optimálne komprimovaný.
Optimálna: Operácia kompresie by mala byť optimálne komprimovaná, dokonca aj vtedy, ak dokončenie operácie trvá dlhšie. Ďalšie informácie nájdete v článku Úroveň kompresie.
Kódovanie: zadajte typ kódovania, ktorý sa používa na zapisovanie testovacích súborov. Z rozbaľovacieho zoznamu vyberte jeden typ. Predvolená hodnota je UTF-8.
V časti Rozšírené nastavenia na karte Cieľ sa zobrazujú nasledujúce vlastnosti súvisiace s formátom JSON.
- Vzor súboru: zadajte vzor údajov uložených v každom súbore JSON. Povolené hodnoty sú: množina objektov (riadky JSON) a pole objektov. Predvolená hodnota je Množina objektov. Podrobnosti o týchto vzoroch nájdete v časti Vzory súborov JSON.
Pri kopírovaní údajov zo súborov JSON sa môže skopírovať aktivita automaticky zistiť a analyzovať nasledujúce vzory súborov JSON. Pri písaní údajov do súborov JSON môžete nakonfigurovať vzor súboru v cieli kopírovania aktivity.
Typ I: setOfObjects
Každý súbor obsahuje jeden objekt, riadky JSON alebo zreťazený objekty.
príklad JSON s jedným objektom
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }
Riadky JSON (predvolené pre cieľ)
{"time":"2015-04-29T07:12:20.9100000Z","callingimsi":"466920403025604","callingnum1":"678948008","callingnum2":"567834760","switch1":"China","switch2":"Germany"} {"time":"2015-04-29T07:13:21.0220000Z","callingimsi":"466922202613463","callingnum1":"123436380","callingnum2":"789037573","switch1":"US","switch2":"UK"} {"time":"2015-04-29T07:13:21.4370000Z","callingimsi":"466923101048691","callingnum1":"678901578","callingnum2":"345626404","switch1":"Germany","switch2":"UK"}
príklad zreťazený formát JSON
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" } { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" } { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" }
Typ II: poleOfObjects
Každý súbor obsahuje pole objektov.
[ { "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }, { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" }, { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" } ]
Pri použití formátu JSON sú v časti Zdroj aktivity kopírovania podporované nasledujúce vlastnosti.
Názov | Popis | Value | Požaduje sa | Vlastnosť skriptu JSON |
---|---|---|---|---|
Formát súboru | Formát súboru, ktorý chcete použiť. | JSON | Áno | type (do datasetSettings ):Json |
Typ kompresie | Kompresný kodek slúžiaci na čítanie súborov JSON. | Vyberte si z: Žiadny bzip2 gzip vyfúknuť ZipDeflate (psč) TarGzip decht |
No | type (do compression ): bzip2 gzip vyfúknuť ZipDeflate (psč) TarGzip decht |
Úroveň kompresie | Kompresný pomer. | Najrýchlejší Optimálny |
No | úroveň (v rámci compression ): Najrýchlejší Optimálny |
Kódovanie | Typ kódovania, ktorý sa používa na čítanie testovacích súborov. | "UTF-8" (predvolene),"UTF-8 bez KUSOV", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM273", "IBM437", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM273", "IBM500", "IBM737", "IBM500", "IBM737", "IBM500", "IBM737", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM500", "IBM737", "IBM5 "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nie | encodingName |
Zachovanie názvu súboru zip ako priečinka | Udáva, či sa má zachovať názov zdrojového súboru zip ako štruktúra priečinka počas kopírovania. | Vybraté (predvolené) alebo zrušenie výberu | No | preserveZipFileNameAsFolder (pod compressionProperties –>type ako ZipDeflateReadSettings ):true (predvolené) alebo false |
Zachovanie názvu kompresných súborov ako priečinka | Udáva, či sa má zachovať názov komprimovaného zdroja ako štruktúra priečinka počas kopírovania. | Vybraté (predvolené) alebo zrušenie výberu | No | preserveCompressionFileNameAsFolder (pod compressionProperties –>type ako TarGZipReadSettings alebo TarReadSettings ):true (predvolené) alebo false |
Pri použití formátu JSON sú v časti Cieľ aktivity kopírovania podporované nasledujúce vlastnosti.
Názov | Popis | Value | Požaduje sa | Vlastnosť skriptu JSON |
---|---|---|---|---|
Formát súboru | Formát súboru, ktorý chcete použiť. | JSON | Áno | type (do datasetSettings ):Json |
Typ kompresie | Kompresný kodek slúžiaci na zápis súborov JSON. | Vyberte si z: Žiadny bzip2 gzip vyfúknuť ZipDeflate (psč) TarGzip decht |
No | type (do compression ): bzip2 gzip vyfúknuť ZipDeflate (psč) TarGzip decht |
Úroveň kompresie | Kompresný pomer. | Najrýchlejší Optimálny |
No | úroveň (v rámci compression ): Najrýchlejší Optimálny |
Kódovanie | Typ kódovania, ktorý sa používa na zapisovanie testovacích súborov. | "UTF-8" (predvolene),"UTF-8 bez KUSOV", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM273", "IBM437", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM273", "IBM500", "IBM737", "IBM500", "IBM737", "IBM500", "IBM737", "IBM500", "IBM737", "IBM437", "IBM500", "IBM737", "IBM500", "IBM737", "IBM5 "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nie | encodingName |
Vzor súboru | Označte vzor údajov uložených v každom súbore JSON. | Množina objektov Pole objektov |
No | filePattern: setOfObjects arrayOfObjects |