Wyrażenie ścieżki JSON
Dotyczy: Databricks SQL
Databricks Runtime
Wyrażenie ścieżki JSON służy do wyodrębniania wartości z ciągu JSON przy użyciu operatora :
Składnia
{ { identifier | [ field ] | [ * ] | [ index ] }
[ . identifier | [ field ] | [ * ] | [ index ] ] [...] }
Nawiasy otaczające field
nawiasy i index
*
są rzeczywistymi nawiasami kwadratowymi i nie wskazują opcjonalnej składni.
Parametry
- identyfikator: bez uwzględniania wielkości liter identyfikator pola JSON.
[ field ]
: literał ciągu z uwzględnieniem nawiasu kwadratowego identyfikujący pole JSON.[ * ]
: identyfikowanie wszystkich elementów w tablicy JSON.[ index ]
: literał liczby całkowitej identyfikujący określony element w tablicy JSON opartej na 0.
Zwraca
CIĄG.
Gdy pole JSON istnieje z wartością bez ogranicznika null
, otrzymasz wartość SQL NULL
dla tej kolumny, a nie wartość tekstową null
.
Możesz użyć operatora :: do rzutowania wartości do podstawowych typów danych.
Funkcja from_json umożliwia rzutowanie zagnieżdżonych wyników na bardziej złożone typy danych, takie jak tablice lub struktury.
Uwagi
Możesz użyć identyfikatora bez ograniczeń, aby odwoływać się do pola JSON, jeśli nazwa nie zawiera spacji ani znaków specjalnych, i nie ma pola o tej samej nazwie w innym przypadku.
Użyj identyfikatora rozdzielanego, jeśli w innym przypadku nie ma pola o tej samej nazwie.
Notacja [ field ]
może być zawsze używana, ale wymaga dokładnego dopasowania wielkości liter pola.
Jeśli usługa Databricks SQL nie może jednoznacznie zidentyfikować pola, zwracany jest błąd. Jeśli nie zostanie znalezione dopasowanie dla dowolnego pola, funkcja SQL usługi Databricks zwróci wartość NULL
.
Przykłady
W poniższych przykładach użyto danych utworzonych za pomocą instrukcji w przykładowych danych.
W tej sekcji:
- Wyodrębnianie przy użyciu identyfikatora i ograniczników
- Wyodrębnianie zagnieżdżonych pól
- Wyodrębnianie wartości z tablic
- Zachowanie wartości NULL
- Rzutowanie wartości
- Przykładowe dane
Wyodrębnianie przy użyciu identyfikatora i ograniczników
> SELECT raw:owner, raw:OWNER, raw:['owner'], raw:['OWNER'] FROM store_data;
amy amy amy NULL
-- Use backticks to escape special characters. References are case insensitive when you use backticks.
-- Use brackets to make them case sensitive.
> SELECT raw:`zip code`, raw:`Zip Code`, raw:['fb:testid'] FROM store_data;
94025 94025 1234
Wyodrębnianie zagnieżdżonych pól
-- Use dot notation
> SELECT raw:store.bicycle FROM store_data;
'{ "price":19.95, "color":"red" }'
-- Use brackets
> SELECT raw:['store']['bicycle'] FROM store_data;
'{ "price":19.95, "color":"red" }'
Wyodrębnianie wartości z tablic
-- Index elements
> SELECT raw:store.fruit[0], raw:store.fruit[1] FROM store_data;
'{ "weight":8, "type":"apple" }' '{ "weight":9, "type":"pear" }'
-- Extract subfields from arrays
> SELECT raw:store.book[*].isbn FROM store_data;
'[ null, "0-553-21311-3", "0-395-19395-8" ]'
-- Access arrays within arrays or structs within arrays
> SELECT raw:store.basket[*],
raw:store.basket[*][0] first_of_baskets,
raw:store.basket[0][*] first_basket,
raw:store.basket[*][*] all_elements_flattened,
raw:store.basket[0][2].b subfield
FROM store_data;
basket first_of_baskets first_basket all_elements_flattened subfield
---------------------------- ------------------ --------------------- --------------------------------- ----------
[ [ [ [1,2,{"b":"y","a":"x"},3,4,5,6] y
[1,2,{"b":"y","a":"x"}], 1, 1,
[3,4], 3, 2,
[5,6] 5 {"b":"y","a":"x"}
] ] ]
Zachowanie wartości NULL
> SELECT '{"key":null}':key IS NULL sql_null, '{"key":"null"}':key IS NULL;
true false
Rzutowanie wartości
-- price is returned as a double, not a string
> SELECT raw:store.bicycle.price::double FROM store_data
19.95
-- use from_json to cast into more complex types
> SELECT from_json(raw:store.bicycle, 'price double, color string') bicycle FROM store_data
'{ "price":19.95, "color":"red" }'
-- the column returned is an array of string arrays
> SELECT from_json(raw:store.basket[*], 'array<array<string>>') baskets FROM store_data
'[
["1","2","{\"b\":\"y\",\"a\":\"x\"}]",
["3","4"],
["5","6"]
]'
Przykładowe dane
CREATE TABLE store_data AS SELECT
'{
"store":{
"fruit": [
{"weight":8,"type":"apple"},
{"weight":9,"type":"pear"}
],
"basket":[
[1,2,{"b":"y","a":"x"}],
[3,4],
[5,6]
],
"book":[
{
"author":"Nigel Rees",
"title":"Sayings of the Century",
"category":"reference",
"price":8.95
},
{
"author":"Herman Melville",
"title":"Moby Dick",
"category":"fiction",
"price":8.99,
"isbn":"0-553-21311-3"
},
{
"author":"J. R. R. Tolkien",
"title":"The Lord of the Rings",
"category":"fiction",
"reader":[
{"age":25,"name":"bob"},
{"age":26,"name":"jack"}
],
"price":22.99,
"isbn":"0-395-19395-8"
}
],
"bicycle":{
"price":19.95,
"color":"red"
}
},
"owner":"amy",
"zip code":"94025",
"fb:testid":"1234"
}' as raw
Funkcje pokrewne
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla