JSON 경로 식
적용 대상: Databricks SQL
Databricks Runtime
사용하여 JSON 문자열 또는 값을 추출하는 데 사용됩니다.
{ { identifier | [ field ] | [ * ] | [ index ] }
[ . identifier | [ field ] | [ * ] | [ index ] ] [...] }
, *
, index
를 둘러싼 대괄호는 실제 대괄호이며 선택적 구문을 나타내지 않습니다.
식별자: JSON 필드의 식별자입니다. JSON
형식의 경우 식별자는 대/소문자를 구분하지 않습니다. 형식의 경우VARIANT
대/소문자를 구분합니다. -
[ field ]
: JSON 필드를 식별하는 대/소문자를 구분STRING
하는 대괄호로 묶인 리터럴입니다. -
[ * ]
: JSON 배열의 모든 요소를 식별합니다. 이 구문은 .에 대해VARIANT
지원되지 않습니다. -
[ index ]
: 0부터 시작하는 JSON 배열의 특정 요소를 식별하는 정수 리터럴입니다.
탐색 중인 식이 .인 경우 A STRING
. 탐색 중인 식이 .인 경우 A VARIANT
구분되지 않은 null
값이 있는 JSON 필드가 있는 경우 NULL
텍스트 값이 아니라 해당 열에 대한 SQL null
값을 받게 됩니다.
:: 연산자 사용하여 값을 기본 데이터 형식으로 캐스팅할 수 있습니다.
from_json 함수를 사용하여 중첩 결과를 배열이나 구조체와 같은 더 복잡한 데이터 형식으로 캐스팅합니다.
이름에 공백이나 특수 문자가 없고 JSON STRING
같은 이름의 필드가 없는 경우 구분되지 않은 식별자를 사용하여 JSON 필드를 참조할 수 있습니다.
다른 경우에 동일한 이름의 필드가 없는 경우 구분된 식별자를 사용합니다.
[ field ]
표기법은 항상 사용할 수 있지만 필드의 대/소문자를 정확히 일치시켜야 합니다.
Azure Databricks가 필드를 고유하게 식별할 수 없는 경우 오류가 반환됩니다. 모든 필드에 대한 일치 항목이 없으면 Azure Databricks가 반환됩니다 NULL
내에서 인코딩할 수 있으며 해당 값은 SQL NULL
이 아닙니다.
따라서 , parse_json('null') IS NULL
이지만 false
인코딩된 null은 일부 형식으로 캐스팅하여 SQL NULL
로 변환할 수 있습니다. 예를 들어 parse_json('null')::int IS NULL
는 true
다음 예제에서는 예제 데이터의 문으로 만든 데이터를 사용합니다.
> SELECT raw:owner, raw:OWNER, raw:['owner'], raw:['OWNER'] FROM store_data;
amy amy amy NULL
-- Use backticks to escape special characters. References are case insensitive when you use backticks.
-- Use brackets to make them case sensitive.
> SELECT raw:`zip code`, raw:`Zip Code`, raw:['fb:testid'] FROM store_data;
94025 94025 1234
-- Use dot notation
> SELECT raw:store.bicycle FROM store_data;
'{ "price":19.95, "color":"red" }'
-- Use brackets
> SELECT raw:['store']['bicycle'] FROM store_data;
'{ "price":19.95, "color":"red" }'
-- Index elements
> SELECT raw:store.fruit[0], raw:store.fruit[1] FROM store_data;
'{ "weight":8, "type":"apple" }' '{ "weight":9, "type":"pear" }'
-- Extract subfields from arrays
> SELECT raw:store.book[*].isbn FROM store_data;
'[ null, "0-553-21311-3", "0-395-19395-8" ]'
-- Access arrays within arrays or structs within arrays
> SELECT raw:store.basket[*],
raw:store.basket[*][0] first_of_baskets,
raw:store.basket[0][*] first_basket,
raw:store.basket[*][*] all_elements_flattened,
raw:store.basket[0][2].b subfield
FROM store_data;
basket first_of_baskets first_basket all_elements_flattened subfield
---------------------------- ------------------ --------------------- --------------------------------- ----------
[ [ [ [1,2,{"b":"y","a":"x"},3,4,5,6] y
[1,2,{"b":"y","a":"x"}], 1, 1,
[3,4], 3, 2,
[5,6] 5 {"b":"y","a":"x"}
] ] ]
> SELECT '{"key":null}':key IS NULL sql_null, '{"key":"null"}':key IS NULL;
true false
-- price is returned as a double, not a string
> SELECT raw:store.bicycle.price::double FROM store_data
-- use from_json to cast into more complex types
> SELECT from_json(raw:store.bicycle, 'price double, color string') bicycle FROM store_data
'{ "price":19.95, "color":"red" }'
-- the column returned is an array of string arrays
> SELECT from_json(raw:store.basket[*], 'array<array<string>>') baskets FROM store_data
-- Using JSON paths for VARIANT
> SELECT raw:store.bicycle FROM store_data_variant;
'{ "price":19.95, "color":"red" }'
-- Extracting from VARIANT arrays
> SELECT raw:store.fruit[0], raw_variant:store.fruit[1] FROM store_data_variant;
'{ "weight":8, "type":"apple" }' '{ "weight":9, "type":"pear" }'
-- SQL NULL behavior of VARIANT NULL values
parse_json(NULL) IS NULL AS sql_null,
parse_json('null') IS NULL AS variant_null,
parse_json('{ "field_a": null }'):field_a IS NULL AS variant_null_value,
parse_json('{ "field_a": null }'):missing IS NULL AS missing_sql_value_null
true false false true
-- price is returned as a double, not a VARIANT
> SELECT raw:store.bicycle.price::double FROM store_data_variant
"fruit": [
"author":"Nigel Rees",
"title":"Sayings of the Century",
"author":"Herman Melville",
"title":"Moby Dick",
"author":"J. R. R. Tolkien",
"title":"The Lord of the Rings",
"zip code":"94025",
}' as raw
> CREATE TABLE store_data_variant AS SELECT parse_json(raw) FROM store_data;