CACHE TABLE

적용 대상: 예로 체크 표시된 Databricks 런타임

Apache Spark 캐시에서 지정된 스토리지 수준으로 테이블 또는 쿼리의 출력 내용을 캐시합니다. 쿼리가 캐시되면 이 쿼리에 대한 임시 보기가 만들어집니다. 이렇게 하면 향후 쿼리에서 원본 파일의 검사가 줄어듭니다.

비고

캐시된 데이터는 클러스터의 모든 Spark 세션에서 공유됩니다.

구문

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

게으른

즉시 캐시하는 대신 테이블을 처음 사용할 때만 캐시합니다.
table_name

캐시할 델타 테이블 또는 뷰를 식별합니다. 이름에는 임시 사양 또는 옵션 사양이 포함되어서는 안됩니다. 테이블을 찾을 수 없는 경우 Azure Databricks는 TABLE_OR_VIEW_NOT_FOUND 오류를 발생시킵니다.
옵션 ( 'storageLevel' [ = ] 값 )

OPTIONS 키와 값 쌍이 포함된 storageLevel 절입니다. storageLevel이 아닌 키가 사용되면 경고가 발생합니다. 유효한 storageLevel 옵션은 다음과 같습니다.
- NONE
  - DISK_ONLY
  - DISK_ONLY_2
  - MEMORY_ONLY
  - MEMORY_ONLY_2
  - MEMORY_ONLY_SER
  - MEMORY_ONLY_SER_2
  - MEMORY_AND_DISK
  - MEMORY_AND_DISK_2
  - MEMORY_AND_DISK_SER
  - MEMORY_AND_DISK_SER_2
  - OFF_HEAP
storageLevel에 잘못된 값이 설정되면 예외가 throw됩니다. storageLevel이 OPTIONS 절을 사용하여 명시적으로 설정되지 않은 경우 storageLevel 기본값은 MEMORY_AND_DISK로 설정됩니다.
쿼리

캐시할 행을 생성하는 쿼리입니다. 다음 형식 중 하나일 수 있습니다.
- SELECT 진술
- TABLE 진술
- FROM 진술

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;

이 페이지가 도움이 되었나요?