블룸 필터 인덱스(사용되지 않음)

Important

블룸 필터 인덱스를 사용하지 마세요. Azure Databricks 이 기능은 더 이상 사용되지 않으며 테이블에서 기존 Bloom 필터 인덱스를 제거하는 것이 좋습니다.

블룸 필터 인덱스는 더 이상 워크로드에 권장하지 않는 Azure Databricks 레거시 데이터 건너뛰기 메커니즘입니다. 쓰기 오버헤드를 추가하고, 튜닝하기 어렵고, 보다 효과적인 대안으로 대체됩니다.

대신 다음 기능을 사용합니다.

  • 예측 I/O: Databricks Runtime 12.2 이상에서 사용할 수 있는 Photon이 지원하는 컴퓨팅에서 예측 I/O는 모든 열에서 자동으로 파일 스키핑을 수행합니다. Photon을 사용하는 경우에만 쓰기 오버헤드를 추가하는 Bloom 필터 인덱스를 완전히 대체합니다.
  • Liquid 클러스터링: Databricks Runtime 13.3 이상에서 Liquid 클러스터링은 자주 필터링되는 열을 기준으로 데이터를 조직화하여 데이터 스키핑을 향상시킵니다.

기존 Bloom 필터 인덱스 제거

테이블에 기존 Bloom 필터 인덱스가 있는 경우 삭제하여 불필요한 쓰기 오버헤드를 제거합니다.

DROP BLOOMFILTER INDEX ON TABLE table_name

구문 세부 정보는 DROP BLOOM FILTER INDEX참조하세요.

모든 Bloom 필터 인덱스를 삭제한 후 VACUUM을(를) 실행하여 _delta_index에서 기본 인덱스 파일을 정리합니다.