Agrupación en clústeres geoespaciales

Los datos geoespaciales se pueden analizar de forma eficaz mediante sistemas de cuadrícula para crear clústeres geoespaciales. Puede usar herramientas geoespaciales para agregar, agrupar, crear particiones, reducir, unir e indexar datos geoespaciales. Estas herramientas mejoran el rendimiento del tiempo de ejecución de consultas, reducen el tamaño de los datos almacenados y visualizan datos geoespaciales agregados.

Azure Data Explorer admite los siguientes métodos de agrupación en clústeres geoespaciales:

Las funcionalidades principales de estos métodos son:

  • Calcule el token hash\index\cell de la coordenada geoespacial. Las diferentes coordenadas geoespaciales que pertenecen a la misma celda tendrán el mismo valor de token de celda.
  • Calcule el punto central del token hash\index\cell. Este punto es útil porque puede representar todos los valores de la celda.
  • Calcule el polígono de celda. El cálculo de polígonos de celda es útil en la visualización de celdas u otros cálculos, por ejemplo, distancia o punto en comprobaciones de polígonos.

Comparación de métodos

Criterios Geohash Celda S2 Celda H3
Niveles de jerarquía 18 31 16
Forma de celda Rectángulo Rectángulo Hexágono
Bordes de celda Recto Geodésica Recto
Sistema de proyección Ninguno. Codifica la latitud y la longitud. Transformación cuadrática centrada en el cubo. Icosahedron cara centrada en la gnomónica.
Recuento de vecinos 8 8 6
Característica notable Los prefijos comunes indican proximidad de puntos. 31 niveles de jerarquía. La forma de la celda es hexagonal.
Rendimiento Magnífica Magnífica Rápido
Cubrir polígono con celdas No compatible Compatible No compatible
Elemento primario de celda No compatible No compatible Compatible
Elementos secundarios de celda No compatible No compatible Compatible
Anillos de celda No compatible No compatible Compatible

Sugerencia

Si no hay ninguna preferencia para una herramienta específica, use la celda S2.

Nota

Aunque el hash\indexing de coordenadas geoespaciales es muy rápido, hay casos en los que se puede aplicar hashing\indexing en la ingesta para mejorar el tiempo de ejecución de consultas. Sin embargo, este proceso puede aumentar el tamaño de los datos almacenados.

Funciones geohash

Nombre de la función
geo_point_to_geohash()
geo_geohash_to_central_point()
geo_geohash_neighbors()
geo_geohash_to_polygon()

Funciones de celda S2

Nombre de la función
geo_point_to_s2cell()
geo_s2cell_to_central_point()
geo_s2cell_neighbors()
geo_s2cell_to_polygon()
geo_polygon_to_s2cells()

Funciones de celda H3

Nombre de la función
geo_point_to_h3cell()
geo_h3cell_to_central_point()
geo_h3cell_neighbors()
geo_h3cell_to_polygon()
geo_h3cell_parent()
geo_h3cell_children()
geo_h3cell_rings()