Agrupación en clústeres geoespaciales
Los datos geoespaciales se pueden analizar de forma eficaz mediante sistemas de cuadrícula para crear clústeres geoespaciales. Puede usar herramientas geoespaciales para agregar, agrupar, crear particiones, reducir, unir e indexar datos geoespaciales. Estas herramientas mejoran el rendimiento del tiempo de ejecución de consultas, reducen el tamaño de los datos almacenados y visualizan datos geoespaciales agregados.
Azure Data Explorer admite los siguientes métodos de agrupación en clústeres geoespaciales:
Las funcionalidades principales de estos métodos son:
- Calcule el token hash\index\cell de la coordenada geoespacial. Las diferentes coordenadas geoespaciales que pertenecen a la misma celda tendrán el mismo valor de token de celda.
- Calcule el punto central del token hash\index\cell. Este punto es útil porque puede representar todos los valores de la celda.
- Calcule el polígono de celda. El cálculo de polígonos de celda es útil en la visualización de celdas u otros cálculos, por ejemplo, distancia o punto en comprobaciones de polígonos.
Comparación de métodos
Criterios | Geohash | Celda S2 | Celda H3 |
---|---|---|---|
Niveles de jerarquía | 18 | 31 | 16 |
Forma de celda | Rectángulo | Rectángulo | Hexágono |
Bordes de celda | Recto | Geodésica | Recto |
Sistema de proyección | Ninguno. Codifica la latitud y la longitud. | Transformación cuadrática centrada en el cubo. | Icosahedron cara centrada en la gnomónica. |
Recuento de vecinos | 8 | 8 | 6 |
Característica notable | Los prefijos comunes indican proximidad de puntos. | 31 niveles de jerarquía. | La forma de la celda es hexagonal. |
Rendimiento | Magnífica | Magnífica | Rápido |
Cubrir polígono con celdas | No compatible | Compatible | No compatible |
Elemento primario de celda | No compatible | No compatible | Compatible |
Elementos secundarios de celda | No compatible | No compatible | Compatible |
Anillos de celda | No compatible | No compatible | Compatible |
Sugerencia
Si no hay ninguna preferencia para una herramienta específica, use la celda S2.
Nota
Aunque el hash\indexing de coordenadas geoespaciales es muy rápido, hay casos en los que se puede aplicar hashing\indexing en la ingesta para mejorar el tiempo de ejecución de consultas. Sin embargo, este proceso puede aumentar el tamaño de los datos almacenados.
Funciones geohash
Nombre de la función |
---|
geo_point_to_geohash() |
geo_geohash_to_central_point() |
geo_geohash_neighbors() |
geo_geohash_to_polygon() |
Funciones de celda S2
Nombre de la función |
---|
geo_point_to_s2cell() |
geo_s2cell_to_central_point() |
geo_s2cell_neighbors() |
geo_s2cell_to_polygon() |
geo_polygon_to_s2cells() |
Funciones de celda H3
Nombre de la función |
---|
geo_point_to_h3cell() |
geo_h3cell_to_central_point() |
geo_h3cell_neighbors() |
geo_h3cell_to_polygon() |
geo_h3cell_parent() |
geo_h3cell_children() |
geo_h3cell_rings() |
Contenido relacionado
- Consulte un caso de uso para la agrupación en clústeres geoespaciales: Análisis de datos para flotas de pruebas automotrices
- Más información sobre la arquitectura de Azure para el procesamiento y el análisis de datos geoespaciales
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de