Clustering géospatial

Les données géospatiales peuvent être analysées efficacement à l’aide de systèmes de grille pour créer des clusters géospatiaux. Vous pouvez utiliser des outils géospatiaux pour agréger, clusteriser, partitionner, réduire, joindre et indexer des données géospatiales. Ces outils améliorent les performances d’exécution des requêtes, réduisent la taille des données stockées et visualisent les données géospatiales agrégées.

Azure Data Explorer prend en charge les méthodes de clustering géospatiales suivantes :

Les principales fonctionnalités de ces méthodes sont les suivantes :

  • Calculez le jeton hash\index\cell de la coordonnée géospatiale. Différentes coordonnées géospatiales qui appartiennent à la même cellule auront la même valeur de jeton de cellule.
  • Calculez le point central du jeton hash\index\cell. Ce point est utile, car il peut représenter toutes les valeurs de la cellule.
  • Calculer le polygone de cellule. Le calcul des polygones de cellules est utile dans la visualisation des cellules ou d’autres calculs, par exemple, la distance ou le point dans les contrôles de polygones.

Comparer les méthodes

Critères Geohash Cellule S2 H3, cellule
Niveaux de hiérarchie 18 31 16
Forme de cellule Rectangle Rectangle Hexagone
Bords de cellule Droit Géodésique Droit
Système de projection Aucun. Encode la latitude et la longitude. Transformation quadratique centrée sur une face de cube. Icosahedron gnomonique centré.
Nombre de voisins 8 8 6
Fonctionnalité notable Les préfixes communs indiquent la proximité des points. 31 niveaux hiérarchiques. La forme de cellule est hexagonale.
Performances Superbe Superbe Rapide
Couvrir le polygone avec des cellules Non pris en charge Pris en charge Non pris en charge
Parent de cellule Non pris en charge Non pris en charge Pris en charge
Enfants de cellule Non pris en charge Non pris en charge Pris en charge
Anneaux de cellule Non pris en charge Non pris en charge Pris en charge

Conseil

S’il n’existe aucune préférence pour un outil spécifique, utilisez la cellule S2.

Notes

Bien que le hachage\indexation des coordonnées géospatiales soit très rapide, il existe des cas où le hachage\indexation sur l’ingestion peut être appliqué pour améliorer l’exécution des requêtes. Toutefois, ce processus peut augmenter la taille des données stockées.

Fonctions Geohash

Nom de fonction
geo_point_to_geohash()
geo_geohash_to_central_point()
geo_geohash_neighbors()
geo_geohash_to_polygon()

Fonctions de cellule S2

Nom de fonction
geo_point_to_s2cell()
geo_s2cell_to_central_point()
geo_s2cell_neighbors()
geo_s2cell_to_polygon()
geo_polygon_to_s2cells()

Fonctions de cellule H3

Nom de fonction
geo_point_to_h3cell()
geo_h3cell_to_central_point()
geo_h3cell_neighbors()
geo_h3cell_to_polygon()
geo_h3cell_parent()
geo_h3cell_children()
geo_h3cell_rings()