英語で読む

次の方法で共有


LocationClosestGranularity クラス

最も近い場所の細分性を定義します。

_cord_count は、重複を削除した後の顧客データの数です。 これが _cord_limit より大きい場合、大まかなフィルター処理を行うために _lower_fuzzy_boundary が使用されます。それ以外の場合、_upper_fuzzy_boundary が使用されます。

可能性のあるすべての場所は、2 つの場所の球面距離によってランク付けされ、さらなる結合を行うために _closest_top_n が選択されます。

さまざまな構成を使用して初期化します。

cord_countは dropDuplicates() の後のcustomer_dataの数です。_cord_limitより大きい場合は、_lower_fuzzy_boundaryを使用して大まかなフィルター処理を行います。それ以外の場合は、_upper_fuzzy_boundaryを使用します。 考えられるすべての場所は、2 つの場所の球面距離でランク付けされます。さらに結合するには、_closest_top_nを選択します。

継承
LocationClosestGranularity

コンストラクター

LocationClosestGranularity(_cord_limit=5, _lower_fuzzy_boundary=2, _upper_fuzzy_boundary=5, _closest_top_n=1)

パラメーター

名前 説明
_cord_limit
int

重複を削除した後の顧客データの数。 既定値は 5 です。

規定値: 5
_lower_fuzzy_boundary
int

フィルター処理の下限。 既定値は 2 です

規定値: 2
_upper_fuzzy_boundary
int

フィルター処理の上限。 既定値は 5 です

規定値: 5
_closest_top_n
int

最も近いと見なす上位一致の数。 既定値は 1 です。 値が大きいほど、時間コストが増加します。

規定値: 1
_cord_limit
必須

既定値は 5 です

_lower_fuzzy_boundary
必須

既定値は 2 です

_upper_fuzzy_boundary
必須

既定値は 5 です

_closest_top_n
必須

既定値は 1 で、時間コストが大きいほど大きくなります。

メソッド

get_log_property

ログ プロパティ タプルを取得します。プロパティがない場合は None です。

get_log_property

ログ プロパティ タプルを取得します。プロパティがない場合は None です。

get_log_property()