向量列表的 Harvesine 向量化
问题内容
我有一个代码片段,它使用半正矢函数计算两个坐标列表之间的距离矩阵。虽然当前的实现有效,但它涉及嵌套循环,并且对于大型数据集可能非常耗时。我正在寻找一种更有效的替代方案,避免使用 for 循环。
import numpy as npfrom haversine import haversine string_list_1 = [(20.00,-100.1),...] # List of vector pair coordinates (lat,long)string_list_2 = [(21.00,-101.1),...] # Another list of pair coordinatesdist_mat = np.zeros((len(string_list_1), len(string_list_2)))for i, coord1 in enumerate(string_list_1): dist_mat[i, :] = np.array([haversine(coord1, coord2) for coord2 in string_list_2])
我希望得到建议或代码示例,以便更有效、更快速地实现避免使用 for 循环。
正确答案
使用sklearn中的haversine。指标:
from sklearn.metrics.pairwise import haversine_distanceshaversine_distances(string_list_1,string_list_2)