我有一个非常简单的 python 例程,其中涉及循环遍历大约 20,000 个纬度、经度坐标的列表并计算每个点到参考点的距离。
def compute_nearest_points( lat, lon, nPoints=5 ):
"""Find the nearest N points, given the input coordinates."""
points = session.query(PointIndex).all()
oldNearest = []
newNearest = []
for n in xrange(nPoints):
oldNearest.append(PointDistance(None,None,None,99999.0,99999.0))
newNearest.append(obj2)
#This is almost certainly an inappropriate use of deepcopy
# but how SHOULD I be doing this?!?!
for point in points:
distance = compute_spherical_law_of_cosines( lat, lon, point.avg_lat, point.avg_lon )
k = 0
for p in oldNearest:
if distance < p.distance:
newNearest[k] = PointDistance(
point.point, point.kana, point.english, point.avg_lat, point.avg_lon, distance=distance
)
break
else:
newNearest[k] = deepcopy(oldNearest[k])
k += 1
for j in range(k,nPoints-1):
newNearest[j+1] = deepcopy(oldNearest[j])
oldNearest = deepcopy(newNearest)
#We're done, now print the result
for point in oldNearest:
print point.station, point.english, point.distance
return
我最初是用 C 语言编写的,使用完全相同的方法,它在那里工作得很好,并且对于 nPoints<=100 基本上是瞬时的。所以我决定将它移植到 python,因为我想使用 SqlAlchemy 来做一些其他的事情。
我第一次移植它时没有现在使用该方法的 deepcopy 语句,这导致结果“奇怪”或部分不正确,因为某些点只是被复制为引用(我猜?我想?)-但它仍然几乎和 C 版本一样快。
现在添加了 deepcopy 调用,该例程可以正常工作,但它已经招致了极大的性能损失,现在需要几秒钟才能完成相同的工作。
这似乎是一项很常见的工作,但我显然不是以 Python 的方式来做的。我应该怎么做才能得到正确的结果,但不必在任何地方都包含 deepcopy?
编辑:
我找到了一个更简单、更快的解决方案,
def compute_nearest_points2( lat, lon, nPoints=5 ):
"""Find the nearest N points, given the input coordinates."""
points = session.query(PointIndex).all()
nearest = []
for point in points:
distance = compute_spherical_law_of_cosines( lat, lon, point.avg_lat, point.avg_lon )
nearest.append(
PointDistance(
point.point, point.kana, point.english, point.avg_lat, point.avg_lon, distance=distance
)
)
nearest_points = sorted(nearest, key=lambda point: point.distance)[:nPoints]
for item in nearest_points:
print item.point, item.english, item.distance
return
所以基本上我只是制作输入的完整副本并附加一个新值 - 与参考点的距离。然后我只是将“排序”应用于结果列表,指定排序键应该是 PointDistance 对象的距离属性。
这比使用 deepcopy 快得多,尽管我承认我真的不明白为什么。我想这取决于高效的 C 实现 python 的“排序”?