python中使用dict给list.index加速

场景

x = [[1, 2], [3, 4], [5, 6]...]
y = [[7, 8], [9, 10], [11, 18]...]

保证y中每一个值如[7, 8]一定出现在x中,现需要求y中所有值在x中的索引。

方法

一般做法:

idx = [x.index(t) for t in y]

然而,由于index的检索复杂度为O(n),当x数量巨大时,时间往往是不可接受的。

为此,我们可以考虑使用字典,字典的查询时间复杂度始终为O(1)

由于python中list是unhashable的,因此我们首先需要将list转为元组类型再进行映射:

x = [tuple(t) for t in x]
x_dict = dict(zip(x, [x for x in range(len(x))]))

此时再次查找y中元素的索引,速度可以提升好几个数量级:

y = [tuple(t) for t in y]
idx = [x_dict[t] for t in y]
print(idx)

版权声明:本文为Cyril_KI原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。