我有数十亿个格式为 word0.word1.word2 的字符串,我希望对这些字符串进行取模,以便将每个字符串提供给数据库编写器进行存储。我知道我可以对字符串的第一个字符执行模 10 的形式,如下所示:
for i in ["a.b","c.d"]:
print ord(i[0]) % 10
但是,这不会平均划分我的字符串,因为 word0、word1 和 word2 按字母顺序排序,并且字符串的第一个字符通常是“a”。我可以取字符串的最后一个字母,但不确定它们是否正常分布。
我的问题:有没有一种快速的方法可以在整个字符串上执行类似“ord”的操作?我最终计划在字符串的整数表示上运行模 48,并希望该模输出均匀分布在所有 48 个内核上。对于其他人可以提供的任何帮助,我将不胜感激。