encoding - 这是 passlib base64 编码中的错误吗？

Question

我正在尝试使用passlibs base64 编码对重新编码的字节串进行解码：

from passlib.utils import binary

engine = binary.Base64Engine(binary.HASH64_CHARS)
s2 = engine.encode_bytes(engine.decode_bytes(b"1111111111111111111111w"))

print(s2)

这b'1111111111111111111111A'当然不是我所期望的。最后一个字符不同。

我的错误在哪里？这是一个错误吗？

score 1 · Accepted Answer

不，这不是错误。

在 Base64 的所有变体中，每个编码字符仅代表 6 位，并且根据编码的字节数，您最终可以得到 0、2 或 4 个无意义的位。
在这种情况下，编码字符串1111111111111111111111w的长度为 23 个字符，这意味着 23*6 = 138 位，可以解码为 17 个字节（136 位）+ 2 个无意义的位。

您在这里使用的编码不是 Base64 而是Hash64

多种哈希格式使用的 Base64 字符映射；排序与标准 base64 字符映射大不相同。

在字符映射
HASH64_CHARS = u("./0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz")
中，我们A在索引 12 ( 001100) 和w索引 60 ( 111100)上找到

现在这里的“技巧”是，它
binary.Base64Engine(binary.HASH64_CHARS)有一个默认参数 big=False，这意味着默认情况下以小端格式进行编码。

在您的示例中，这意味着wis001111和Ais 001100。在解码过程中，最后两位被切断，因为它们不需要如上所述。当您再次对其进行编码时，A将其作为字符映射中的第一个字符，可以使用两个编码0011加上两个无关紧要的位。

encoding - 这是 passlib base64 编码中的错误吗？

1 回答 1

Related

Reference