我对字节编码的世界很陌生,所以如果我以错误的方式使用/表达简单的概念,请原谅我(并且一定要纠正我)。
我试图理解可变字节编码。我已经阅读了 Wikipedia 文章 ( http://en.wikipedia.org/wiki/Variable-width_encoding ) 以及信息检索教科书中的一本书章节。我想我了解如何编码十进制整数。例如,如果我想为整数 60 提供可变字节编码,我将得到以下结果:
1 0 1 1 1 1 0 0
(如果以上内容不正确,请告诉我)。如果我了解该方案,那么我不完全确定信息是如何压缩的。是不是因为通常我们会使用 32 位来表示一个整数,所以表示 60 会导致1 1 1 1 0 0
前面有 26 个零,从而浪费了那个空间而不是只用 8 位来表示它?
预先感谢您的澄清。