我有一个充满大量 URL 的 sqlite 数据库,它占用了大量的磁盘空间,并且访问它会导致许多磁盘寻道并且速度很慢。平均 URL 路径长度为 97 字节(主机名重复很多,因此我将它们移动到外键表中)。有什么好的方法可以压缩它们吗?大多数压缩算法都能很好地处理大文档,而不是平均小于 100 字节的“文档”,但即使减少 20% 也非常有用。有什么可行的压缩算法吗?不一定是标准的东西。
使用压缩算法但使用共享字典。
我之前做过类似的事情,使用 LZC/LZW 算法,如 Unix 压缩命令所使用的那样。
使用短字符串获得良好压缩的技巧是使用由要压缩的 URL 的标准样本组成的字典。
你应该很容易得到20%。
编辑:LZC 是 LZW 的变体。您只需要 LZW,因为您只需要一个静态字典。 LZC 添加了对字典/表满时重置的支持。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)