有趣的文章： gzip（就是那个linux里自带的压缩程序）能成为一个语言模型吗

2026-06-21 01:56:52 蚁工厂科技

有趣的文章： gzip（就是那个linux里自带的压缩程序）能成为一个语言模型吗?答案自然是可以（虽然效果不好）。因为：压缩即预测

文章的理论基础是压缩等价于预测：压缩器会用更少的比特表示它“预期”的内容，用更多比特表示意外内容。信息论里，一个符号需要的编码长度大约是 -log₂ p，概率越高，需要的比特越少。因此，任何压缩器内部其实都隐含了某种概率模型。gzip 使用 DEFLATE，它会在最近 32 KiB 的滑动窗口里寻找重复片段；如果候选续写像窗口里的已有文本，就能被编码成很便宜的回指，因此压缩长度更短。

语言建模本质上是在预测下一个 token，而好的预测器天然也是好的压缩器。gzip 没有神经网络、没有训练参数，也不理解语义，但只要它能利用重复模式，就能产生一点类似“续写”的行为。

文章地址：nathan.rs/posts/gzip-lm/代码实现：github.com/nathan-barry/gzipt

AI创造营

阅读：0 点赞：0

DC娱乐网

有趣的文章： gzip（就是那个linux里自带的压缩程序）能成为一个语言模型吗

热门分类

有趣的文章： gzip（就是那个linux里自带的压缩程序）能成为一个语言模型吗

猜你喜欢

不可一世的微软，终究还是官宣向DeepSeek“屈服”了！微软AI部门副

国产大模型形势一片大好，软硬件全面突破，已经能摸到美国最前沿水平了1.为什么最

最近又一个开源项目火了，不到24小时暴涨了1万多Star，值得各位开发者

整理了一下中美大模型名字的由来，发现还挺有意思。原来很多AI模型的名字，不只

目前中国最强的大模型deepseek之后应该就是阿里的通义了，智谱只能排在前五，

最近美国大模型性能上去了，中国落后的差距在拉大。原因是工程和生态的，可以解释，没

热门分类