每次重复调用LLM都是在烧钱，传统缓存只能精确匹配，无法解决语义多样性问题。

爱生活爱珂珂 2025-08-12 07:32:19

每次重复调用 LLM 都是在烧钱，传统缓存只能精确匹配，无法解决语义多样性问题。Redis 8 打破局限，带来语义缓存革命：

• LangCache：基于语义向量匹配缓存，不再依赖完全相同的字符串输入。通过嵌入向量找出语义相近的历史请求，命中则直接返回缓存结果，节省大量计算成本和响应时间。

• Vector Sets：Redis 原生支持向量相似度搜索，无需外接向量数据库。快速检索语义相近的条目，提升推荐、搜索、实体解析等场景效果。

• Redis Flex：混合 RAM+SSD 存储，扩大缓存容量，降低成本。热点数据保留在内存，冷数据转移至 SSD，实现高效且经济的缓存扩展。

核心价值：传统缓存基于键匹配，面对表达差异极大的自然语言请求失效，导致频繁调用 LLM 浪费资源。Redis 8 通过理解“意义”而非“字面”，大幅提升缓存命中率，降低重复计算，实现更快更省钱的智能缓存。

示意流程：

用户请求 → LangCache 查询语义相似缓存 → 命中返回缓存结果，未命中调用 LLM → 缓存更新响应

节省公式：

预估节省 = （每月输出 token 费用）×（缓存命中率）

对 LLM 应用、聊天机器人、RAG、智能代理等场景意义巨大，迈向更智慧、更经济的 AI 基础设施。

详细解析👉 newsletter.systemdesignclassroom.com/p/every-repeated-llm-call-is-money-on-fire

示例图与流程👉 twitter.com/RaulJuncoV/status/1954876732261253578

语义缓存 Redis8 LangCache 向量搜索智能缓存 LLM成本优化

0 阅读：1

猜你喜欢

去年9月，孙凝晖院士在出席中国计算机大会新闻发布会时说，中美在AI领域差距为2到

去年9月，孙凝晖院士在出席中国计算机大会新闻发布会时说，中美在AI领域差距为2到

【18评论】【5点赞】

ai 孙凝晖人工智能

闫闯使用了小米端到端HAD辅助驾驶,结果如何？闫闯发文说从机场回公司路上，在

闫闯使用了小米端到端HAD辅助驾驶,结果如何？闫闯发文说从机场回公司路上，在

【1点赞】

小米科技华为Mate XT Mate XT 小米su7

“A股精选中国AI算力50强”，以下是核心内容的结构化总结：一、光模块与算力

“A股精选中国AI算力50强”，以下是核心内容的结构化总结：一、光模块与算力

【1评论】【211点赞】

ai 芯片路由器人工智能

英伟达在华节节败退，白宫这下坐不住了：可以出售下一代先进AI芯片！目前，英伟

英伟达在华节节败退，白宫这下坐不住了：可以出售下一代先进AI芯片！目前，英伟

【14评论】【17点赞】

英伟达白宫 ai芯片华为麒麟芯片 it芯片人工智能

AI芯片最全面的分类整理！兆易创新：MCU芯片行业龙头，目前中国大陆领先的闪存

AI芯片最全面的分类整理！兆易创新：MCU芯片行业龙头，目前中国大陆领先的闪存

ai芯片闪存华为麒麟芯片华为手机 it芯片

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

Spirit of Kiro：致力于打造沉浸式互动体验的开源多媒体艺术项目 •

2

低精度训练技术正成为深度学习优化的关键路径，汇总最前沿工具与方法，助力模型训练更

3

CoreML LLM CLI：在 Apple Neural Engine 上运行

4

Retrieval Augmented Generation（RAG）系统设计与

5

斯坦福CS336春季2025课程，全面深入讲解语言模型构建，助力学生掌握从零开发

6

“不同于其他AGI实验室，你不能屏蔽Google爬虫，否则将无法被Google收

7

Sniffly：一款开源工具，专注分析 Claude Code 日志，助力洞察使

8

「人人能懂的AI前沿」AI的“灵魂拷问”：当机器开始打草稿、犯糊涂、学做人

9

AI 自我进化仍未实现，未来也不会一蹴而就，而是长期渐进的过程，预计耗时可能长达

10

早！[太阳] 早安

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

2

同事iphone13pro有几年了，说电池健康度只有70%了，一天到晚的就见他

3

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

4

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

5

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

6

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

7

荣耀Maigc7Pro上了一个新版本1、荣耀Maigc7Pro新增了一个1

8

新机来了三星GalaxyS25FE6.67英寸120hz1080p直屏E

9

大哥这手机，我闭着眼睛都能认出来是啥

10

英伟达说H20没后门，可玉渊潭天把芯片拆到晶体管级，发现三条可疑信号线直通管理引

科技最新文章

1

估计不少人已经发现，手机这玩意就别买太贵的现在的千元机其实就能用好几年大多数

2

英伟达说H20没后门，可玉渊潭天把芯片拆到晶体管级，发现三条可疑信号线直通管理引

3

大哥这手机，我闭着眼睛都能认出来是啥

4

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

5

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

6

荣耀Magic8Pro彻底杀疯了！这次配置直接掀了友商的桌子。超大电池独步

7

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

8

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

9

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

10

也没人早点告诉我Reno15这么猛啊！本以为今年Reno14已经够惊艳了，没想