DC娱乐网

日常任务,Flash 模型用哪款?

很多人会痴迷于“最强模型”,能上Pro/Opus就绝不用便宜档,好像档位越高,代码就越靠谱。

但其实,最强最贵的模型从来就不是用来写代码的。

日常项目中的大部分任务,写文档、做单元测试,搞部署,迁移重构,还有跑 Hermes 这些 Agent 等等,Flash 模型其实足以应对绝大部分的场景。

正确的思路应该是两者搭配,让最贵的模型去做规划、做判断,把方案写成一份份规格说明,然后把动手做这件事丢给便宜模型去做。

作为干脏活累活的“牛马”,一款好用的 Flash 级模型尤为重要。
既要速度快,又要性能全面、稳定,还要有性价比,并且在真实 Agent 任务中的完成效率要高。
目前热门的有Deepseek v4 Flash,Step 3.7 Flash和 Gemini 3.5 Flash 等。

近期用了一段时间Deepseek v4 Flash和Step 3.7 Flash,聊一聊使用体验:

一,Step 3.7 Flash 的定位是‘面向生产级 Agent 的高效率 Flash 模型’,在 Agent Coding 与多模态工作流中的体验确实很流畅。
优点也很明显:
1,原生多模态,能更好地完成多样化任务,非常方便,不用切换模型。
2,速度超快,一个世界杯实时数据仪表盘的任务,从搜集数据到配图到生成可视化图标,最后产出交互式网页,Deepseek v4 Flash花了 83 分钟,Step 3.7 Flash花了 46 分钟。端到端任务耗时更少。
3,连续多轮工具调用后能保持不错的稳定性,并且 Search 做的很好。

二,Deepseek v4 Flash便宜好用,上下文足够长,适合长程批量执行一些对判断质量要求没那么极致的任务。
不足是偶尔会偷懒,Search 质量明显不如Step 3.7 Flash,并且速度有时候偏慢。
还有一个缺陷是不支持多模态,经常打断正常的工作流,比如截了个报错截图、或者拖进来一张 UI 设计稿就直接傻眼了,而类似这样的场景非常多。

顺便分享几个使用案例,你觉得哪个更好用?