原来马斯克买Cursor是为了要Cursor的数据啊!
他在回答网友的时候说GrokV9已经训完了,接下来会把Cursor数据加进补充训练,然后再做SFT和RL。
之前还不知道为什么马斯克要买 Cursor,现在知道了。
因为模型要继续往上走,光靠公开网页、论文、代码仓库已经不够了。
公开语料能教模型「知道什么」,但很难教模型「人在真实产品里怎么做事」。
真正稀缺的是这种数据:用户怎么提需求、怎么改prompt、怎么接受或拒绝结果、哪里卡住、哪里重试、最后什么东西真的被用上了。
这类数据比普通文本贵得多,因为它带着真实任务、真实反馈、真实偏好。
我之前也帮人介绍过数据相关的生意,最大的感受就是:高质量数据在国内外都非常稀缺。
大家以为AI公司拼的是模型架构、算力、工程,其实到后面拼的还是谁有持续产生高质量行为数据的入口。没有这些数据,模型可以在榜单上变强,但很难在真实工作流里变好。
GrokBuild现在的问题,其实也在这里。
Model本身还不够,但如果xAI真的能把X、Grok、Cursor这类真实交互数据喂进去,后面提升会非常快。