DC娱乐网

男朋友问我什么是test-time scaling

最近看一些RAG的帖子,总看到类似的说法“随着test-time scaling技术的广泛应用,强化学习在提升RAG系统中的应用日益增多”,还看到一些模型蒸馏的帖子,比如怎么让7B模型反超满血版deepseek r1,也提到了test-time scaling,感觉这个领域即庞大又充满希望,所以就来看看这篇综述梳理一下吧! 论文:What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models