【[41星]j1-micro:超迷你但超强的奖励模型,为AI奖励建模提供高效解决方案。亮点:1. 模型小巧,j1-micro仅1.7B参数,j1-nano仅600M参数;2. 性能卓越,j1-micro在RewardBench评分高达80.70%,超越许多数十倍参数量的模型;3. 采用创新的自原则批判调整方法,能生成针对具体任务的独特评分标准】
'j1-micro & j1-nano: Tiny But Mighty Reward Models'
GitHub: github.com/haizelabs/j1-micro
奖励模型 AI效率 模型优化 AI创造营