MiniMax开源首个视觉RL统一框架闫俊杰领衔开源首个视觉RL统一框架仅需一个

量子位看科技 2025-05-28 11:29:02

MiniMax开源首个视觉RL统一框架闫俊杰领衔开源首个视觉RL统一框架

仅需一个强化学习（RL）框架，就能实现视觉任务大统一？

现有RL对推理和感知任务只能二选一，但“大模型六小强”之一MiniMax表示：我全都要！

最新开源V-Triune（视觉三重统一强化学习系统）框架，使VLM首次能够在单个后训练流程中，联合学习和掌握视觉推理和感知任务。

通过三层组件设计和基于动态交并比（IoU）的奖励机制，弥补了传统RL方法无法兼顾多重任务的空白。

甚至基于V-Triune，MiniMax还一步到位，贴心地给大家开发了全新的Orsta（One RL to See Them All）模型系列（7B至32B），在MEGA-Bench Core基准测试中从+2.1%显著提升至+14.1%。

值得注意的是，在论文的作者一栏，MiniMax创始人兼CEO闫俊杰也参与了这项研究。

目前V-Triune框架和Orsta模型都在GitHub上实现全面开源，点击文末链接即可跳转一键获取。

那话不多说，咱们直接上细节。

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

癌症新疗法有望大幅降低费用体内改造T细胞或免去化疗体内改造T细胞，治疗血癌的费用

2

MiniMax开源首个视觉RL统一框架闫俊杰领衔开源首个视觉RL统一框架仅需一个

3

国产开源模型登HuggingFace热榜阿里突破长文本训练难题阿里开源长文本推

4

科学家发现空气取水新材料可重复使用的除湿袋科学家发现空气取水新材料，荒野求生不怕

5

宣称AI优先的公司后悔了多邻国撤回了AI优先声明宣布“AI优先”，要裁掉所有外包

6

字节复旦团队推出自适应推理框架摆脱模型对思维链过度依赖过度依赖CoT思维链推理会

7

【形式化证明与大模型：共创可验证的AI数学未来】量子位直播就在5月，前有Dee

8

AI冲击应届生岗位AI正取代入门级工作AI浪潮，反而让00后“吃尽时代黑利”？领

9

北大小模型比肩DeepSeek满血版只用5%参数媲美DeepSeek满血版北大团

10

MIT发现新型超导体科学家在石墨烯中发现磁性超导Nature最新发布的文章显示

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

2

同事iphone13pro有几年了，说电池健康度只有70%了，一天到晚的就见他

3

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

4

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

5

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

6

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

7

荣耀Maigc7Pro上了一个新版本1、荣耀Maigc7Pro新增了一个1

8

新机来了三星GalaxyS25FE6.67英寸120hz1080p直屏E

9

大哥这手机，我闭着眼睛都能认出来是啥

10

英伟达说H20没后门，可玉渊潭天把芯片拆到晶体管级，发现三条可疑信号线直通管理引

科技最新文章

1

估计不少人已经发现，手机这玩意就别买太贵的现在的千元机其实就能用好几年大多数

2

英伟达说H20没后门，可玉渊潭天把芯片拆到晶体管级，发现三条可疑信号线直通管理引

3

大哥这手机，我闭着眼睛都能认出来是啥

4

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

5

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

6

荣耀Magic8Pro彻底杀疯了！这次配置直接掀了友商的桌子。超大电池独步

7

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

8

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

9

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

10

也没人早点告诉我Reno15这么猛啊！本以为今年Reno14已经够惊艳了，没想