单卡搞定万帧视频理解智源新模型12秒编码2048帧视频单张显卡，就能处理万帧视频

量子位看科技 2025-06-04 15:26:32

单卡搞定万帧视频理解智源新模型12秒编码2048帧视频

单张显卡，就能处理万帧视频输入，并且编码2048帧视频仅需12秒！

国产开源模型又上大分，这次是在长视频理解领域：

智源研究院联合上海交通大学等机构，正式发布新一代超长视频理解模型Video-XL-2。

长视频理解是多模态大模型关键能力之一。尽管OpenAI GPT-4o、Google Gemini等私有模型已在该领域取得显著进展，当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。

而Video-XL-2相较于上一版本的Video-XL，在多个维度全面优化了开源多模态大模型对长视频内容的理解能力：

- 效果更佳：Video-XL-2在长视频理解任务中表现出色，在MLVU、Video-MME、LVBench等主流评测基准上达到了同参数规模开源模型的领先水平。

- 长度更长：新模型显著扩展了可处理视频的时长，支持在单张显卡上高效处理长达万帧的视频输入。

- 速度更快：Video-XL-2大幅提升了处理效率，编码2048帧视频仅需12秒，显著加速长视频理解流程。

目前，Video-XL-2的模型权重已全面向社区开放。未来，该模型有望在影视内容分析、异常行为监测等多个实际场景中展现重要应用价值。

0 阅读：2

量子位看科技

感谢大家的关注

作者最新文章

1

调查显示七成用户骂过AI对AI说谢谢真的有用和AI对话的时候，你是否曾骂过它？T

2

一招让Docker速度快10倍pip换成uv后Docker快10倍弃用pip后，

3

AI掌握人类创造力GPT4创意理解超普通人AI变“聪明”了，居然懂“创意”了！北

4

家用机器人要成精了机器人更像人了一句：“去厨房看看冰箱里还有没有牛奶。”机器人就

5

生成式视角重塑监督学习监督学习一致性框架监督学习不再一股脑喂答案，而是借“模糊标

6

饿了么骑手迎来AI助理饿么了推出骑手智能体饿了么给骑手上线了AI助理，于是就有了

7

3D模型有竞技场了3D模型排行榜3D建模也有竞技场了！3D Arena，采用人类

8

正版书训练AI被判合法Anthropic使用盗版书训练将面临赔偿用出版书籍训练是

9

OceanBase公布AI新进展 6月24日，独立数据库厂商OceanBas

10

脑雾现象怎么改善注意力如何不分散你是不是也有这种感觉：- 脑子像被包着一层厚重的

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

2

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

3

荣耀Maigc7Pro上了一个新版本1、荣耀Maigc7Pro新增了一个1

4

新机来了三星GalaxyS25FE6.67英寸120hz1080p直屏E

5

听我一句劝！荣耀手机尽量认准这三款，把钱花在刀刃上，一定不踩雷。荣耀400P

6

荣耀Play10C发布4+128GB649；国补551.656+128GB

7

荣耀Magic8Pro彻底杀疯了！这次配置直接掀了友商的桌子。超大电池独步

科技最新文章

1

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

2

荣耀Magic8Pro彻底杀疯了！这次配置直接掀了友商的桌子。超大电池独步

3

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

4

荣耀Play10C发布4+128GB649；国补551.656+128GB

5

荣耀Maigc7Pro上了一个新版本1、荣耀Maigc7Pro新增了一个1

6

新机来了三星GalaxyS25FE6.67英寸120hz1080p直屏E

7

听我一句劝！荣耀手机尽量认准这三款，把钱花在刀刃上，一定不踩雷。荣耀400P