DC娱乐网

京东宣布开源JoyAI-Echo长音视频生成框架

观点网讯:6月4日,京东正式开源JoyAI-Echo长音视频生成框架,完整代码及模型权重已在GitHub上线。

据介绍,该框架引入智能“导演助理”DirectorAgent,并内置跨模态记忆库,可在多镜头生成中持续保持角色外观和说话人音色一致。通过DMD技术实现7.5倍推理加速,并支持对话式编辑功能,用户无需重跑整条视频即可修改镜头。

根据公开资料整理,JoyAI-Echo直接解决了长视频生成领域长期存在的“角色易崩、声音乱变、生成缓慢”三大难题,使京东在长视频生成领域进入全球第一梯队。