QWen 正式开源 Qwen3-ASR系列模型的开放源代码。该系列模型包括两个强大的语音识别模型和一个创新的语音强制对齐模型,支持多语言和方言,并具有精准、稳定的识别能力。 重要亮点 1.多语言支持:支持52个语种和方言的识别与语音识别。 2.高性能模型:1.7B模型在多个场景下达到SOTA水平,0.6B模型在性能和效率上实现均衡。 3.强制对齐模型:Qwen3-ForcedAligner-0.6B支持11个语种的任意位置强制对齐,时间戳预测精度领先。 4.全面工具:提供推理框架,支持batch推理、异步服务、流式推理等功能。


