4月29日凌晨,阿里巴巴正式开源新一代通义千问模型Qwen3。官方介绍,Qwen3采用混合专家(MoE)架构,总参数量235B(激活仅需22B),仅为DeepSeek-R1的1/3,并且性能全面超越R1、OpenAI-o1等全球顶尖模型。
千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API接入方面,4B模型面向手机端,8B可在电脑和汽车端侧部署应用等。
另外,由于模型刚出不久,竞技场排名还没上来,估计要等一段时间。
4月29日凌晨,阿里巴巴正式开源新一代通义千问模型Qwen3。官方介绍,Qwen3采用混合专家(MoE)架构,总参数量235B(激活仅需22B),仅为DeepSeek-R1的1/3,并且性能全面超越R1、OpenAI-o1等全球顶尖模型。
千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API接入方面,4B模型面向手机端,8B可在电脑和汽车端侧部署应用等。
另外,由于模型刚出不久,竞技场排名还没上来,估计要等一段时间。
热门分类
科技TOP
科技最新文章