视觉语言模型似乎也会受经验困扰。比如给他一张3条腿的鸡的照片问它有几条腿基本都会回答错误。。
图自:vlmsarebiased.github.io/
AI创造营
又仁看科技
感谢大家的关注
作者最新文章
热门分类
科技TOP
科技最新文章