DC娱乐网

2025了,如何回答这个问题

为什么现在的大模型都是decoder-only的架构? 去年,这个常见面试问题的回答都会参考大佬 在某乎的帖子。 今年,随着deepseek r1推理模型一战封神,强势颠覆openai在该领域的霸主地位,更多开源大模型也不甘示弱,更新速度好像坐了火箭,于是,我重新整理了一下这个面试题的回答。 欢迎讨论[拔草R]