
2025了,如何回答这个问题
为什么现在的大模型都是decoder-only的架构?
去年,这个常见面试问题的回答都会参考大佬 在某乎的帖子。
今年,随着deepseek r1推理模型一战封神,强势颠覆openai在该领域的霸主地位,更多开源大模型也不甘示弱,更新速度好像坐了火箭,于是,我重新整理了一下这个面试题的回答。
欢迎讨论[拔草R]
阅读:0
点赞:0