DC娱乐网

辅导男朋友转算法岗第37天|长文本-插值

前面的联想面经中提到过扩展大模型上下文窗口有多种方法。 🐬其中,插值法通过缩放位置索引,可以将未见过的长位置映射到预训练阶段见过的短位置,从而扩展上下文长度。 🐬这种方法的好处是,能够在不牺牲太多性能的情况下,显著扩展上下文窗口。 一起来看看这种方法有哪些具体实现方法吧!

评论列表

微蓝
微蓝 2
2024-10-24 15:48
好家伙,你可以出书了
小水1111
小水1111 2
2024-10-24 16:21
这个ceil 是向上取整,应该是向下取整吧