【[73星]nsa-impl:高效实现原生稀疏注意力机制的PyTorch项目。

爱生活爱珂珂 2025-06-28 14:25:44

【[73星] nsa-impl:高效实现原生稀疏注意力机制的PyTorch项目。亮点:1. 结合压缩、选择和滑动窗口注意力机制,大幅提升效率;2. 支持单次和两次反向传播变体,灵活适应不同需求;3. 高吞吐量的Triton内核,优化性能表现】

'NSA: Native Sparse Attention'

GitHub: github.com/tilde-research/nsa-impl

稀疏注意力 PyTorch 高性能计算 人工智能 ai兴趣创作计划

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注