斯坦福CS336春季2025课程,全面深入讲解语言模型构建,助力学生掌握从零开发高效Transformer语言模型的核心技术。
• 课程涵盖数据采集与清洗、模型架构搭建、训练优化、评估及部署全流程
• 注重Python编码实战,要求学生具备深度学习与系统优化基础,熟悉PyTorch及GPU多机训练
• 五大作业阶段:基础实现、系统优化、模型扩展、预训练数据处理、对齐与推理强化学习
• 提供多云GPU租用推荐,支持学员远程训练与调试(H100 80GB价格$1.99-$3.29/小时)
• 严格遵守学术诚信,鼓励合理讨论,禁止直接依赖AI完成作业
• 课程讲座安排在每周二四下午,设有固定办公时间,支持线上Slack交流
• 由Together AI赞助GPU资源,保障高效学习体验
深度理解语言模型从底层原理到大规模训练,CS336是AI研究者与工程师的必修课。
了解详情🔗 stanford-cs336.github.io/spring2025/
Youtube:www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_
语言模型 深度学习 人工智能 NLP 开源教育 GPU计算