【[49星]ALE-Bench:为AI系统在算法编程竞赛中的表现提供基准测试。亮

爱生活爱珂珂 2025-06-18 21:25:06

【[49星]ALE-Bench:为AI系统在算法编程竞赛中的表现提供基准测试。亮点:1. 基于AtCoder启发式竞赛的真实任务;2. 提供从公共测试到私有测试的完整评估流程;3. 支持多种编程语言和并行评估,提升效率】

'ALE-Bench: A benchmark for evaluating AI systems on score-based algorithmic programming contests.'

GitHub: github.com/SakanaAI/ALE-Bench

算法竞赛 AI基准测试 编程优化 人工智能 ai兴趣创作计划

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注