维基百科与多家AI巨头达成新合作以API替代网络爬虫规范数据使用

正值成立 25 周年之际，维基百科母公司维基媒体基金会（Wikimedia）于当地时间 1 月 15 日通过博客宣布，已与亚马逊、Meta、微软、Mistral AI 及 Perplexity 等多家科技企业达成新合作。

此次合作将允许这些公司通过维基媒体企业版（Wikimedia Enterprise）合规获取维基百科的应用程序接口（API）数据，用于大型语言模型（LLMs）的开发与训练，替代此前普遍存在的网络爬虫抓取方式。

维基媒体方面透露，上述合作均在过去一年内正式敲定，但此前未对外公开。这些企业将通过付费方式使用维基百科的海量数据，将这一 "人类协作治理的知识体系" 大规模整合到自身平台中。

值得一提的是，谷歌早在 2022 年就成为维基媒体企业版的首批合作伙伴，此次新增合作后，该项目的合作阵营已扩展至 Ecosia、Pleias、ProRata 等多家机构。

维基媒体基金会发言人在接受 CNBC 采访时表示："维基百科的知识资源为生成式 AI 聊天机器人、搜索引擎、语音助手等产品提供了核心支撑。对于 AI 及科技企业而言，其长远发展离不开对维基百科这类知识项目的培育，因为这些平台构建了它们赖以生存的人类知识基础。"

随着 AI 行业的爆发式增长，数据使用权问题日益受到关注，维基百科、Reddit等平台上的人类生成内容被 AI 企业使用所引发的法律争议与伦理问题也持续升温。

去年，埃隆・马斯克就推出了 AI 驱动的维基百科竞品 "Grokipedia"，该平台以 xAI 旗下大语言模型 Grok 命名，所有条目均由 AI 生成，马斯克宣称其更具客观性、"反对 woke 思潮"。

此次维基媒体与科技巨头的合作，不仅为 AI 企业获取合规知识数据提供了新路径，也为内容平台与 AI 行业的良性互动探索了模式，有望在保护知识创作者权益与推动技术创新之间找到平衡点。

DC娱乐网