DC娱乐网

维基百科与多家AI巨头达成新合作 以API替代网络爬虫规范数据使用

正值成立 25 周年之际,维基百科母公司维基媒体基金会(Wikimedia)于当地时间 1 月 15 日通过博客宣布,已

正值成立 25 周年之际,维基百科母公司维基媒体基金会(Wikimedia)于当地时间 1 月 15 日通过博客宣布,已与亚马逊、Meta、微软、Mistral AI 及 Perplexity 等多家科技企业达成新合作。

此次合作将允许这些公司通过维基媒体企业版(Wikimedia Enterprise)合规获取维基百科的应用程序接口(API)数据,用于大型语言模型(LLMs)的开发与训练,替代此前普遍存在的网络爬虫抓取方式。

维基媒体方面透露,上述合作均在过去一年内正式敲定,但此前未对外公开。这些企业将通过付费方式使用维基百科的海量数据,将这一 "人类协作治理的知识体系" 大规模整合到自身平台中。

值得一提的是,谷歌早在 2022 年就成为维基媒体企业版的首批合作伙伴,此次新增合作后,该项目的合作阵营已扩展至 Ecosia、Pleias、ProRata 等多家机构。

维基媒体基金会发言人在接受 CNBC 采访时表示:"维基百科的知识资源为生成式 AI 聊天机器人、搜索引擎、语音助手等产品提供了核心支撑。对于 AI 及科技企业而言,其长远发展离不开对维基百科这类知识项目的培育,因为这些平台构建了它们赖以生存的人类知识基础。"

随着 AI 行业的爆发式增长,数据使用权问题日益受到关注,维基百科、Reddit等平台上的人类生成内容被 AI 企业使用所引发的法律争议与伦理问题也持续升温。

去年,埃隆・马斯克就推出了 AI 驱动的维基百科竞品 "Grokipedia",该平台以 xAI 旗下大语言模型 Grok 命名,所有条目均由 AI 生成,马斯克宣称其更具客观性、"反对 woke 思潮"。

此次维基媒体与科技巨头的合作,不仅为 AI 企业获取合规知识数据提供了新路径,也为内容平台与 AI 行业的良性互动探索了模式,有望在保护知识创作者权益与推动技术创新之间找到平衡点。