底气从哪来?
一边是娱乐公司开始正式把AI推向台前,哇唧唧哇发布九周年家族曲《āi ái ǎi ài》AIMV,乐华娱乐发布了首支AI驱动女团HeyDream,华纳音乐推出AI偶像吴爱花,AI不再只是幕后工具,而是深入参与形象设定、内容生成和运营表达。另一边,以大头针为代表的AI歌手在短视频备受欢迎,AI歌曲也开始霸榜国内音乐平台,有人用AI换脸模仿K-pop歌手演唱逼真到让人难辨真假,这些都放大了技术对内容真实性边界的冲击。
从AI歌曲频繁进入流量中心,到AI歌手、AI演员陆续走向台前,一个更清晰的现实正在浮现:AI正在重塑大众对于真实表演、真人创作乃至艺人存在感的基本认知。过去音乐产业赖以成立的那套价值判断——谁在唱、谁在创作、谁在被看见——都开始被重新定义。
AI音乐简史
事实上,如果从最早的计算机作曲实验算起,AI音乐这条线索几乎已经延伸了近七十年。前半程缓慢、笨拙、时断时续,后半程在算力、数据与模型的共振中骤然加速,最终在极短时间内完成了从边缘实验到产业现实的跨越。
上世纪50年代,计算机还远未进入大众生活,音乐与算法之间的联结却已经悄然开始。1956年,洛杉矶KCOP电视台的一档名为《Adventure Tomorrow》(明日冒险)的科学纪录片节目中,一位歌手对着镜头唱起了一首情歌,歌颂对象不是某位姑娘,而是一台名为Datatron 205的计算机。

同年,化学博士Lejaren Hiller突然意识到,作曲和化学研究,本质上都是在严格的规则体系下进行创造性的选择。于是,他联合数学家Leonard Isaacson将作曲规则编写成程序,让ILLIAC I计算机按照指令,创作出一首弦乐四重奏《Illiac Suite》。
如今从历史的角度听《Illiac Suite》,会发现这个组曲集合了许多具有共同调性、但彼此封闭的器乐作品,恰恰暴露了早期计算机作曲的本质——只能忠实地执行预设的指令,将不同规则下的产物机械地并置。

三种声音,完整预演了今天围绕生成式AI展开的公共辩论。时代换了,模型换了,措辞换了,但问题本身并没有变。
但历史的吊诡之处,就在这里。

2016年,索尼计算机科学实验室通过学习13000份乐谱,试图模仿披头士的创作方式,创作了歌曲《Daddy’s Car》;2017年,美国网红歌手Taryn Southern在YouTube上传了她和AI共创的单曲《Break Free》,谷歌Magenta项目也证实启动。虽然这一阶段的AI音乐仍然带着明显的实验属性,但技术路径已经清晰,共同拉开了一个人机共创音乐新时代的序幕。
在过去近七十年的时间里,AI音乐的进步大多以十年、几十年为单位,缓慢推进。真正意义上的变化,发生在最近这半年。
这也是为什么今天AI音乐带给行业的震感,和过去几十年的任何一次技术进展都不完全相同。很多时候,人类习惯先建立判断,再面对变化,但在AI时代,变化的速度似乎让顺序被颠倒了,变化先发生,判断只能不断被迫修正。
过去很长时间里,音乐行业建立在技术稀缺、资源主导的结构之上,一个完整作品的诞生,需要多个专业角色的协作。

当AI能一键完成编曲、录音棚模拟、修音、混音乃至母带处理的全流程,这些曾需要从业者熬上数年才能磨透的稀缺技能,正在飞速褪去它的稀缺光环,从入行必备的核心竞争力变成了行业通用的基础设施。
同步在快速贬值的,还有另一类曾在行业里被奉为硬通货的资金与人脉。
AI可以生成无数正确答案,但真正决定选择哪一个的,是长期积累的音乐审美、清晰的创作语境、稳定的现场能力,以及围绕音乐建立起来的听众关系。这些,都会获得越来越高的溢价。
不可避免的是,从创作到分发、消费,从角色定义到IP打造、商业逻辑,每一个环节的边界都在被彻底重塑。一味拍板淘汰论,多少有点显得像冷眼旁观的陈述了。

与此同时,很多角色概念都会被重新定义。首先变化最大的是词曲作者,AI作为辅助,谁更知道自己要什么,谁就更可能从工具里得到更好的结果。创作会成为决定内容差异、用户心智与商业转化的源头变量,利润天花板、护城河也由此建立。
无论是华纳音乐推出的AI虚拟偶像“吴爱花”,还是在下沉市场爆火的AI歌手“大头针”,都说明当音色、人设与内容节奏可以被稳定生产,至少从听觉层面,听众对歌手的认知,正从“一个人”滑向“一个可持续被消费的声音人格”。
从作品层面看,音质、抓耳、传唱度会成为最基本的起跑线,更多决定一首歌上限的,在于创作者能否基于自身的审美判断与经验积累,通过AI把明确的艺术想法高效、精准地转化为成熟作品。

创作、发现、消费、感动,这是音乐运作的四条底层线索,无论技术如何更迭,它们都是常数。其他一切,渠道、格式、工具、分发机制、平台规则,只是在这些不变之上不断重组。
过去很长一段时间里,无论影视还是音乐行业,都大致遵循着一种相似的分配逻辑:资本掌握流量入口,入口影响收益分配,而分配进一步决定了谁更容易被看见。

以往内容工业的壁垒是资金、团队和周期,未来这个市场的壁垒会更像一种审美上的统治力,门槛没有消失,它只是从物理层迁移到了心智层。这是钱会流向哪里的第一个变量。
这种差异,本质上也意味着音乐产业的盈利正在发生变化,Spotify《Loud & Clear》显示,2017—2025年,仅在Spotify上产生超过1000万美元录音和词曲版税的艺术家数量增加了700%;1000美元至100万美元各收入档的艺人数量增幅在220%到250%之间,流媒体平台上音乐从业者的“中产阶层”在持续、稳定地扩容。

因此,未来行业真正决定钱流向何处的,会流向场景渗透、资产掌控、心智占领、稀缺体验四种能力,未来真正值得下注的,也是围绕这四种核心能力展开的赛道。

美国版权局近两年的系列报告,已明确将“可版权性”、“训练使用”与“数字复制体”拆分为独立议题;田纳西州签署的《ELVIS Act》则进一步把“声音”纳入法律保护范围。AI音乐相关的版权已经开始长出制度轮廓,未来内容产业的一部分利润,会从台前明星项目,转移到后台的权利基础设施。
今年3月,AI 音频创业公司 ElevenLabs通过用户分享他们声音的 AI 生成副本,设定其使用方式,并在付费订阅者使用时获得收益,已向创作者支付超过1100万美元,现在正将该模式扩展到音乐领域。
商业价值开发上,AI音乐IP和真人音乐IP在本质上并没有脱离同一套逻辑,但在内容生产、形象延展、跨平台运营和商业授权上,反而可能具备更高的可控性和可复制性。
未来的线下演出,将不再只是作品的现场演绎,而是IP叙事的线下延伸、粉丝与IP的深度交互场域,尽管扩张速度慢、运营效率远低于数字内容,却能凭借不可复制的在场感,获得更高的长期商业溢价与抗周期价值。毕竟,越是合成AI、虚拟泛滥,越是真实在场变贵。
说到底,AI影响的更多是产量,在音乐几百年的发展历史里,记谱、十二平均律对音乐产业的影响,远比今天的AI更深刻。
它正在倒逼整个行业重新回答,音乐里究竟什么才是最重要的。