AI提取文案省钱技巧AI字幕翻译省钱技巧
用大模型提取视频文案、或是做字幕翻译,如何更省钱?
博主George Mandis出奇招:把超长视频或音频提速2~3倍,然后再丢给大模型转写,准确率不变的基础上,省了不少钱。
要知道,大模型的转写服务是按“音频时长”计费,提速意味着秒数变少、tokens更少、价格也就更低。
有几点注意事项:
- 可以使用`ffmpeg`命令行工具,把音频提速成2x或3x;
- 3倍速转写比2倍速还能再省下约23%的开支;
- 但4x速度下准确率明显下降,不推荐;
以一个40分钟音频为例,使用如OpenAI的`gpt-4o-transcribe`模型时,3倍速转写总成本大概是$0.07,远低于原始1x速预估的$0.24;
这个方法也适用于`whisper`等本地模型,只不过由于在本地处理,算力不足的情况下速度稍慢。
感兴趣的小伙伴可以阅读原文: