谷歌 Gemini 3.1 Flash TTS 提示词指南
提示词结构:
- 音频配置文件:为声音建立一个人物形象,定义角色身份、原型以及任何其他特征,如年龄、背景等。
- 场景:设定舞台。 描述物理环境和“氛围”。
- 导演笔记:表演指导,分解哪些指示对虚拟人物很重要。 示例包括风格、呼吸、节奏、发音和口音。
- 示例上下文:为模型提供一个上下文起点,这样虚拟演员就能自然地进入您设定的场景。
- 脚本:模型将朗读的文本。 为了获得最佳性能,请记住脚本主题和写作风格应与您给出的指示相符。
- 音频标签:可以放入脚本中的修饰符,用于更改文本该部分的表达方式,例如 [whispers] 或 [shouting]。
链接:dev.to/googleai/how-to-prompt-gemini-31s-new-text-to-speech-model-24bb
注:你可以把链接中的文章交给 Agent,让它给你生成一个 skill,用于 Gemini TTS 任务
