DC娱乐网

谷歌 Gemini 3.1 Flash TTS 提示词指南提示词结构:- 音频配

谷歌 Gemini 3.1 Flash TTS 提示词指南

提示词结构:

- 音频配置文件:为声音建立一个人物形象,定义角色身份、原型以及任何其他特征,如年龄、背景等。

- 场景:设定舞台。 描述物理环境和“氛围”。

- 导演笔记:表演指导,分解哪些指示对虚拟人物很重要。 示例包括风格、呼吸、节奏、发音和口音。

- 示例上下文:为模型提供一个上下文起点,这样虚拟演员就能自然地进入您设定的场景。

- 脚本:模型将朗读的文本。 为了获得最佳性能,请记住脚本主题和写作风格应与您给出的指示相符。

- 音频标签:可以放入脚本中的修饰符,用于更改文本该部分的表达方式,例如 [whispers] 或 [shouting]。

链接:dev.to/googleai/how-to-prompt-gemini-31s-new-text-to-speech-model-24bb

注:你可以把链接中的文章交给 Agent,让它给你生成一个 skill,用于 Gemini TTS 任务