编写有效的文本提示以生成语音效果

上次更新日期: 2025年6月27日

了解如何编写有效的文本提示,以通过“文字生成语音效果 (beta)”和“语音生成语音效果 (beta)”功能生成语音效果。

借助文字生成语音效果 (beta)语音生成语音效果 (beta) 功能,您可以使用多种输入方法(书面提示和录制的音频提示)生成带语音效果的音频片段。通过将文本提示与语音表演相结合,您可以生成既符合文本描述,又能精准匹配语音表演节奏和情感强度的语音效果。无论您是创作氛围音景、震撼音效,还是制作环境背景音来增强视觉叙事,编写优质的文本提示都是充分释放这些功能潜力的关键。

为要生成的语音效果提供清晰、简洁且直接的文本描述。此方法强调听觉特征,聚焦于声音本身,也就是它实际发出的声音。 

正确示例

  • 狮吼声
  • 骤雨击打金属屋顶
  • 篝火噼啪声

错误示例

  • 狮子吼叫的声音
  • 雨滴落在波纹铁皮屋顶上的啪嗒声
  • 木柴在火坑中燃烧的声音,伴随偶尔爆裂声和嘶嘶声

在文本提示中,应包含用于明确描述音效特征的形容词,以及用于传达声音动作或行为的动词。 这可以指导声音的细节特性。

正确示例

  • 剧烈爆炸声微弱爆炸声
  • 巨浪猛烈拍打海岸海浪轻抚沙滩
  • 瓷杯拖拽过木桌声

您可以使用逗号分隔的关键字或描述来快速指定所需声音的多个特征。此方法还可帮助您遵循编写提示中的其他最佳实践,同时确保制作的简洁文本描述能有效地传达您要生成的复杂语音效果。

正确示例

  • 机器人,科幻,未来主义
  • 电影级特效,剧烈冲击
  • 管弦乐队节奏,低频震撼,戏剧性的预告片

“生成语音效果”功能一次生成一种语音效果,从而确保实现最佳音质和精准控制。要生成包含多种音效的复合音景,请分别生成单个音效,然后使用多个音轨分层音效。您还可以利用生成后编辑选项,来微调时序和音量,并下载每个声音以供编辑或在项目中使用。 

正确示例

  • 雪地脚步声
  • 沙漠风声
  • 鸟鸣声

错误示例

  • 雪地脚步声,背景混杂着沙漠风声与鸟鸣声

生成环境音景时,使用宽泛或笼统的描述通常比使用高度具体的描述更为有效。过于详细的提示可能会导致输出结果显得机械呆板,或流于字面化解读。

正确示例

  • 森林环境声
  • 餐厅人声嘈杂
  • 房间声
  • 城市车流声