了解在使用“文字生成头像”功能时,如何编写脚本,让头像发音清晰、语调自然。
使用文字生成头像功能时,在“内容”字段中添加脚本对话框时务必遵循最佳实践。此字段用于输入头像将播报的台词文本。 为确保头像能够准确、自然地传递对话内容,脚本应结构合理、表达清晰,并符合下面概述的最佳实践。这将有助于最大程度地提高该功能的有效性,并呈现最逼真的头像表现。
确保脚本对话中的拼写和语法准确无误,以实现专业且符合预期的头像表现。 优质的文本脚本可使 AI 头像的语音输出更加自然流畅,从而显著降低最终生成视频中出现发音错误或措辞尴尬的风险。
正确示例
- This is a good example.(这是一个“优秀”示例。)
- What is an example like?(类似这样的示例是“什么”?)
- This could be because of a delay in the service.(这可能是“由于”服务延迟导致的。)
错误示例
- This is a gud example.
- Wut is an example like?
- This could be coz of a delay in the service.
在编写对话时,使用正确的标点符号将为头像的语音输出提供指导,同时影响语义表达以及对话的呈现方式。逗号、句点等其他标点符号有助于控制语音的节奏、语调和情绪。恰当使用标点符号可使头像的语音表达更加自然生动、富有表现力且清晰易懂。
正确示例
- Let’s eat, grandma!(咱们吃饭吧,奶奶!)
- Go to the next step.(转到下一步。)
- Let’s all begin now!(让我们现在就开始吧!)
错误示例
- Let’s eat grandma!(咱们去吃饭奶奶!)
- Go to the next step(转到下一步)
- We all will start...now.(让我们现在就…开始吧。)
如果对话文本不能清晰地表达特定情感,可通过在文本中添加角色表演式引语,以增强情感表达效果。这有助于确保最终生成的视频中,头像能精准表达文本的预期情感及含义。
正确示例
- He said with joy: "That is amazing!"(他高兴地说:“太棒了!”)
- She said with a smile: "Welcome to your new topic."(她微笑着说:“欢迎来到您的新主题。”)
- She warned sternly: "Please avoid this approach."(她严厉地警告道:“请避免这种做法。”)
全部以大写字母书写的单词将被视为首字母缩略词或首字母缩写,这意味着每个字母都单独发音。但是,同一单词若为小写,则按常规词汇发音。这一差异在头像对话中起着关键作用,因为它直接影响语音的发音方式以及预期信息的传递准确性。
例如,“POC”会发音为“Pee-Oh-See”,而“poc”会发音为“pock”。
正确示例
- “AI”会发音为“Aye-Eye”
- “CEO”会发音为“See-Ee-Oh”
- “USA”会发音为“You-Ess-Ay”
错误示例
- “ai”可能被误读为“eye”
- “ceo”可能被错误地连读为一个单词。
- “usa”可能发音为“oo-sa”。
在编写缩写词时,尤其是那些以字母“s”结尾的缩写词,请在每个字母之间插入一个短横线,以确保头像能够清晰且逐个字母发音。这样可避免缩写词被误读或作为一个单词发音。
例如,“PDFs”将发“s”音,而不是“es”<span style="font-size: 0.8125rem;">。另一个例子是,“POCi”,它将发音为“posi”,而不是“Pee-Oh-Si”。在字母之间加上短横线,例如“P-O-Ci”,即可实现期望的发音效果。
正确示例
- “A-P-I-S”发音为“Aye-Pee-Eye-Ess”
- “S-D-K-S”发音为“Ess-Dee-Kay-Ess”
- “U-I-S”发音为“You-Eye-Ess”
错误示例
- “APIs”发音为“apees”
- “SDKs”发音为“esdkes”
- “UIs”发音为“yous”或“oois”
为“文字生成头像”功能编写对话时,请以单词(汉字)形式编写数字(而不是阿拉伯数字形式),尤其是涉及日期、时间、金额、度量单位或数量等内容时。这有助于头像的语音输出更加自然,并确保语义传达清晰准确。
正确示例
- nineteen point eight four(十九点八四)
- three hundred dollars(300 美元)
- forty-two degrees Celsius(四十二摄氏度)
错误示例
- 19.84
- $300
- 42°C
需了解 AI 生成的语音具有非确定性特征,这意味着即使使用完全相同的脚本和语音,每次的输出结果仍可能存在细微差异。例如,想象配音演员进行多次录制时,每条音轨都会存在细微差异。