【ElevenLabs】 AI改变说话方式 …声音演员”让受众体验情感

Photo of author

By Global Team

语音生成技术已经彻底改变。语音AI企业ElevenLabs最近公布了一款可以表现情感的语音合成模型“Eleven v3 Alpha”。该模型不仅仅是简单的朗读,更提供了可以自由调节语调、情感和音效的功能。

为了正确使用,‘提示(prompt)’的写作很重要。提示是传达给AI的句子。根据传达句子的方法不同,AI的语音结果也会完全不同。

Eleven v3 提示(Prompt)
Eleven v3 提示(Prompt)

Eleven v3 使用了“语音标签”的功能。例如在句子前加入[低语],[微笑],[悲伤的语调]这样的表达,AI就会用实际低语或微笑的语调来阅读。像“[低语]今天不要告诉任何人哦。”这样的使用方法。这些指令放在方括号 [ ] 中。

除此之外,还可以加入[掌声],[开门声]这样的效果音。在句子中间也可以改变情感或效果,使其自然如演技。在一个句子中,也可以从开心转到悲伤,再回到平静的语调。

AI还可以生成多人对话。组成对话体后,为每个讲话者设置不同的声音,并在各自句子的前面加入情感标签,可以产生如同人对话般的效果。

在撰写句子时,尽量使用自然的口吻。句号、逗号、换行也很重要。想强调的词可以用大写字母或情感标签来有效表达。过短的句子结果可能会不稳定,句子的长度最好是超过250字。

“[微笑]今天真是愉快的一天![低语]不过,对你可是个秘密哦。”

例如,如果这样写,AI会笑着突然转为低语的语调进行阅读。如同真实演员般展现情感的流动。

ElevenLabs表示可以利用v3模型制作在有声书、动画角色、客户咨询、教育内容等领域中如人般讲话的AI。特别是在韩语中,情感表达、语调调节、方言口吻的支持得到了增强,具有广泛应用的可能性。

图片描述
图片描述

传统TTS(文本到语音转换)技术只是简单地把文字读出来,而Eleven v3更像是个创作者可以演绎的工具。说话的AI,让听者感受到情感的AI。其核心在于一条写得好的提示线。

Leave a Comment