【ElevenLabs】 AI改变说话方式 ...声音演员"让受众体验情感

语音生成技术已经彻底改变。语音AI企业ElevenLabs最近公布了一款可以表现情感的语音合成模型“Eleven v3 Alpha”。该模型不仅仅是简单的朗读，更提供了可以自由调节语调、情感和音效的功能。

为了正确使用，‘提示(prompt)’的写作很重要。提示是传达给AI的句子。根据传达句子的方法不同，AI的语音结果也会完全不同。

Eleven v3 使用了“语音标签”的功能。例如在句子前加入[低语]，[微笑]，[悲伤的语调]这样的表达，AI就会用实际低语或微笑的语调来阅读。像“[低语]今天不要告诉任何人哦。”这样的使用方法。这些指令放在方括号 [ ] 中。

除此之外，还可以加入[掌声]，[开门声]这样的效果音。在句子中间也可以改变情感或效果，使其自然如演技。在一个句子中，也可以从开心转到悲伤，再回到平静的语调。

AI还可以生成多人对话。组成对话体后，为每个讲话者设置不同的声音，并在各自句子的前面加入情感标签，可以产生如同人对话般的效果。

在撰写句子时，尽量使用自然的口吻。句号、逗号、换行也很重要。想强调的词可以用大写字母或情感标签来有效表达。过短的句子结果可能会不稳定，句子的长度最好是超过250字。

“[微笑]今天真是愉快的一天！[低语]不过，对你可是个秘密哦。”

例如，如果这样写，AI会笑着突然转为低语的语调进行阅读。如同真实演员般展现情感的流动。

ElevenLabs表示可以利用v3模型制作在有声书、动画角色、客户咨询、教育内容等领域中如人般讲话的AI。特别是在韩语中，情感表达、语调调节、方言口吻的支持得到了增强，具有广泛应用的可能性。

传统TTS（文本到语音转换）技术只是简单地把文字读出来，而Eleven v3更像是个创作者可以演绎的工具。说话的AI，让听者感受到情感的AI。其核心在于一条写得好的提示线。

谷歌与智利合作在南美-亚洲间建设跨太平洋海底电缆