在数字时代,AI技术让我们能够轻松创造出虚拟的数字人物。ElevenLabs,作为一款付费一刀的AI工具,提供了一个简单易用的平台,让每个人都能创造出自己的数字人物。只需要提前录制2-5分钟的语音就可以制作各国语言的产品介绍、自我介绍等等。下面,我们将一步步介绍如何使用ElevenLabs。
原理
ElevenLabs AI生产的原理其实可以用一种简单的方式来理解,就像是高科技的“模仿游戏”。
想象一下,当你听一个人说话时,你的大脑会记住他们的声音特征,比如音调、语速和发音方式。如果你模仿他们说话,你其实是在用你自己的声音去复制他们的这些特征。
ElevenLabs AI做的事情,其实就是一个更高级的模仿过程。首先,它需要一个人的声音样本,就像是给它一个学习和模仿的“范本”。然后,这个AI系统会用复杂的算法分析这个声音样本,理解这个人声音的独特特征,比如他们说话的方式、声音的高低和节奏等。
一旦AI学会了这些特征,它就可以用这些学到的特征来生成新的声音。这就像是AI在用它“学到”的声音特征来“说话”。最终的结果就是,AI可以生成一个听起来非常接近原来那个人的声音的新声音。
所以,简单来说,ElevenLabs AI的原理就是先学习一个人的声音特征,然后用这些特征来创造新的、听起来很像那个人的声音。
所以我们需要先准备一段自己的声音。
前期准备
语音准备
需要提前录制 1min的语音(背景干净无杂音),2-5分钟的高质量语音最好,素材的语速是会大大影响生成音频的语速的,官方说明↓↓
付费准备
需要一张双币信用卡或者 PayPal
来不及申请的可以使用 wildcard 虚拟卡
软件准备
谷歌注册 Eevenlabs
付费
最便宜的$5方案足够了,而且首月还只收你一刀(可随时取消)
使用PayPal的方法
买好会员之后你就可以去克隆声音了
上传自己的声音
点击“Voice”
选择第二个 ,定制自己的声音,不付费无法选择
上传自己的声音,命名名字
把提前录制的1min语音上传上去
原则10M可以上传25个,但是素材要精不要多!高质量比总时长重要得多,2-5分钟的高质量语音最好,素材的语速是会大大影响生成音频的语速的
开始克隆自己的声音
选择Text to Speech
text 输入文本(5000字以内)就可以用自己的声音“说”一段话,甚至可以录制各国语言,我们只要把翻译好的文本添加进去即可。
其他设置默认即可
Stability AI语气的高低,设置滑块太低可能会导致奇怪的表现,过于随机,并造成字符说话太快。另一方面,设置得太高会导致声音单调。
Clarity+ Similarity Enhancement 决定了你想要的语音清晰度和音色相似度,如果设置得太高,人工智能在试图模拟原始录音中出现的声音时,可能会重现伪影或背景噪声。
Style Exaggeration 放大说话风格
下载语音
大概半分钟语音就生成好了
这里我们最好生成1分钟以内的语音,下载后备用
如何取消订阅
取消有点难找,所以特此说明
点击头像→ subscrition →滑到下面的 Plans,点击 Cancel Subscription