去年年初我和大家分享了微软 Edge 的独门绝技「大声朗读」,那效果放到现在也是很能打的。我给大家简单录了两句,不了解的小伙伴快来听一下。
怎么样?虽说还做不到定制版 AI 语音的以假乱真,但这吐字清晰,字正腔圆,有停顿有语音的晓晓,可比国内大多数 AI 合成音都要强。
坊间难免有这样的评价——合成语音哪家强?微软 AI 找晓晓。
实际上,单就中文而言,「大声朗读」还有其他语调,甚至还有港台腔。
只不过这样的效果是在 Edge 浏览器上实现,虽说可以在线听,但想导出朗读的内容就很麻烦。
所以去年我又研究了一番,扒到了封装好的「大声朗读」,可以直接录制下载转换好的语音。
以及,那篇的重头戏,我们自己去微软云 Azure 上申请账号,不仅说话风格更多,你还能逐字逐句的调整停顿、发音、语调、语速、音高、音量。
一个文本,你可以用多种合成音(多个人)以不同风格讨论的形式念出来,比如这样子:
或者这样:
当时我还做过对比,微软 Azure 上这个 AI 文本转语音的功能,可比某些收费项目都有「人」味。
唯一的门槛,停在了「申请账号」这一步上,我简单给大家说说怎么回事。
微软拒绝白嫖
之前微软 Azure 的这个服务是注册账号后,是能免费使用 30 天的,而且还不需要绑定信用卡,30 天后,只要绑定信用卡就能免费使用一年。
但不知道是不是因为白嫖尝鲜的人太多了,去年微软 Azure 改了规则,直接要求绑卡才能使用。
后来听小伙伴说,有的时候绑卡还会跳到「即付定价」的界面,我猜大概率是这个卡已经绑过了。
我实测了一下,拿曾经绑过的信用卡再绑另一个账号,得到了下面的跳转提示。
所以绑卡成了用微软 Azure 最大的拦路虎,当然,你要是有张未绑定的新信用卡,这条路还是能走通的。
但信用卡这玩意,真不一定谁都有,何况绑定以后它还和谷歌云之类的国外服务一样,哪怕是限期免费,还是会先暂扣你 1 美元的保证金,这让很多小伙伴觉得不安。。。
当时有这么一条留言,说「没有信用卡,还眼馋,怎么整?」。
后来我就留心了一下关于微软 Azure 文本转语音服务二次开发的工具,有这种 Python 打包的小工具。
缺点是只支持中文不说,支持语音量还少,还无法实时试听文字内容,更没办法像开头说的那样逐字逐句的调教语音,让微软语音的魅力大打折扣。
而效果最好的,是这个上星期才刚刚发布的小工具,虽然是用易语言写的,但把微软云官网上所支持的语言、语音、风格都加了进去。
更关键的是,这个微软语音合成助手是支持 SSML 的,啥意思?之前所说的逐字逐句 DIY 语音的功能,本质上就是加了 SSML 代码。
利用 SSML 代码,你可以为语音增添情绪、语调、音量这些东西,不过在官网可以通过动动鼠标的方式实现。
可代码这玩意,哪怕再低也是一座山,肯定会劝退不少小伙伴。
不过我看到 SSML 后,突发奇想,折腾出了一套无需代码,无需绑卡白嫖微软语音转文字的新方案。
白嫖新思路
目光还得暂且回到上面两个小工具上,虽然不知道两位作者是怎么开发的,但这些功能和微软云文本转语音页面的 Demo 是一致的。
支持更换语言,支持更换语音,支持调整风格,以及支持 SSML 代码。
所以这个 Demo 就是微软云官网的宣传展示窗口,还可以实时播放,实时调整,除了不能下载,和上面两个小工具并无差别,即都不能像官网那样通过点击来 DIY 语音。
但微软云的这个 DIY 功能,也是有 Demo 的呀。
除了字典功能无法尝试,别的停顿、发音、改语速啥的都能正常使用,细心的小伙伴应该能看到左上角有「下载」两个字,但点进去又回到了注册绑卡那一步。
别急,为了更好的向开发者展示 SSML 的魅力,在这个 Demo 里可以把当前配置都转换成 SSML 语言格式。
我们只要「Ctrl+C」复制到之前那个微软语音合成助手,就白嫖了绝大部分的功能,全程不用你手搓代码,甚至不用登录。
当然,要是大家不想用易语言写的工具,可以下载「Azure Speech Download」这个油猴脚本。
它能帮你在最开始的那个 Demo 页,多个下载语音的按钮,点击就保存到本地了。
我给大家听听我通过这种绕道的方式合成出来的语音,效果喜人。
结语
其实今天这个绕道而行的白嫖方案并不难,就是两个 Demo 和一个下载脚本的组合技而已。
撑死了,第二个 Demo 藏的比较深不好发现,而绑了卡的小伙伴又用不到,不过正好适合咱们这种又想尝鲜,又不想绑卡的受众。
而且你别小瞧了这个方案,要知道,最开始给大家介绍的那个能下载「大声朗读」的小软件,在某宝卖 16 元。
而一个能享受这些 DIY 功能的账号,卖 166 元。
四舍五入,看了今天这篇文章的你立省一笔开支,付出的不过是多动了几下鼠标,多敲了几下键盘。
微软云合成语音的 Demo(最好 Chrome、Edge 打开,然后往下拉):

https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech
能 DIY 的 Demo(过段时间会要求刷新,不过不影响玩):
https://speech.microsoft.com/audiocontentcreation
至于剩下的,我整理好放后台了,上次还没尝鲜的小伙伴,赶紧去试试吧。
长按二维码关注回复20220525获取
电报群:wldxh  QQ群:729224889  网站:wldxh.com
继续阅读
阅读原文