• RSS订阅 加入收藏  设为首页
要闻热帖

声音更自然!谷歌新语音系统可像人类一样说话

时间:2017-12-30 11:17:03  作者:陈倩云 李宗泽  来源:环球网  查看:35  评论:0
内容摘要:不同于其他以复杂语言学和声学特征为输入的TTS系统,Tacotron2通过学习人类对话和文本记录并进行训练,以生成更贴近人声的语音。研究团队表示,听众评价Tacotron2的语音水平与专业录音相当。

据英国《每日邮报》12月28日报道,谷歌将推出新款文语转换(TTS)系统Tacotron 2,可让AI语音助手的声音更加自然。

不同于其他以复杂语言学和声学特征为输入的TTS系统,Tacotron 2通过学习人类对话和文本记录并进行训练,以生成更贴近人声的语音。研究团队表示,听众评价Tacotron 2的语音水平与专业录音相当。

基于之前的研究成果Tacotron和WaveNet,Tacotron 2使用序列-序列模型,该模型将字母映射到编码音频的特征上。该过程结合了发音、音量、速度和语调。然后,这些特征被转换成24 kHz的波形。

一项系统演示展示了Tacotron 2如何节奏流利地朗读不同的文本(包括绕口令)。但是,一些较难的词语仍然绊住了它。

研究团队称,虽然该系统在听众试验中取得了不错的反响,但还不够完美。“我们的样本听起来不错,但仍有一些棘手的问题有待解决。例如,我们的系统在复杂词语发音上存在困难,在极端情况下甚至会随机产生奇怪的噪音。而且,它还无法生成实时音频。我们还不能控制它所产生的语音,无法引导它具有高兴或悲伤的情绪。”返回中华智库园网首页

(实习编译:陈倩云 审稿:李宗泽)


标签:谷歌新语音系统 
相关评论

免责声明

    本网站转载的所有的文章、图片、音频、视频文件等资料,均出于为公众传播有益资讯信息之目的,其版权归版权所有人所有。所采用的非本站原创文章及图片等内容无法逐一和版权者联系,若所选内容作者及编辑认为其作品不宜上本网供大家浏览,请及时用电子邮件通知我们,以便即时删除,避免给双方造成不必要的损失。

邮箱:zhzky102@163.com

 

版权所有 智库园(北京)国际文化有限公司  技术支持:中国企业集成网  京公网安备:110108006569

京ICP备案号:10020766