谷歌推出用AI合成语音 真人难以辨别瑕疵

智能机器人 2025-03-26 17:45www.robotxin.com人工智能机器人网

近日,谷歌发布了一款名为“Tacotron 2”的全新文字转语音系统,该系统一经推出便引起了广泛关注。其令人惊叹的语音合成技术,使得发音准确性达到了前所未有的高度,实际文本阅读效果几乎与真人发声无异。

实际上,“Tacotron 2”是谷歌的第二代类似技术,其背后由两个深度神经网络支撑。目前,该系统仅针对英语女声进行了训练,若要生成男性声音或其他语言,谷歌将对其进行进一步的训练和调整。

谷歌的研究人员表示,“Tacotron 2”能够流畅处理复杂的单词、人名和标点,甚至可以完美讲述一段绕口令。其独特之处在于,当遇到大写单词时,系统会自主加重语气,同时对于人为的打字错误也能妥善处理。

作为当今众多移动产品和应用的必备技术模块,“语音合成技术”或称文本转语音(TTS)在各个领域都有着广泛的应用。比如语音交互应用、导航、语音控制以及为视力障碍者设计的产品等都需要借助语音合成技术来实现其功能。

长期以来,传统的语音合成技术多采用拼接方式,需要大量语料记录才能进行语音合成。这种方法不仅数据处理量大,而且灵活性较低,一旦说话人发生变化,就需要重新记录和处理。业界一直在寻求一种能够实时生成高质量语音的技术解决方案。“Tacotron 2”的推出,无疑是这一领域的一大突破。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by