讲座题目:STD:使用自我注意辨别器来改善语音合成
主 讲 人:金澎
讲座时间:2024年11月26日下午4:30-6:00
讲座地点:特教C402
参加人员:电子信息与人工智能学院师生
讲座主要内容:生成对抗网络(GANs)已经被有效地应用于声码器任务,使其能够以超过实时的速度从声学表示中重建音频波形。然而,使用现有的基于gan的声编码器合成高保真音频仍然是一项具有挑战性的任务。使用卷积神经网络(CNNs)的鉴别器在捕获长周期序列中的复杂模式方面表现出训练效率低下和不足。为了克服这些问题,本研究引入了STD,一种新的鉴别器,利用自我注意机制,自动突出周期结构中的关键信息。与cnn不同,这种机制同时处理序列数据中的所有特征,有效地捕获了长期依赖关系。我们对LibriTTS和VCTK的实验分析表明,该方法显著提高了训练效率和语音生成的质量。此外,在客观评价指标方面的显著改进,强调了我们的方法的有效性和潜力。我们在: https://上发布了我们的代码和模型。
金澎专家简介
金澎,博士、教授、硕士生导师。电子信息与人工智能学院院长,互联网自然语言智能处理四川省高校重点实验室主任。2009年7月毕业于北京大学信息科学技术学院计算语言学研究所,获理学博士学位。主要研究领域为自然语言处理。在人工智能和自然语言处理国际顶级会议和期刊如AAAI, IJCAI等发表论文多篇;授权国家发明专利一项;主持完成国家自然科学基金两项;翻译学术专著一部。四川省学术技术带头人后备人选,2018年获四川省教学成果二等奖一项。
主办单位:
互联网自然语言智能处理四川省高学校重点实验室
乐山人工智能现代产业学院
电子信息与人工智能学院
2024年11月25日