您当前位置: bbin大全  >  学术讲座

讲准字【2022】第206号:语音合成中的自然韵律多样性建模

发布时间:2022-09-19|浏览次数:

讲座报告主题:语音合成中的自然韵律多样性建模
专家姓名:俞凯
日期:2022-09-22 时间:19:00
地点:线下计算机楼208,线上Tencent会议: 638 617 743
主办单位:计算机科学与通信工程学院


主讲概况:俞凯,上海交通大学计算机系教授,上海交通大学苏州人工智能研究院实行院长,思必驰企业首席科学家。清华大学本科、硕士,剑桥大学博士。长期从事对话式人工智能、语音及语言处理的研究和产业化工作。入选国家级重大人才工程,NSFC优青,上海市“东方学者”特聘教授,IEEE Speech and Language Processing Technical Committee委员(2017-2019)。中国人工智能产业发展联盟学术和常识产权组组长,CCF语音对话及听觉专委会副主任,全国信标委用户界面分委会委员。发表国际期刊和会议论文 200余篇,获得Computer Speech and Language, Speech Communication等多个国际期刊及国际会议的优秀论文奖以及多个国际评测冠军,担任InterSpeech、SigDial、ICMI等国际会议的程序委员会主席,ACL、EMNLP等国际会议的领域主席。他创立思必驰企业,进行智能语音及对话技术的产业化。思必驰企业已经成为中国领先的对话式人工智能技术提供商,作为中国人工智能领域创业企业的代表,思必驰入选2016高盛全球人工智能报告“AI Key Players”及2017年Gartner“Cool Vendors for AI(East Asia)”。研究专长:对话式人工智能、语音及语言处理。


主讲内容概况:数据驱动的语音合成质量随着端到端模型的出现已经达到很高的水平。但作为难以精准标注且变化极为丰富的副语言信息,高逼真度的韵律建模仍然是语音合成的核心挑战之一。尤其是韵律的多样性描述,在传统语音合成建模框架下极为不足。本报告将探讨韵律多样性建模这一极富挑战性的话题,从韵律多样性的模型表征和控制方案两个角度,先容端到端语音合成框架下的高自然度韵律建模和控制方法。


欢迎师生参加!

XML 地图 | Sitemap 地图