第十七届全国人机语音通讯学术会议
主页
参赛流程
数据集
组织单位:内蒙古大学、中国科学技术大学

当前,汉语、英语等主流语种的智能信息处理技术已在语言理解、语言生成等领域表现出优异的应用效果。同时,深度学习的迅速发展受到了学术界和工业界的广泛关注, 深度学习技术对自然语言处理领域的诸多任务产生了越来越重要的影响。

蒙古语作为中国的少数民族语言之一,有着悠久的历史和丰厚的底蕴。它的使用人群分布在当今世界各地,包括内蒙古自治区、甘肃、西藏自治区等中国八省区,蒙古国及俄罗斯等世界不同地区。随着研究学者对文字智能信息处理研究的不断深入,蒙古语智能信息处理相关问题也受到越来越多的关注。

经过研究人员的不懈努力,蒙古语语音合成技术取得了长足发展,但是相对于主流语种相关研究,蒙古语语音合成技术仍不够成熟。尤其是在低资源场景下的蒙古语语音合成技术仍有很大的发展空间。本特殊议题拟开展“面向蒙古语的低资源语音合成竞赛”,从研究和技术应用角度进一步推动蒙古语智能信息处理的发展,同时也为少数民族地区的人工智能技术发展贡献力量。

"NCMMSC2022-面向蒙古语的低资源语音合成竞赛(Mongolian Text-to-Speech Challenge under Low-Resource Scenario)"(简称NCMMSC2022-MTTSC)是第十七届全国人机语音通讯学术会议(NCMMSC2022)的特殊议题之一(会议官网:https://ncmmsc2022.ustc.edu.cn/main.htm),由内蒙古大学中国科学技术大学共同发起的语音合成竞赛。本次比赛的目的是促进国内少数民族语言智能信息处理的发展。NCMMSC2022-MTTSC对所有个人和单位免费开放。

今年的NCMMSC2022-MTTSC重点关注低资源场景下的蒙古语语音合成问题。竞赛拟开放约2小时蒙古语语音合成训练数据,竞赛关注如何在这样的低资源场景下实现出色的蒙古语语音合成效果。

该任务为开放训练集任务,即参赛者可以使用其他任意语种的语音数据集进行数据扩充来进行模型训练,我们鼓励参赛者采用迁移学习(Transfer Learning)、知识蒸馏(Knowledge Distilliation)或元学习(Meta Learning)等方法对现有大规模数据进行充分利用来提升低资源场景下的数据利用率。

系统评测拟针对合成语音自然度可懂度两个方面。评测指标包括自然度主观平均意见分(Naturalness Mean Opinion Score,N-MOS),可懂度主观平均意见分(Intelligibility Mean Opinion Score, I-MOS)和语音识别词错误率(Word Error Rate,WER)三项。

2022.9.18 开放注册(点击“参赛流程”页面注册并获取数据)
2022.10.8 发布测试集
2022.10.18 提交结果
2022.10.24 发布评测结果
2022.10.31 提交论文
刘瑞 内蒙古大学
计算机学院研究员

2020年于内蒙古大学计算机学院获得博士学位(导师:高光来教授)。2019年到2020年受国家留学基金委资助于新加坡国立大学攻读联合培养博士(导师:Prof. Haizhou Li)。2020年到2022年在新加坡国立大学任博士后研究员(合作导师:Prof. Haizhou Li)。主要研究方向包括深度学习、自然语言处理、语音信号处理、语音合成等。在相关领域顶级期刊和会议发表论文三十余篇,其中包括IEEE/ACM Transactions on Audio, Speech, and Language Processing(IEEE/ACM-TASLP)、Neural Networks、 IEEE Signal Processing Letters、ICASSP 、INTERSPEECH和COLING等。担任上述多个领域重要期刊和会议审稿人。荣获IALP2021会议最佳论文奖(Best Paper Award)。担任多个学术会议组织主席,如语音及信号处理学术会议 O-COCOSDA 2021, IWSDS 2021, SIGDIAL 2021等。任CCF语音对话与听觉专委会执行委员、人工智能学会青年工作委员会委员。

凌震华 中国科学技术大学
电子工程与信息科学系教授

主要研究领域包括语音信号处理和自然语言处理。主持与参与多项国家自然科学基金、国家重点研发计划、安徽省语音专项等科研项目,已发表论文200余篇,论文累计被引6000余次,获国家科技进步奖二等奖和IEEE信号处理学会最佳青年作者论文奖。在Blizzard Challenge国际语音合成技术评测、Voice Conversion Challenge国际语音转换技术评测等活动中多次获得测试指标第一名。现为IEEE高级会员、CCF语音听觉与对话专委会委员、全国人机语音通讯学术会议常设机构委员会委员。

张晖 内蒙古大学
计算机学院副教授

从事语音信号处理、蒙古语智能信息处理等相关研究工作,参与研发了蒙古语语音识别、文字识别、语音合成、智能主播等系统,曾获内蒙古自治区科技进步二等奖、CCF科学技术奖“科技进步杰出奖”等奖项。

飞龙 内蒙古大学
计算机学院教授

蒙古文智能信息处理技术国家地方联合工程研究中心副主任、内蒙古自治区蒙古文信息处理技术重点实验室主任。在国内外核心期刊和学术会议发表学术论文80多篇,授权发明专利6项,获得软件著作权20多项。

高光来 内蒙古大学
计算机学院教授

现任内蒙古大学党委委员、副校长,蒙古文智能信息处理技术国家地方联合工程研究中心主任,第八届教育部科技委委员,中国人工智能学会多语种智能信息处理专委会副主任委员,中国语文现代化学会民族语文现代化专委会副理事长。

主办方咨询邮箱: liurui_imu@163.com hyfwalker@163.com
Copyright © 第十七届全国人机语音通讯学术会议