首页 本站概况 最新期刊 教育研究 文章精选 人物采访 青春靓影 联系我们
数据中心
信息推送

中国科大语音及语言信息处理国家工程实验室:

让世界倾听中国声音

文/倪国香

 

“我很庆幸自己当初的选择。”这是记者在采访中听到同学们说的最多的一句话,而让他们庆幸的这个选择,就是加入中国科学技术大学语音及语言信息处理国家工程实验室。

语音及语言信息处理国家工程实验室(以下简称国家工程实验室)坐落于中国科学技术大学西校区的科技实验楼内。实验室由中国科学技术大学和安徽科大讯飞信息科技股份有限公司联合共建,是我国语音产业界唯一的国家级研究开发平台。

 

30余年光荣与梦想

2013年11月28日,国家工程实验室五楼会议室,记者见到了现任国家工程实验室副主任戴礼荣教授。朴实的衣着,优雅的谈吐,亲切的微笑,这是戴礼荣给记者留下的第一印象。戴礼荣是国家工程实验室首届技术委员会委员之一,参与了国家工程实验室的组建工作,对实验室的发展过程非常熟悉。

“科大语音实验室已经有30多年的发展历史。”戴礼荣说,“实验室的前身是始建于上世纪80年代初,由王仁华教授等人负责组建的人机语音通信实验室,主要开展语音合成技术的研究。实验室组建后发展良好,获得了863计划、国家自然科学基金计划、中科院重点攻关计划、国家“八五”、“九五”重大项目等一系列前沿课题的资助。”

据戴礼荣介绍,在上世纪90年代,语音合成技术已经基本成熟,应用前景看好,在此契机下,1999年,安徽科大讯飞有限公司成立。公司成立后,为了使产业与研究更加紧密结合,于2003年成立科大讯飞语音联合实验室。

“2008年,科大讯飞有限公司上市。2009年,科大成立安徽省语音及语言信息处理工程实验室。在2010年的时候,合肥市开展十大研究基地建设,又在科大成立了合肥语音技术研究院。而我们也是于2010年开始申请国家工程实验室,并在2011年7月正式获批成立。”戴礼荣回忆道。

在这30余年的发展过程中,承载着“助力中国语音产业发展”梦想的科大语音实验室不断发展,实验室规模和研究领域也逐步扩大。国家工程实验室现有教授12名(包括国内其他高校和国外高校的兼职、客座教授),副教授及讲师13名,以及近200名硕士博士生。目前实验室主要由技术研究开发部、产业工程平台部、综合服务部三大模块组成,涉及语音合成、语音识别、语音评测、语义计算与数据挖掘、人机语音交互机器人研究、时空信号处理、语音情感计算及多模态交互研究等多个研究方向。各个研究组的老师和同学们,一直专注于语音领域的核心技术研究,他们用实际行动和科研成果,继续践行着那个属于他们的、独一无二的梦想。

在这30余年的发展过程中,国家工程实验室也收获了许多奖项和奖励:2006年—2012年,荣获国际英文合成大赛七连冠;2007年,在机器人世界杯获综合成绩世界第一;2008年,获国际说话人识别评测大赛桂冠;2009年,获国际语种识别评测大赛高难度混淆方言测试指标冠军、通用测试指标亚军;2011年,突破美、德、日的垄断,在服务机器人国际标准测试中荣获全球第二。此外,实验室还获得过两次国家科学技术进步二等奖。

 

产学研紧密结合

从国家工程实验室的发展历程中,不难看出其与科大讯飞公司之间的紧密合作关系。据了解,国家工程实验室三大组成部分之一的产业工程平台部就设在科大讯飞公司。设在中国科大的实验室主要侧重核心技术研究,即语音及语音信息处理的基础性原创性研究,为科大讯飞公司提供核心技术支持。科大讯飞公司推出的一系列产品前端的技术探索性工作,主要都是在学校实验室完成的。

同时,科大讯飞公司也会为实验室的研究工作提供许多支持。例如,科大讯飞公司为实验室提供的语音数据,成为实验室相关研究必不可少的资源。此外,公司在产品开发过程中可能会遇到各种问题,而这些困难也就为实验室提供了新的研究点。

为便于学校实验室与科大讯飞公司的交流互动,实验室还会定期安排部分同学到公司实习和访问。关于这一点,语音识别研究组成员张仕良同学就很有感触,他告诉记者,“我们实验室与讯飞公司平时合作交流很多,我最近刚从讯飞公司实习回来。”他觉得实验室与公司的合作有很多优势,比如在语音识别方面的研究,对机器的硬件需求比较高,而公司就可以为学校提供服务器等硬件资源。

戴礼荣告诉我们,其实国家工程实验室不仅仅为科大讯飞公司提供技术支持,在不久的将来,他们会对整个语音产业提供技术支撑。

“中国语音产业的崛起单靠一个或几个公司肯定是不行的,必须要依靠整个产业的发展壮大。就安徽省来说,合肥市高新区正在建设一个语音产业园,以讯飞公司作为龙头企业,牵动一个有一定产值规模的产业。而我们实验室,也将为这个产业提供技术支撑。”戴礼荣自豪地说道。

对于这种产学研结合的方式,戴礼荣也给予了很高的评价,“产学研合作是一种很好的实现创新社会目标的形式。对于工程领域的学科,做研究就应瞄准应用,研究要有目的性。借助产业的平台,从产业发展中提出相关问题,实验室再进行相关研究,再把这种研究成果运用到实际应用中去。”

 

浓厚的学术氛围,团结的合作团队

走进国家工程实验室的各个研究室,几十号人的房间里,几乎只能听到键盘和鼠标操作的声音;每个同学都埋头在自己办公桌前,专心地工作着。那份安静与专注,深深震撼了记者,这里似乎再也无法容下任何一丝纷扰。

来自人机交互机器人研究组的张昊翀,今年博士一年级,他非常自豪的告诉记者:“大家每天都花很多心思在科研上。实验室没有明文规定哪些时间必须来实验室,但是大家基本每天都泡在这里。或自主研究、或交流学习经验。”

刘羽同学是多模态交互与语音情感计算实验室的一员,他也是实验室日常管理的负责人,“实验室同学之间的合作交流方式有很多,在每周一次的组会上,各个同学介绍自己上周工作情况、遇到的问题,大家集思广益,提供一些解决方案。研究方向相同或者同时参与某个研究项目的同学之间,还会有不定期的讨论会。此外,大家也会通过当面讨论、邮件等方式进行交流。”

一个运转良好的实验室,团队意识和团队凝聚力也十分重要。“我们实验室有一个非常好的传统就是‘传帮带’。在我刚进实验室的时候,我的导师就安排了一个师兄带我,有任何问题都可以找他沟通交流。在我写第一篇学术论文的时候,从整个文章的构思,到实验和初稿写作,师兄都给予了很大的帮助。”数据挖掘研究组的祝恒书同学,回想起刚进实验室的情景感触良多。机器人研究组的林志强同学也认为:“我们在各个大赛中都取得了非常好成绩,其中很大一个原因就是我们的团队精神。”

关于导师,博士生二年级的张敬同学这样说道:“我非常敬佩我的导师汪增福教授,他对科研非常严谨。同时汪老师也是一个非常容易沟通的人,他不会把自己的意见强加于你,我们之间的沟通是双向。” 

我们让大家用一个词概括实验室的文化:包容、开放、活泼、勤奋、积极进取、团结、欢乐、自由、和睦、融洽、乐观……从这些答案里,我们能感受到这个大家庭里每个成员的那份骄傲。

 

专注核心技术研究,助力语音产业发展

谈及国家工程实验室的未来发展规划,戴礼荣成竹在胸,“国家工程实验室刚成立不久,现在主要处于建设阶段。下一步发展目标是建成‘语音及语言信息处理创新人才队伍一流,研发环境和研发平台国内领先国际先进,理论研究和应用开发结合,特色鲜明、相关产业发展和新生长点基地引领作用显著’的国家工程实验室。”

“首先是加强人才队伍建设,引进语音技术方面的国际一流人才;其次要做好研究平台建设,能够把每一届同学的研究成果结合起来,进而做出更先进、更有创新性的研究;最后是继续保持与产业紧密结合,做好核心技术研究,引领语音产业发展。”戴礼荣进一步解释道。

在前不久举行的“中国语音产业高峰论坛”上,工信部软件服务业司陈伟司长在致辞中指出,语音产业是全球信息技术产业争夺的新商机和制高点,在通讯信息安全、民族文化传播等国家核心领域具有重大的应用价值和潜在意义。

作为我国智能语音领域唯一的国家级研究平台,中国科学技术大学语音及语言信息处理国家工程实验室,在30余年的发展历程中,一直专注语音领域的核心技术研究,在荣耀与梦想中,取得了一个又一个的技术突破,收获一个又一个的科研成果。

在下一阶段的发展中,语音及语言信息处理国家工程实验室将继续携梦起航,向着“助力中国语音产业发展”的伟大目标而不断努力。我们有理由相信,语音王国中的下一座高峰,中国科大人正在登顶的路上。

 

【责任编辑】李昂