当前位置 > 内容
   中央美术学院
计算机智能评测技术的发展
1、普通话水平测试的现状

中国是世界第一人口大国,少数民族众多,在国内存在大量的方言地区,很多少数民族有自己的民族语言。这在客观上成为了不同地区之间交流的障碍,一定程度上影响了经济的发展。建国以后,国家开始大力推广普通话,并于2000年10月31日第九届全国人民代表大会常务委员会第十八次会议通过了《中华人民共和国国家通用语言文字法》,确立了普通话作为国家通用语言的地位,要求以普通话作为工作语言的播音员、节目主持人和影视话剧演员、教师、国家机关工作人员应参加普通话水平测试,其普通话水平应当分别达到国家规定的等级标准。

普通话水平测试工作开展十多年来,取得了巨大的成就。全国已参加普通话水平测试的考生达到了3000万人左右,目前全国每年的测试规模接近300万,普通话水平测试工作已经逐步走上制度化、规范化、科学化的轨道。但现在的普通话水平测试工作基本上还停留在纯手工的操作状态,整个测试工作的组织、信息采集、评测等基本都是通过人工来进行,这使得测试工作的开展成本高、耗费大,一个上千人的普通话水平测试常常需要在短时间内组织几十位测试员,这不但导致组织工作难,也由于高水平测试员的限制,在一定程度上存在测试结果的公正性问题。

为此,国家语委目前正在大力推动信息化技术在普通话测试、推广中的应用。通过现代计算机技术的应用,提高普通话测试、推广的效率和水平,提高测试工作的公正性,降低测试成本、节约人力物力和财力,同时通过信息化手段的应用提高语委系统对普通话测试工作的组织和管理能力。

2、智能语音技术的发展状况

随着现代通信技术的发展和社会信息化程度的不断提高,人们对信息获取的手段和方式提出了更为个性化和多样化的要求。语音和语言技术作为人们获取和沟通信息最方便、最有效的手段之一,其应用可以深入到社会生活的方方面面。智能语音技术简单来说就是使计算机、手机等信息终端具备能听会说的能力,能够通过对语言进行分析、理解和生成,使得智能机器可以像人一样自如的使用人类语言。主要包括语音合成、语音识别、语音评测和语音编码等技术。

1、语音合成:能将任意文字信息实时用语音朗读出来,相当于给智能设备装上了人工嘴巴;

2、语音识别:将语音转换为相应的文本或者机器可接受的命令,相当于给智能设备装上了人工耳朵;

3、语音评测:让计算机代替人工进行口语评价和错误检测;

4、语音编码:在更小的空间和更高的音质下进行语音存储和传输,包括语音和音乐编码,如Mp3、CDA等。

我国于20世纪80年代开始介入中文语音领域的研究,清华大学、中国科大、中科院声学所等单位都在这一领域取得了较好的成绩。尤其近年来,在国家十五语音高技术产业化示范工程和国家863计划项目支持下,以安徽中科大讯飞信息科技有限公司和中国科技大学为代表,我国语音及语言技术研究和产业发展取得了令人瞩目的进展。

科大讯飞的中文语音技术代表了世界的最高水平。是我国产业化实体中,在语音技术领域中基础研究时间最长、资产规模最大、历届评测成绩最好、专业人才最多及市场占有率最高的公司。先后被确定为我国唯一以语音技术为主要产业化方向的“国家863计划成果产业化基地”、“国家火炬计划重点高新技术企业”和“国家规划布局内重点软件企业”,已成为业界公认的“语音产业国家队”。特别是2002年,在国家发改委十五语音高技术产业化示范工程“语音互联网平台和智能语音芯片高技术产业化示范项目”的支持下,科大讯飞不仅在核心技术及产业应用上取得了突破性进展,还进一步在语音标准制定、打造产业链等方面作出了卓有成效的前瞻性工作,为把握民族语音产业先机也起到了重要促进作用。2003年2月,科大讯飞获得中文语音研究领域迄今唯一的“国家科技进步奖”。2004年10月,在国家863专家组组织得最近一次语音合成技术国际评比中,包括有日本ATR、清华大学等国内外知名语音研究机构参加的情况下,科大讯飞再次以大比分囊获所有指标第一名。2005年,科大讯飞荣获中国信息产业最高奖“信息产业重大技术发明”奖。

近年来,科大讯飞还在我国民族语音产业先机方面积极探索,分别与国内在中文语音领域积累深厚而又最具优势互补的三家单位:中国科技大学、中科院声学所、社科院语言所成立了紧密型联合实验室。通过创新的机制,使得合作伙伴专注于其擅长的研究,科大讯飞统一实施产业化,从源头技术上聚拢了语音的产业资源。同时,科大讯飞积极开展国际交流与合作,与国际语音巨头保持着既合作又竞争的良性战略合作关系:分别与全球最大的电话语音识别厂商NUANCE成立联合实验室;与全球最大软件企业微软合作成立了合肥微软技术中心;与IBM公司结为了奥运项目的战略伙伴。此外,科大讯飞作为我国语音技术标准的牵头制定单位,正在积极地通过国际游戏规则来设置民族语音产业的技术屏障,以使智能语音和语言技术领域这块我国信息产业为数极少、拥有自主知识产权且具有竞争优势的产业能够健康成长并加速发展。

3、国家语委“十五”重点科研项目研究成果

2004年11月,科大讯飞承担了国家语言文字“十五”重点科研项目:“智能语音技术在普通话辅助学习中的应用研究”,完成了标准语料库的建立,并采集和标注了全国南北各主要方言区的大量普通话测试数据,形成了规模大、覆盖面广、信息完整的普通话水平测试数据库。同时,以大规模语料库为基础并结合标准发音数据库和PSC规范,完成了针对PSC特点语音错、漏、增和回读的语音处理模型,针对不同录音环境和设备的信道匹配和音色自适应算法,形成了可实用化的计算机辅助普通话水平测试系统。2005年6到12月期间,科大讯飞在安徽、上海以及其他省份分别进行了多次的现场人机对比测试,测试结果表明:计算机评测结果与高水平测试员专家评测结果在总分和等级两个方面均取得了高度一致。

2006年1月18日,经国家语委科研规划领导小组批准,在北京召开了国家语委十五重点科研攻关项目“智能语音技术在普通话辅助学习中的应用研究”成果鉴定会议。经鉴定委员会16位专家对项目的认真评审和讨论,一致同意该项目通过国家鉴定。鉴定委员会认为:

该项目主要研发目标为推动智能语音技术在普通话学习、测试中的应用。项目研究取得了突破性进展,核心技术已经达到国内和国际的领先水平。项目主要成果可以减轻人工测试和培训的工作量,提高效率,促进普通话学习和测试手段的现代化,是我国推广普通话历史上一次重大的技术创新。建议尽快投入使用,使其在普通话学习和测试中发挥作用。