yd云顶集团“珠江人文讲坛”系列报告第四十五讲
暨校庆85周年系列活动成功举办
——祖漪清论人工智能技术与语言研究
2018年11月9日,科大讯飞信息科技股份有限公司高级研究员祖漪清应邀到yd云顶集团作题为《人工智能技术与语言研究》的学术讲座。本次讲座由yd云顶集团语言学及应用语言学专业学科带头人邵慧君教授主持。yd云顶集团、物理与电信工程学院等学院的研究生、本科生,以及暨南大学yd云顶集团的甘于恩教授都参加了这次讲座。
祖漪清高级研究员师从吴宗济、林茂灿,多年从事多语种语音合成研究,2003年曾带领摩托罗拉多媒体团队实现全球首次嵌入式中英语音合成系统的商用化,并在当时摩托罗拉多款中高端手机中应用,2010年至今则带领科大讯飞多语种团队建设遍及美洲、欧洲、亚洲三个地区的二十多种语言的商用语音合成系统,在多语种研发工作中,提交和获得了多项专利。
人工智能有三个台阶:运算智能、感知智能和认知智能。祖漪清老师先重点介绍了“感知智能”的研究内容:“感知智能”要求机器能说、会听、会看、会认,包括听觉、视觉、理解三个方面,语音合成和语音识别属于听觉方面的研究。祖老师认为,尽管如今讯飞在感知智能,尤其在语音合成与语音识别方面已经达到了实用,但在认知智能方面的研究仍面临很多困难。
祖漪清老师所在的科大讯飞多语种研究团队主要研发智能语音系统。基本的智能语言系统包括语音识别系统、翻译系统和文语转换系统。其中,文语转换系统是最基础的系统,包括文本输入、文本分析、语音学符号系列生成及其通过声学合成器的形成波形。祖老师指出,从20世纪30年代最早研发的文语转换技术合成器开始到近两年的端对端技术,机器学习能力不断提高,对易获取知识的依赖逐渐降低,但每一次技术的进步实际上都是基于对语言言语产生过程的深刻理解的。由此,祖老师提出,语言学家对语言研究的目的和AI工程师是不同的,前者的目的在于探索语言的内在规律,后者的目的在于探求能够使计算机系统从经验和数据中得到提高的技术,但两者最终会综合地作用于智能语音系统研发当中。
此外,祖老师还从多年的研究经历中体会到,语言中孤立词的研究并不能反应语音的全貌,连续话语中还有大量的秘密有待揭示。人的计算能力很难解释基本音段的声韵调参数在复杂语流中不同音段环境和不同韵律环境中的变化,而计算机文语转换系统的计算能力则可以采用相对大量的连续自然的语料,要想比较完整地把一个语言开发出来,人的归纳能力和机器的运算能力缺一不可,亦可称之为“人机耦合的研究方法”。
最后,祖老师对其讲座进行了总结,她提出:(1)语言研究的目的是揭示语言之下的智慧本质,是要打通认知之路;(2)语言研究需要深度和广度,深入的语言研究一定需要多语种的证据;(3)黑盒子般的神经网络系统不能解析语言知识,但它能为语音研究发挥作用;(4)未来的语言研究需要整体思维,人机耦合的研究方法是必然趋势,只有运用好人工智能技术,才能在语言研究方面走得更远。
简练而精彩的讲座使在场师生听得津津有味,且受益良多。在互动交流环节中,祖漪清老师就同学们提出的背景噪声消除、语气词和咳嗽声的特殊识别、地方口音和语速过快在语音识别中的处理、语篇语料获取等问题提出了自己的见解,博得了现场听众的阵阵掌声。
在讲座的结尾,祖老师引用科大讯飞研究院经理胡国平在2018年9月20日世界人工智能峰会上的一句话:“更需要关注的是语言之下的智慧本质,我们认为语言只是智能的表层和载体,更多的智能在语言之下”,对AI时代的语言研究表达了殷切的期望。讲座在热烈的掌声中圆满结束。
拟稿:杨韵莹 审核:邵慧君
祖漪清高级研究员
讲座现场