(通讯员 乐琦 何伟)4月28日,著名计算语言学家冯志伟先生应邀到访星空体育·(中国)官方网站,为学院师生带来一场题为“词向量与语言学”的学术讲座。讲座通过线下线上方式同时进行。线下讲座由我院何伟副研究员主持,脑科学与智能媒体研究院院长曹立宏教授、有声媒体语言中心主任邹煜教授以及星空体育·(中国)官方网站部分师生参加。400余人在线观看了讲座直播。
冯志伟先生为国家教育部语言文字应用研究所研究员、博士生导师、学术委员会委员,杭州师范大学高端特聘教授,中国传媒大学等国内外高校兼职教授。冯先生是我国计算语言学领域的开拓者,出版专著二十余部,发表重要学术论文百余篇,为中国计算语言学的发展做出了卓越贡献,被中国计算机学会赋予杰出成就奖。
在讲座中,冯志伟先生围绕词向量和语言学,概述了词向量产生的语言学背景,详细论述了词向量中的数学原理,最后介绍了深度学习领域的最新模型及成果。冯先生指出,词向量的产生有深刻的语言学理论根源,近年来在自然语言处理中广泛使用的“词向量”来源于语言学中的“价值”和“分布”等概念,一个单词的意义可以简单地根据它邻近的其他单词出现的频繁程度来确定,单词分布的向量表示叫做“词向量”。接着,冯先生讲授了词向量的降维方法、词项-文献矩阵、词项-词项矩阵以及如何通过余弦距离计算向量化的词语之间的语义相似度。最后,冯先生以Word2Vec为例介绍了神经网络中的词向量以及与神经网络相关的一些知识,如编码-解码机制、注意力机制、预训练范式等,并对比了机器学习与深度学习下的机器翻译系统的性能,得出相比传统的机器学习翻译系统,深度学习模型训练出的翻译系统性能更优。
在讨论环节,参会师生围绕词向量的应用、词向量与语言学的联系、儿童语言习得、人工智能与脑科学等与冯先生展开了深度交流。针对线上参会者提出的如何将语言学与人工智能相结合等问题,冯先生指出,语言学和人工智能不分高低,都有其重要的价值与时代贡献,传统语言学应当沿着自己的道路朝更深更远的方向发展。他还希望年轻学者们紧追时代潮流,学习当下最新的理论与技术,不断更新自己的知识,牢抓基础学科,成为人工智能时代的人才。
本次讲座持续了两个多小时,冯先生以平实易懂的语言、生动的例子讲解了词向量的原理,以殷切的期盼鼓励新一代研究者脚踏实地、开拓创新,令参加讲座的师生受益匪浅。
来源:中国传媒大学白杨网