查看原文
其他

前沿研究丨神经自然语言处理最新进展

Engineering 中国工程院院刊 2022-12-06

本文选自中国工程院院刊《Engineering》2020年第3期

作者:周明, 段楠, 刘树杰, 沈向洋

来源:Progress in Neural NLP: Modeling, Learning, and Reasoning[J].Engineering,

2020,6(3):275-290.


导 语

自然语言处理是人工智能研究的一个重要领域,旨在构建能够理解和生成自然语言、实现人机自然交互的技术方案。近5年来,基于神经网络的自然语言处理方法取得突飞猛进的发展。基于海量无标注数据和大量标注数据进行建模,使机器翻译、自动问答和阅读理解等很多任务的处理水平都得到了极大提高。


中国工程院院刊《Engineering》刊发的《神经自然语言处理最新进展——模型、训练和推理》一文,从3个角度回顾神经自然语言处理的最新进展,包括模型、训练和推理。在模型部分,介绍了典型的神经网络建模方法,包括词嵌入建模、句子嵌入建模和序列到序列建模等;在训练部分,介绍了常用的学习方法,包括监督学习、半监督学习、无监督学习、多任务学习、迁移学习和主动学习等;在推理部分,介绍了典型的推理框架,包括非神经网络方法和神经网络方法,推理是构建基于知识的可解释自然语言处理模型的关键技术。最后,文章概括了对自然语言处理未来发展方向的一些思考。


 

视频介绍丨神经自然语言处理最新进展——模型、训练和推理


视频来源:周明



作为人工智能的重要分支,自然语言处理研究人与机器之间如何通过自然语言进行交互。其研究范围包括:词、短语、句子和文档的处理以及机器翻译、问答系统、信息检索、对话、文本生成和推荐系统等应用。2012年以来,随着深度学习在图像和语音处理领域的突破性进展,深度学习方法也被引入到自然语言处理领域,并很快超过了传统的统计模型。如今,深度学习方法被全面用于自然语言处理的各个领域,并在某些任务(例如机器翻译和机器阅读理解)上达到了前所未有的水平。基于上述背景,周明等从(a)模型、(b)训练和(c)推理三方面回顾神经自然语言处理的最新进展。


针对模型,常用的神经网络建模方法包括词嵌入模型、句子嵌入模型和串到串建模。词嵌入模型将自然语言句子中的单词映射到连续的语义空间。基于词嵌入的语义空间表示,包括循环神经网络、卷积神经网络和自注意力网络等在内的方法才能生成考虑全句上下文的词嵌入表示或句子嵌入表示。词嵌入表示在词性预测和命名实体识别等任务中有广泛的应用。句子嵌入通常被用于句子级任务,例如情感分析或者复述判别。句子嵌入还可以用于循环神经网络或卷积神经网络,用来完成串到串间的转化任务(即编码器-解码器框架)。给定一个输入句子,串到串模型可以用来生成问题对应的答案(问答系统),也可以用来生成源语言句子对应的目标语言翻译(机器翻译)。


针对训练,对于资源丰富的自然语言处理任务,监督学习的方法通常被用来利用大规模标注数据训练模型参数。对于这样的任务,深度学习模型往往能够得到很好的效果,例如在中英语言对的新闻领域,存在大规模的双语句对,神经机器翻译的质量就会非常好,甚至达到了能与人类媲美的水平。然而对于其他自然语言处理任务,却很难获取大规模的训练数据,比如小语种的机器翻译和情感分析。为了提高该类任务上模型的性能,人们使用半监督学习方法将未标注数据和有标注数据进行结合,或者使用无监督学习方法仅仅使用未标注数据来训练模型参数。另一种利用未标注数据的方法是利用未标注数据来预训练模型参数,然后将预训练模型通过迁移学习来迁移到目标任务上。当本任务的训练数据不够时,其它相关任务的训练数据也可以通过多任务学习来改进模型的性能。人工标注数据自然是最为有用但代价最高的一个途径,如何在经费有限的情况下更为高效的进行数据标注便是主动学习的研究范围。


针对推理,将推理定义为:基于已有知识对未见问题进行理解和推断,并得出问题对应答案的过程。据此定义,推理系统主要由如下两个模块组成:(1) 知识,例如知识图谱、常识、规则、从本文中抽取的断言等;(2) 推理引擎,基于输入和已有知识推断出答案。


总体而言,自然语言处理研究和应用已经进入了一个新的时代。对于高资源的自然语言处理任务(例如机器翻译和自动问答),监督学习方法已经取得了很好的效果。对于低资源的自然语言处理任务,半监督学习和无监督学习在近年来也有了长足的进步和发展。但还需要更多持续的努力才能取得更令人满意的效果。此外,推理相关的研究和数据集也得到研究者越来越多的关注。这个方向目前尚处于起步期,但意义重大,因此还有很大的发展空间。展望未来,我们可以看到很多令人激动的方向。预训练模型的发展已经展示出巨大的威力。毫无疑问该类研究将继续推动自然语言理解和生成任务的水平。记忆和知识增强的神经网络方法会受到越来越多地关注,并促进知识抽取领域的持续发展。此外,如何将包括声音、视觉和文本等多模态信息融入到自然语言处理的研究中,也是人工智能发展的一个重要方向。在未来,自然语言处理技术会极大地改变人们的生活。为了实现这一目标,需要我们继续不断地创新并推动各项研究和应用。这些技术终将更好地为人类社会服务。


图1 神经自然语言处理中的模型、训练和推理


改编丨周明


注:本文内容呈现形式略有调整,若需可查看原文。


改编原文:

Ming Zhou, Nan Duan, Shujie Liu, Heung-Yeung Shum.Progress in Neural NLP: Modeling, Learning, and Reasoning[J].Engineering,2020,6(3):275-290.


  需阅读全文请扫描二维码或点击文末“阅读原文”


☟   “人工智能”专题更多相关文章,请点击标题链接或扫描二维码查看


人工智能——使能技术、赋能社会

Artificial Intelligence: Enabling Technology to Empower Society

吕跃广

扫描二维码,阅读原文


AI的多重知识表达

Multiple Knowledge Representation of Artificial Intelligence

潘云鹤

扫描二维码,阅读原文


如何解读机器知识

How to Interpret Machine Knowledge

李发伸,李廉,殷建平,张勇,周庆国,况琨

扫描二维码,阅读原文


通用智能本体

The General-Purpose Intelligent Agent

卢策吾,王世全

扫描二维码,阅读原文


人工智能的下一步突破——多学科交叉内禀

The Next Breakthroughs of Artificial Intelligence: The Interdisciplinary Nature of AI

庄越挺,蔡铭,李学龙,罗先刚,杨强,吴飞

扫描二维码,阅读原文


从脑科学到人工智能

From Brain Science to Artificial Intelligence

范静涛,方璐,吴嘉敏,郭雨晨,戴琼海

扫描二维码,阅读原文


因果推理

Causal Inference

况琨,李廉,耿直,徐雷,张坤,廖备水,黄华新,丁鹏,苗旺,蒋智超

扫描二维码,阅读原文


深度神经网络加速器体系结构概述

A Survey of Accelerator Architectures for Deep Neural Networks

陈怡然,谢源,宋凌皓,陈凡,唐天琪

扫描二维码,阅读原文


神经自然语言处理最新进展——模型、训练和推理

Progress in Neural NLP: Modeling, Learning, and Reasoning

周明,段楠,刘树杰,沈向洋

扫描二维码,阅读原文


医疗保健中的人工智能——综述与预测性案例研究

Artificial Intelligence in Healthcare: Review and Prediction Case Studies

荣国光,Arnaldo Mendez,Elie Bou Assi,赵博,Mohamad Sawan

扫描二维码,阅读原文


中国的人工智能伦理原则和治理技术发展

Ethical Principles and Governance Technology Development of AI in China

吴文峻,黄铁军,龚克

扫描二维码,阅读原文


“暗”,不止于“深”——迈向认知智能与类人常识的范式转换

The Next Breakthroughs of Artificial Intelligence: The Interdisciplinary Nature of AI

朱毅鑫,高涛,范丽凤,黄思远,Mark Edmonds,刘航欣,高枫,张驰,Siyuan Qi,吴英年,Joshua B. Tenenbaum,朱松纯

扫描二维码,阅读原文


深度学习中的对抗性攻击和防御

Adversarial Attacks and Defenses in Deep Learning

任奎,Tianhang Zheng,秦湛,Xue Liu

扫描二维码,阅读原文


深度学习的几何学解释

A Geometric Understanding of Deep Learning

雷娜,安东生,郭洋,苏科华,刘世霞,罗钟铉,丘成桐,顾险峰

扫描二维码,阅读原文


点击图片阅读丨人工智能专题


中国工程院院刊

工程造福人类

科技开创未来

微信公众号ID :CAE-Engineering


注:论文反映的是研究成果进展,不代表《中国工程科学》杂志社的观点。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存