论文部分内容阅读
摘 要 语言能力(包括口语能力和书面语言能力)是人的首要能力,是其综合能力的重要组成部分。而计算机科学领域也有语言处理,即计算机理解和运用人类语言的能力,也就是自然语言处理技术。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。本文简要分析了自然语言处理学习中的重点,并对其处理过程和技术方面进行了主要探究,旨在从更多更深入的自然语言处理的方法和技术层面推动人工智能及计算机的发展。
关键词 自然语言处理;人工智能计算机
1引言
机器翻译是最早的自然语言理解方面的研究,但人们当时低估了自然语言的复杂性,而且语言处理的理论和技术均不成热,所以相关方面的研究进展不大[1]。随着计算机与互联网的迅速发展,现在的自然语言处理技术可以做到信息提取,语音输入,舆论分析,情感分析,智能问答甚至语言生成等一系列较为先进的功能。随着深度学习在图像识别、语音识别领域的大放异彩,人们对深度学习在NLP的价值也寄予厚望。自然语言处理作为人工智能领域的认知智能,成为目前大家关注的焦点。自然语言处理这一研究方向主要解决的是使得计算机能够理解人类的自然语言的问题。自然语言理解完成了人类与机器的交互,并且做出人类要求的相应的命令控制处理工作。
2自然语言处理研究要点
2.1自然语言处理的基本问题
(1)语音学问题:研究词语及其语音之间的关联。这是语音识别方面研究的主要问题,机器通过对语音信号进行处理、分析并识别从而判断语音的意思。此方面的应用主要有:输入法的语音识别、同声传译等等[2]。
(2)语法学问题:研究其句子结构成分之间的相互关系和组成句子的序列的规则。如英语中的语法众多,汉语中也有很多的语法,这些语法也同样是自然语言处理中的难题。
(3)语义学问题:研究如何从一个语句中得到一个词的本质意思,以及这些词在该句子中的句法结构的作用来推导语句的意义。这其中的主要问题是语言文字的歧义现象。歧义现象包括结构歧义和语义歧义。如何正确理解歧义也是一个重点。
(4)语用学问题:研究在不同语境中语句的应用,以及上下文对句子理解所产生的影响。自然语言的处理大部分情况下离不开语境,在不同的语境下不同的句子会有不同的含义。因此语境的学习同样为语言识别的要点。
3自然语言处理过程
自然语言理解的研究分为两个方面,一方面是书面理解,另一方面是口语理解,其中计算机处理更容易处理书面理解。计算机对于语言的分析与理解通常是一个层次化过程,语言学家将这一过程分为语用分析、语音分析、语义分析四种。
自然语言处理主要步骤包括:
(1)分词处理:将一篇文章按词组依次分开。
(2)词法分析:将分词处理后的词汇类型进行分词,标明词汇的词性也就是确定词的类
型,包括名词、动词、形容词、副词、介词等。
(3)语法分析:分析出句子的语法成分。
(4)语义分析:指的是让计算机能够理解自然语言。
4自然语言处理技术
4.1语料库
语料库是为一个或者多个应用目标而专门收集的,有一定结构的、有代表的、可被计算机程序检索的、具有一定规模的语料集合。语料是翻译和做语言研究的基础,同样是我们自然语言处理的一个重要的数据库。21世纪是大数据的时代,语料库中丰富的语言数据,对于自然语言处理這一工作是重中之重。
4.2 word2vec
该技术通过一个句子中的周边词语预测中心词语或通过中心词语预测周边词语来构建模型,并将句子中所有的词都转换为词向量的形式。中心词距离周边词较其他词语更近。该方法借助于神经网络进行自然语言的处理。
4.3 长短期记忆LSTM
普通的循环神经网络(RNN)在进行语言处理时候,对距离近的词记忆较好,而对于距离较远的词记忆较差,所以在实际中通常使用LSTM即长短期记忆的方法,其优势在于可以避免长距离的失忆问题。
5总结与展望
当前人工智能正从感知智能向认知智能升级,自然语言处理的重要性日益凸显。一方面,自然语言处理受到大数据和深度学习的双轮驱动,在各项关键技术方面都有不同程度的进步;另一方面,自然语言处理渗透到各个领域,与教育、医疗、法律等知识服务型行业深度整合,同时虚拟/实体机器人等新型应用模式与线下服务对接。人类对智能的需要随着社会科技的进步已经越来越必须,要求也越来越高。目前计算机还远远没有的达到人一样的理解水平,相信将来也不会达到这样的水平,所以应该从实用的角度去判断计算机对自然语言的理解,只要计算机能够实现人机会话,或者能够自动摘录一些语言信息,那么我们就可以说计算机已经具有了自然语言的能力。
参考文献:
[1]张静. 基于自然语言处理的智能识别和智能控制应用[D].南京邮电大学,2017.
[2]孙茂松,周建设.从机器翻译历程看自然语言处理研究的发展策略[J].语言战略研究,2016,1(06):12-18.
关键词 自然语言处理;人工智能计算机
1引言
机器翻译是最早的自然语言理解方面的研究,但人们当时低估了自然语言的复杂性,而且语言处理的理论和技术均不成热,所以相关方面的研究进展不大[1]。随着计算机与互联网的迅速发展,现在的自然语言处理技术可以做到信息提取,语音输入,舆论分析,情感分析,智能问答甚至语言生成等一系列较为先进的功能。随着深度学习在图像识别、语音识别领域的大放异彩,人们对深度学习在NLP的价值也寄予厚望。自然语言处理作为人工智能领域的认知智能,成为目前大家关注的焦点。自然语言处理这一研究方向主要解决的是使得计算机能够理解人类的自然语言的问题。自然语言理解完成了人类与机器的交互,并且做出人类要求的相应的命令控制处理工作。
2自然语言处理研究要点
2.1自然语言处理的基本问题
(1)语音学问题:研究词语及其语音之间的关联。这是语音识别方面研究的主要问题,机器通过对语音信号进行处理、分析并识别从而判断语音的意思。此方面的应用主要有:输入法的语音识别、同声传译等等[2]。
(2)语法学问题:研究其句子结构成分之间的相互关系和组成句子的序列的规则。如英语中的语法众多,汉语中也有很多的语法,这些语法也同样是自然语言处理中的难题。
(3)语义学问题:研究如何从一个语句中得到一个词的本质意思,以及这些词在该句子中的句法结构的作用来推导语句的意义。这其中的主要问题是语言文字的歧义现象。歧义现象包括结构歧义和语义歧义。如何正确理解歧义也是一个重点。
(4)语用学问题:研究在不同语境中语句的应用,以及上下文对句子理解所产生的影响。自然语言的处理大部分情况下离不开语境,在不同的语境下不同的句子会有不同的含义。因此语境的学习同样为语言识别的要点。
3自然语言处理过程
自然语言理解的研究分为两个方面,一方面是书面理解,另一方面是口语理解,其中计算机处理更容易处理书面理解。计算机对于语言的分析与理解通常是一个层次化过程,语言学家将这一过程分为语用分析、语音分析、语义分析四种。
自然语言处理主要步骤包括:
(1)分词处理:将一篇文章按词组依次分开。
(2)词法分析:将分词处理后的词汇类型进行分词,标明词汇的词性也就是确定词的类
型,包括名词、动词、形容词、副词、介词等。
(3)语法分析:分析出句子的语法成分。
(4)语义分析:指的是让计算机能够理解自然语言。
4自然语言处理技术
4.1语料库
语料库是为一个或者多个应用目标而专门收集的,有一定结构的、有代表的、可被计算机程序检索的、具有一定规模的语料集合。语料是翻译和做语言研究的基础,同样是我们自然语言处理的一个重要的数据库。21世纪是大数据的时代,语料库中丰富的语言数据,对于自然语言处理這一工作是重中之重。
4.2 word2vec
该技术通过一个句子中的周边词语预测中心词语或通过中心词语预测周边词语来构建模型,并将句子中所有的词都转换为词向量的形式。中心词距离周边词较其他词语更近。该方法借助于神经网络进行自然语言的处理。
4.3 长短期记忆LSTM
普通的循环神经网络(RNN)在进行语言处理时候,对距离近的词记忆较好,而对于距离较远的词记忆较差,所以在实际中通常使用LSTM即长短期记忆的方法,其优势在于可以避免长距离的失忆问题。
5总结与展望
当前人工智能正从感知智能向认知智能升级,自然语言处理的重要性日益凸显。一方面,自然语言处理受到大数据和深度学习的双轮驱动,在各项关键技术方面都有不同程度的进步;另一方面,自然语言处理渗透到各个领域,与教育、医疗、法律等知识服务型行业深度整合,同时虚拟/实体机器人等新型应用模式与线下服务对接。人类对智能的需要随着社会科技的进步已经越来越必须,要求也越来越高。目前计算机还远远没有的达到人一样的理解水平,相信将来也不会达到这样的水平,所以应该从实用的角度去判断计算机对自然语言的理解,只要计算机能够实现人机会话,或者能够自动摘录一些语言信息,那么我们就可以说计算机已经具有了自然语言的能力。
参考文献:
[1]张静. 基于自然语言处理的智能识别和智能控制应用[D].南京邮电大学,2017.
[2]孙茂松,周建设.从机器翻译历程看自然语言处理研究的发展策略[J].语言战略研究,2016,1(06):12-18.