语篇分析中基于关键词分析的数据驱动方法

来源 :上海师范大学 | 被引量 : 0次 | 上传用户：lilyzhaoli2009

【摘要】

：

目前语料库语言学用于语言学研究的方法主要是基于语料库的(corpus-based)方法和语料库驱动的(corpus-driven)方法。基于语料库的方法使用语料主要是为了解释、检测或例示传

【作者】

：

吴良平

【出处】

：

上海师范大学

【发表日期】

：

2006年期

【关键词】

：

语料库数据驱动方法关键词语篇分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前语料库语言学用于语言学研究的方法主要是基于语料库的(corpus-based)方法和语料库驱动的(corpus-driven)方法。基于语料库的方法使用语料主要是为了解释、检测或例示传统语言理论(的正确性)。语料库驱动的方法则认为传统语言理论与语言事实之间存在差异，基于语料库的方法不着眼挑战已有语言描叙或语言理论，没有充分利用语料的潜能，从而不能对丰富的语言事实做出理想的解释。语料库驱动的方法主张：语言理论不应先于语言事实，而只能由之直接产生，同时还要要完整地反映所观测到的语言事实(Tognini-Bonelli 2001)。 Rayson(2002)则另外提出了一种用于语言学研究的数据驱动(data-driven)的方法。通过对以往研究的调查，他认为在确定待研究的语言特征方面前两种方法均存在不足之处，那就是研究问题通常先于语言研究，差别只在于证实与质疑，从而有可能遮蔽其他更普遍的语言特征的发现。Rayson的方法是运用频率凸现(frequency profiling)和检索(concordance)这两个语料库研究手段对经过语义标注的语料先进行宏观分析，然后微观分析，从而发现凸现的候选研究问题。他把这个语言发现过程概括为“建库—标注—抽取—问题—阐释(build—annotate—retrieve—question—interpret)”。这种数据驱动方法产生的问题然后通过前两种方法进行分析。本文和Rayson同样认为基于语料和语料驱动的方法各有适用的领域，无优劣之别，但在确定语言研究问题时需要先宏观，后微观，从而能够发现以前被忽略的语言现象。和Rayson不同的是，本文提出的基于关键词的数据驱动方法的宏观发现过程不是基于语义的对比，而是基于词汇的对比。提出这种方法的一个原因是语义标注在国内还不成熟，另一个原因是已有语料库研究初步显示基于词汇和基于语义的语料库研究都能对同一语料作出相似发现(Archer and Rayson 2004；Baker and McEnery 2004；Deegan and Short 2004)。基于关键词的数据驱动方法的语言发现过程是“建库—抽取—问题—阐释”，亦即是，首先建立目标语料库作为要进行语言特征发现的对象，然后通过语料库语言学的统计方法对目标语料库进行分析，在这个步骤中发现潜在的可供进一步

其他文献

拜耳法生产氧化铝工艺的蒸发技术

拜耳法生产工艺主要由原矿制备、溶出、赤泥分离、种子分解、蒸发和焙烧六个主要生产工序,其中蒸发工序主要起到控制生产流程中的液量平衡,排除生产过程中积累的杂质的作用。

期刊

铝土矿铝酸钠溶液蒸发拜耳法

高职院校会计职业道德教育研究——以西安部分高职院校为例

高职会计毕业学生大部分会进入我国数量庞大的中小企业会计队伍,工作在第一线会计岗位。再度提出研究高职会计职业道德教育,目的是为了提高高职院校对会计职业道德教育的信心

期刊

高职会计会计职业道德教育对策

我国研究型大学通识教育实施研究

中国要屹立于创新型国家之列,关键在于拥有大批创新型人才。研究型大学肩负着为国家培养创新型人才的重任,其重要作用不言而喻。而通识教育作为当今教育界的主流趋势,旨在使

学位

研究型大学通识教育实施创新型人才培养通识理念

中欧高层次人文对话机制下的教育合作与交流——访欧盟委员会教育文化总司“让·莫内计划”及中国事务负责人维多·博雷里

让·莫内计划(Jean Monnet)的设立旨在加强和促进欧洲一体化的进程。计划内容包括:激励有关欧洲一体化的研究、教学、科研和思考;支持各类机构和协会促进欧洲一体化的教育和

期刊

中欧高层次人文对话机制伊拉斯谟计划调优项目让·莫内计划

从翻译活动看文化构建

本文试图从翻译的角度来研究文化构建的问题。具体地说是研究翻译活动与晚清文学观念重构的关系。虽然文学观念的重构离不开晚清政治经济和文化的变革的背景,本文作者认为翻

学位

文化建构翻译活动晚清多元系统论文学观念

《蒙古语语法信息词典构形附加成分分库》的设计与实现

《蒙古语语法信息词典》是面向计算机的,为实现自动分析和自动生成蒙古语语句而研制的一部电子词典,是蒙古文信息处理领域重要基础工程之一。《蒙古语语法信息词典构形附加成

学位

蒙古语语法信息词典构形附加成分语法属性字段规则分库

新媒体形势下完善高校法制教育的路径探索

高校法制教育是采用课堂教学与课外实践等方式培养学生树立尊崇法治的理念,提升高校大学生法律素养、引导学生信仰法律,遵法、守法、知法、用法的社会主义合格建设者和可靠接

期刊

法制教育高校新媒体

我国中小企业财务管理存在的问题与对策

随着我国经济体制的不断优化重组，国家对中小企业的大力帮扶使中小企业在最近几年得到了突飞猛进的发展，不仅带动了更多的就业，也为当地的产业结构提供了全新的模式。随着市场经

期刊

财务管理实际问题解决方案

临沂市河东区编办盘活用好教职工编制资源

一是加强机构编制管理,突出编制动态监管。结合中小学教职工定编标准和财政供养人员控制目标等实际情况,充分考虑城乡教育均衡发展、学生生源逐年增加、农村中小学寄宿制学校

期刊

教职工中小学临沂市河东区县管校聘

762例药品不良反应报告的评价和分析

目的:通过对药品不良反应(Adverse drug reaction,ADR)报告的评价和分析,了解临床ADR报告的状况。方法:对我院2004年以来自发呈报的ADR报告进行评价和分析。结果:共收到ADR报

期刊

药品不良反应自愿报告分析

语篇分析中基于关键词分析的数据驱动方法

其他学术论文