【摘 要】
:
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话
【机 构】
:
苏州大学计算机科学与技术学院,苏州科技大学计算机科学与工程系,苏州市虚拟现实智能交互及应用技术重点实验室
【基金项目】
:
国家自然科学基金项目(61331011,61673290,61472264)~~
论文部分内容阅读
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论和宾州篇章树库体系的优势,结合汉语复句句群理论以及汉语自身特点,提出了一种基于主述位理论的汉语篇章微观话题结构表示方式,并借助微观话题链构建了汉语篇章话题结构表示体系.随后,在此基础上,采用自顶向下、后向搜索的标注策略和人机结合的语料库标注方式,构建了基于篇章微观话题表示体系的汉语篇章话题结构语料库(Chinese discourse topic corpus,CDTC).CDTC共包含500个文档,对其进行了详细统计分析并展示了语料库的标注情况.与宾州篇章树库体系、广义话题结构理论的对比表明,所提篇章微观话题结构表示体系在理论上具有一定的优越性,并且符合汉语特点;一致性检验表明CDTC能够充分体现汉语篇章话题分析问题本身的难度,并能够为相关研究提供语料资源支持.
其他文献
在初中地理教学中,教师如果能够将翻转课堂的教学方法与情境教学方法充分结合在一起,则能够将教学效果提高到一个新的高度。通过发现,教师可以借助日常生活、地理故事、英文
针对两类分类问题,提出一种基于自适应提升(Adaptive Boosting,Adaboost)算法的分类特征提取算法.首先对训练样本集进行自举采样从而生成一定数量的训练样本自举子集,然后通过对每个自举子集的Fisher线性判别分析(FLD),得到相应数量的一维自举投影向量.在Adaboost算法迭代的每一步中,具有最小的加权最近邻分类误差的一维自举投影向量被作为分类特征选出,用来构成最终的强分类
植物miRNA是广泛分布于植物基因组的一类长度约19-24nt的内源非编码的单链小分子RNA,其在植物生长发育、代谢调节、信号转导及抗逆胁迫等多方面起着重要的调节
以汉中银杏树叶为原料,采用有机溶剂提取法对银杏叶中黄酮类化合物的提取工艺进行研究,通过单因素实验研究了不同提取温度,提取液浓度,提取次数,超声波对银杏叶中黄酮提取率的影响
集群式流媒体服务器已经逐渐成为了高端流媒体服务器的主流.对集群式流媒体服务器资源优化配置和相关算法性能的研究都需要科学的仿真系统来协助完成.本文基于集群式流媒体服
针对机械产品多质量要求下的选配问题,提出一种基于强弱Pareto和遗传算法的多质量要求下的选择装配方法。对选配问题进行分析,构建了一种面向三维空间多质量要求下的统一选配
禾本科(Gramineae)结缕草属(Zoysia)共有11个种,我国有5个种,其中结缕草(Zoysia japonica Steum.)的分布和应用最广,是宝贵的国产草坪草种质资源。结缕草在我国的分布范围在北纬4
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
目的探讨腹腔镜下肾癌根治术治疗局限性肾癌的临床指标与疗效。方法回顾性选择我院收治的局限性肾癌患者92例,将手术方式的差异作为分组依据,分为两组,腹腔镜组47例,以腹腔镜
草莓是无性繁殖的蔷薇科草本植物,近年来国内草莓生产发展很快。随着植物组织培养技术在草莓上的广泛应用,生产中发现一些草莓微繁殖苗表现体细胞无性系变异现象。转座元件的