基于维基百科的中文嵌套命名实体识别语料库自动构建

来源 :计算机工程 | 被引量 : 0次 | 上传用户:longlivewebdynpro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的监督学习方法需要标注一定规模的领域内语料库,限制了其领域适应性。为此,提出一种从中文维基百科条目中自动构建中文嵌套命名实体识别语料库的方法。对中文维基百科的条目进行实体分类,利用实体条目构造实体的嵌套结构,从而自动生成大规模的中文嵌套命名实体识别语料库。在手工标注嵌套命名实体识别语料库上的实验结果表明,自动构建的语料库具有规模较大、领域广的特点,且能够适应宽泛领域上的中文嵌套命名实体识别任务。
其他文献
根据全军第十六次院校会议精神,结合院校体制编制调整改革形势任务,从全军院校实验室工作实现跨越式发展的目标出发,提出了军队实验室建设应为构筑四个层面的实验体系,即专业
<正>近年基层医院对病理科的认识和重视程度虽然有了很大的提高,但由于基层医院病理科的起步时间不同及管理制度不完善,仍还存在许多问题。我省医院的病理技术人员业务水平参
在《木马赛冠军》中劳伦斯一如他在其更负盛名的《普鲁士军官》和《马贩子的女儿》中一样关注着现代社会中的人际关系、工业文明的侵蚀及非理性带给人类的恶果。不过在《木马
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
期刊
美国自20世纪80年代进行教育市场化改革后,教育取得长足进步,本文通过对其背景以及市场化的表现,如教育券政策、特许学校、营利学校的分析,力图为我国的教育发展提供借鉴。
为实现水下航行器高效稳定运行,将对转永磁同步电动机应用到对转螺旋桨推进系统中,不仅能够简化推进系统结构、减小体积、降低重量和成本,而且没有电刷滑环,运行更加安全可靠
为更好兼顾LTE-A系统吞吐量与用户公平性,提出基于贪心算法的资源管理方法。在载波聚合时充分利用用户端上报的信道状态信息,降低信道变化对载波聚合算法性能的影响。使用贪
近年来,尤其是北京“一带一路”高峰论坛和杭州首届中国国际茶叶博览会的盛大举行,越来越强烈地感觉到茶文化不仅是软实力,同时也是硬实力,具有较硬实力的二重属性特质。正如习总
隋&#183;巢元方撰著的《诸病源候论》(以下简称《病源》),不仅是我国第一部病理学专著,而且还包含了相当多的伤科学内容。为了发掘《病源》在伤科学上的成就,笔者就《金疮病