【摘 要】
:
词义消歧是自然语言处理中的一项基础任务,古汉语信息处理也急需深层次的语义标注工作。该文针对先秦古汉语这一特殊的语言材料,在训练语料和语义资源匮乏的条件下,采用《汉
【机 构】
:
南京大学计算机软件新技术国家重点实验室,南京师范大学语言信息科技研究中心
【基金项目】
:
先秦文献词汇知识挖掘资助项目(2010JDXM023), 211项目“先秦汉语词汇统计与知识检索”, 国家社会科学基金资助项目(10&ZD117,10CYY021,08BYY054)
论文部分内容阅读
词义消歧是自然语言处理中的一项基础任务,古汉语信息处理也急需深层次的语义标注工作。该文针对先秦古汉语这一特殊的语言材料,在训练语料和语义资源匮乏的条件下,采用《汉语大词典2.0》作为知识来源,将其词条释义作为义类,每个义项的例句作为训练语料,使用基于支持向量机(SVM)的半指导方法对《左传》进行全文的词义标注。按照频度不同、义项数量不同的原则,我们随机选取了22个词进行了人工检查,平均正确率达到67%。该方法可以广泛用于缺乏训练语料的古汉语义项标注工作,能够在古汉语全文词义标注的起步阶段提供初始结果,为人
其他文献
党的十八届三中全会指出,全面深化改革的总目标是完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化。这一表述,反映了新形势下我们党对治国理政理念和方式规律
评价对象是情感分析中情感信息的一个重要组成部分。该文基于条件随机场模型,研究多种特征在评价对象抽取任务中的表现,并将特征归纳为词法、依存关系、相对位置、语义四大类
为了加快推进政府职能转变,国务院常务会议要求积极推进政府购买社会组织、机构和企业的公共服务,以及落实引导民间投资措施。按照国务院的要求,各地,诸如北京、广东、江苏南京,正
国有林场和垦区棚户区改造是保障性安居工程建设的重要组成部分。各地越来越重视林区、垦区的棚户区改造,并在推进机制和管理制度方面进行了一系列探索。近期,我们对江西省国有
近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注。但是这种分词方法在处理歧义切分方面存在一定的问题。CRF虽然可以消除大部分原有的分词歧