生命科学知识网络系统构建及网络信息分析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:lsy999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量数据分析数据的大量产生,生物信息数据库及系统生物学在生命科学研究中越来越重要。大量的数据库和网络服务又使得使用者面临被数据淹没的危险,此外如何有效的组织和利用这些信息也成为生物信息研究的重点。为了构建一个统一的生物信息框架来有效的统一和组织以及分析这些不同来源、类型的数据和信息,我们对生物信息的数据结构和信息构成进行了基础的分析。在对原始数据处理的基础上,本研究设计了以概念为节点,以关系为连线的数据框架。对海量生命科学概念构建统一的本体库,构建了新的基于语义的文献搜索引擎。我们还开发了一套新的网络分析算法,结合我们标准化后的信息分值,我们可以快速的计算并排序最相关的概念和可能的信息通路,最终提供可能的生物学解释。在进行的基础研究和数据处理基础上,我们开发了名为BioPubInfo(http://www.biopubinfo.org)的生命科学知识引擎,包含文献相关搜索引擎和网络知识分析引擎。目前网络知识分析引擎已初步完成了界面的开发和后台的设置,文献相关搜索引擎还在进一步完善中。在对生命科学海量数据的分析处理过程中,我们设计和摸索出了一套分析和处理海量数据,并利用数据的网络结构搜索和预测新知识的算法。新的算法在充分利用图形数据库与图形数据结构框架优势的基础上实现了对亿级数量概念关系网络的实时分析,并在此基础上对人类疾病和拟南芥、水稻相关性状的候选基因进行了预测。基于获得概念网络及其理念,我们对水稻的表型与基因的关系进行了预测,并整合其他信息建立了QTXtoGene的分析平台,后续将加入更多的物种和性状。在对全局数据整合的过程中,我们还分析了拟南芥的盐胁迫表达调控网络以及基因组进化和水平转移等几个方面的问题。构建了拟南芥根部在盐胁迫下不同时间的表达调控网络,采用了新的水平基因检测方法,分析并找到了家蚕基因组中10个水平转移基因。同时将共有信息的方法用于分析流感病毒受体蛋白不同位点之间的关系网络。
其他文献
针对目前高校在教学过程中理论结合实践存在的问题,以施工组织管理课程为基础,分析了该课程的教学难点,并以此介绍了项目化教学模式存在的价值及优点,并针对该课程提出了相关
目的探讨缺血性脑卒中患者二级预防依从性的相关影响因素及预防措施。方法回顾性分析134例缺血性脑卒中患者二级预防的临床资料,对其依从性及影响因素进行比较分析。结果缺血
德国如今,德国正在掀起前所未有的"爱因斯坦热".政府把2005年定为"爱因斯坦年",并宣布这名犹太物理学家为德国的英雄人物之一.想当年,爱因斯坦被迫逃离了自己的祖国.现在,他
目的:分析经皮穿刺内窥镜下手术治疗腰椎间盘疾患的效果,总结临床经验。方法:从1998年6月至2007年6月,在我院接受经皮穿刺内窥镜下手术治疗并得到1年以上随访的腰椎间盘疾病
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
美国科学家经研究后认为,"写信"而非"打电话",可能是地球人类与外星文明联络的更佳方式.
目的:探讨恩施人群IL-10-819C/T多态性与胃癌关联性及其与幽门螺杆菌感染交互作用。方法采用多聚酶链反应-限制性片段长度多态性( PCR-RFLP)方法分析142例胃癌患者和136名正常对