基于SNP挖掘癌症关联的长非编码RNA

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wanglx199085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长非编码RNA(lncRNA)是一类不编码蛋白质的非编码RNA,它们参与了很多生物过程,且在其中发挥着重要作用。不仅如此,lncRNA还跟疾病的发生与发展有着密切的关联。因此,lncRNA的研究受到了业界的广泛关注,并成为遗传学研究的热点。挖掘与疾病关联的lncRNA将为复杂疾病如癌症的发现与诊断治疗提供新的契机。然而,从上万条lncRNA中通过实验手段筛选与疾病关联的lncRNA分子,将耗费巨大的人力和物力,给研究带来巨大挑战。借助计算方法挖掘出与癌症关联的lncRNA可以极大地缩小实验筛查的范围,并为生物实验提供指导。全基因组关联研究(GWAS)是复杂疾病和性状遗传研究的有力工具。它旨在检测与性状变异相关的单核苷酸多态性(SNP)。通过集成GWAS数据与生物网络,基于网络的分析方法和技术开展GWAS数据的深度挖掘,研究各种人类疾病或性状的基因组关联信息,挖掘与复杂疾病关联的基因包括lncRNA,是目前一个新兴的研究领域。已有研究成果表明,网络辅助分析可以增强我们对候选基因和生物标记的解释和划分优先等级。本文集成基因共表达网络与GWAS数据,构建携带SNP信息的异质网络,提出基于网络的计算方法挖掘与复杂疾病关联的基因包括lncRNA,得到与疾病关联的子网络,并进一步筛选出与疾病关联的lncRNA,为疾病关联基因的筛选提供了有力的支撑。通过GTEx Portal数据库获得编码基因与lncRNA的表达数据,基于复杂网络的聚类特性分析,构建了合理的编码基因-lncRNA异质网络。将与癌症关联的SNP信息转换成异质网络中对应节点的权重信息,从而得到一个边与点均带权重的网络。将识别与疾病关联的基因问题首先转换成该网络中发现与疾病关联的子网络,该问题对应的优化问题可以通过最大流/最小割方法予以求解。采用Push-Relabel算法得到最小割集,作为与疾病关联的子网络,基于该子网络可以进一步筛选与疾病关联的基因包括lncRNA。本文通过以下几个方面对该方法及其结果进行了验证。首先基于GO功能注释与KEGG富集分析来验证所挖掘子网络的生物学功能,并进一步通过已有数据库以及文献来验证子网络中的lncRNA与疾病之间的关联性。针对乳腺癌的分析结果表明,子网络中包含与乳腺癌高度关联的信息,其中10个lncRNA与乳腺癌的关联性已被其他独立实验验证。位于lncRNA CCAT2中的SNP(rs6983267(G/T))的相关预测信息与已有文献报道结果一致。针对前列腺癌的分析结果表明,与前列腺癌相关的子网络包含4个lncRNA,其关联关系得到其他独立实验证实。总之,本文所提出的研究方法与技术,取得了良好的预测结果,有望在癌症与基因的关联研究中,发现新的与癌症高度关联的lncRNA分子,挖掘潜在的lncRNA生物标记,对探索SNP对lncRNA的影响以及lncRNA与疾病之间的关联有着重要意义。
其他文献
现金流是企业生产经营活动的第一要素,是企业生存和发展必需的"血液"。经营性现金流量记录了企业的经营现金收支情况,它反映了企业自身的"造血功能"。加强企业经营性现金流量
<正>城乡建设用地增减挂钩政策是"占补平衡"思路的合理延伸,是破解保障与保护"两难"困境的根本出路。实施城乡建设用地增减挂钩政策有利于守住18亿亩耕地红线并保证城市建设
杂环化合物是有机化学中非常重要的一类产物,在天然产物全合成、新药研发等领域有非常重要的作用。在杂环化合物中,以含氧和含氮杂环最为常见。近年来,随着合成方法学、结构
相变储热技术和相变传热技术作为相变技术的两大主要技术及应用领域,备受研究人员的关注。相变储热技术以高储能密度的相变材料(PCM)为核心,利用材料自身物态的变化来吸收和
FTO (fat mass and obesity associated)作为脂肪和能量代谢相关基因,其单核苷酸多态性不仅与肥胖症紧密相关,还和糖尿病、癌症等多种慢性疾病的发生发展相关。FTO过表达和敲
冰雪旅游以其独特的吸引力让众多游客如痴如醉,因此还带动了一大批相关产业的发展。在这样的大背景下,近年来吉林省的冰雪旅游产业也在快速崛起当中。本文重点阐述了吉林省冰
目前,我国经济经历了几十年的高速发展,环保问题也日益严重,而在环保治理的投入中明显不足。2015年"两会"上,李克强总理做政府工作报告时首提大力推广PPP。文章就PPP模式与绿
基于光电催化反应的传感技术是一种新型的分析方法,由于其结合了光催化和电化学分析的双重优势,被广泛用于生物分析、环境分析、食品分析等领域。为了提高光电化学分析方法的
【目的】研究石河子垦区近年来土地动态变化,为该地区生态环境保护提供依据。【方法】以土地资源调查数据为基础,利用遥感和地理信息系统相结合方法,采用各类指数模型方法,研
光致发光(Photoluminescence,PL)光谱作为半导体电子结构表征的有力手段,因其非接触、高灵敏而被广泛运用于禁带宽度、带边能级和带尾态等特性的研究。基于傅里叶变换红外(Fourier Transform Infrared,FTIR)光谱仪的PL光谱方法充分利用了FTIR光谱仪多通道、高通量优势,由此显著提高PL光谱信噪比(Signal-to-noise Ratio,SNR)和谱分辨率