【摘 要】
:
高通量技术作为一种革命性的测序技术,由于其高通量、高精度、低成本的特点,已经成为了可以替代基于杂交的微阵列技术进行生物学研究的一种工具。目前,以Roche公司的454技术、Illumina公司的Solexa技术以及ABI公司的SOLID技术为标志的新一代测序技术(Next generation sequencing,NGS)已经被广泛地应用于实际的生物学研究中。高通量测序技术在为基因组的研究提供了
论文部分内容阅读
高通量技术作为一种革命性的测序技术,由于其高通量、高精度、低成本的特点,已经成为了可以替代基于杂交的微阵列技术进行生物学研究的一种工具。目前,以Roche公司的454技术、Illumina公司的Solexa技术以及ABI公司的SOLID技术为标志的新一代测序技术(Next generation sequencing,NGS)已经被广泛地应用于实际的生物学研究中。高通量测序技术在为基因组的研究提供了有利工具的同时也带来了统计上的挑战。由于基因长度、测序深度以及样本间片段分布的差异性,我们通常不能直接对原始数据进行处理。现有的文献提供了多种方法来进行相同物种RNA-Seq数据的标准化,并且利用标准化之后的数据进行基因的差异化表达分析。本文考虑针对不同物种的RNA-Seq数据进行标准化的问题。识别不同物种之间的差异化表达的基因能够有效地发现进化上保守的转录反应,而且对探索哺乳动物器官中基因表达水平的演变和研究医学中基因的表达水平具有重大影响。由于不同物种之间的基因个数、同源基因的长度以及测序深度的差异,对不同物种的RNA-seq数据的标准化更为复杂,过去所使用的针对相同物种的标准化方法不能直接应用于不同物种基因的标准化。为了使不同物种的RNA-seq数据之间可以进行比较,在本文中,我们考虑利用已有的一部分保守的同源基因以及假设检验的方法,通过最小化经验误差和名义I型误差之间的偏差来寻找最佳的标准因子,进而提出了基于尺度的标准化(scale based normalization,SCBN)方法。我们将SCBN方法与现有的不同物种的标准化方法(Median method)进行了比较,模拟结果显示SCBN方法在多种情况下比Median方法表现得更好。此外,我们还分析了人类及小鼠的实际数据,得到的结果同样也说明了SCBN方法优于现有的方法。最后,为了实际应用的需要,我们开发了名为SCBN的R包,目前可以在Bioconductor网站下载使用。
其他文献
普鲁兰酶属于脱支酶的一种,其可以高效并且专一的的切开支链淀粉中的α-1,6-糖苷键,从而切下支链淀粉的整个支链,形成直连淀粉。这个特点决定了普鲁兰酶蛋白在以淀粉为原料的的工业生产活动中,不管是单独使用还是配合其他淀粉酶共同使用,在降低淀粉质类原料的使用量、降低生产成本、减少废弃尾物,保护环境方便具有很高应用价值。与普鲁兰酶高的应用价值不相匹配的是其较高的酶产品的价格,由于普鲁兰酶是淀粉酶类中唯一一
无人机出色的机动性使得它在越来越多的领域得到广泛应用,但飞行功耗大以及有限的电池容量导致其续航能力不足,无法去执行需要长时间或者远距离飞行的任务。另一方面,随着城
岩石是一种由多种矿物组成的天然非均质材料,矿物细观力学特性对岩石宏观力学行为有重要影响。矿物力学性质的不均匀性和岩石细观结构发育程度的不同,是岩石宏观力学性质表现
BiFeO3(BFO)作为多功能材料和器件的应用基础,其具有室温下的铁电、铁磁性。然而高泄漏电流、大矫顽场已经成为技术发展应用的障碍。离子掺杂已经被证明可以改善泄漏电流。构
红茶菌是以茶糖水为发酵基质,经醋酸菌、酵母菌和乳酸菌等天然存在的混合菌群发酵而成的饮料,包含菌液和菌膜两部分。本研究利用宏基因组技术准确掌握红茶菌发酵过程中微生物
随着Web技术的发展,互联网中每时每刻都在产生着大量的数据,如何从这些数据中挖掘出有价值的信息和规律无疑是一个研究热点,但数据中混杂的异常数据严重影响着数据的挖掘质量。不仅如此,异常数据往往还代表着可能存在的安全威胁,其本身也存在着待挖掘的价值。为了提高应用系统的安全性和数据挖掘的质量,如何从大量数据中发掘异常信息是一个亟需解决的问题。在离线环境下,现存的异常检测技术面对现实环境中无标签的真实数据
目前,我国铁路混凝土桥涵设计仍采用容许应力法和安全系数法,虽然早在上世纪末我国对铁路桥涵的极限状态和可靠度设计方法进行了研究,并颁布了《铁路工程可靠度设计统一标准
近年来,工业快速发展伴随的水体污染愈发严重,尤其是重金属无法被微生物分解,其在环境中的长期积累,对我们的生存环境及生命健康造成了极大的危害,其中Cr(Ⅵ)被视为最具毒性的
目的:原发性开角型青光眼(Primary Open Angle Glaucoma,POAG)是一种由遗传因素和环境因素共同作用的、复杂的多基因遗传异质性疾病。以往通过全基因组关联研究(Genome-wide association study,GWAS)发现生长停滞特异性7基因(Growth arrest specific 7,GAS7)、SXI同源框1-6基因(SIX homeobox 1-6,
背景:脓毒症是一种威胁生命的器官功能障碍,由宿主对感染的反应失调引起。脓毒症是全世界婴儿和儿童死亡的主要原因,消耗着大量的医疗资源。但脓毒症背后的确切病理生理学机制仍未完全阐明。糖皮质激素目前被推荐用于有液体或儿茶酚胺抵抗的难治性休克的脓毒症患儿的辅助治疗,但安全性和有效性尚存在争议。目的:系统评价糖皮质激素辅助治疗儿童脓毒症,能否改善脓毒症患儿的病死率、院内感染率,减少住院时间、PICU住院时间