论文部分内容阅读
随着计算机技术和生物医学技术的不断发展,积累了大量的生物医学数据,这些数据数量巨大、类型繁多,价值密度低,但是其中蕴含的价值不可忽视。从生物数据的这些特性可以看出,文字很难描述它们之间的复杂关系,所以,数据可视化对生物数据的分析至关重要。通过对数据可视化的研究,不仅可以对生物数据进行直观和交互性的展示,而且还能够揭示出数据之间复杂的关联关系,这将有利于科研人员对复杂数据进行多角度观察并获取有效信息。从最简单的Excel电子图表、Matlab到R等统计编程架构,到Cytosacpe等可视化的开源软件,再到Cytoscape.js和D3.js等网页可视化的程序包,这些通用数据可视化工具都可以为生物医学数据分析和信息挖掘提供良好的技术支持。本文的主要内容是应用JavaScript开发的开源的D3.js程序包对中药化学成分靶蛋白富集的生物通路网络进行动态交互的网页可视化处理。中药化学成分靶蛋白富集的生物通路网络的交互式可视化处理,就是通过整合化学、药学、疾病、生化反应、基因/蛋白质、生物通路等数据库,实现中药?化学成分?靶蛋白?富集的生物学通路的一站式分析,并通过浏览器给出可视化的生物通路网络。总共包括三个部分:(1)数据库的构建:化学、药学、疾病、生化反应、基因/蛋白质、生物通路等数据库的下载、理解、数据格式转换。(2)算法的设计和实现:主要通过超几何分布算法的设计和代码实现,完成中药化学成分靶蛋白富集的生物通路的分析。(3)生物通路网络网页的可视化实现:生物通路网络网页的可视化实现需要数据驱动文档(Data-Driven Documents),通过JavaScript库文件D3.js加载JSON数据,创建SVG(可缩放的矢量图形)对象,调用D3.js的函数为节点或边添加样式、事件监听器和布局等,生成动态的可交互的图形。该矢量图形的浏览器加载可实现中药化学成分靶蛋白富集的生物通路网络的可视化。