论文部分内容阅读
背景数据挖掘技术是将计算机应用及数据管理分析技术相结合的一门技术,可实现从大量研究信息中准确分析出其难以察觉的特点和隐藏的规律,现在该技术已被越来越多的引入到中医领域,由于中医处方中病人的表症各有不同,分型各异,涉及到的药物种类繁多,根据传统的研究方式,很难从数目巨多的方案中发现其中的规律和关联性,对疾病诊治的改进具有一定局限性,而现在可以通过数据挖掘技术将大量处方汇总分析,挖掘出隐藏的特点,规律和关联性,再结合中医症候和经验,可将诊疗方案进行改进,从新的角度来分析和诠释中医诊疗理论和经验,提高患者的诊疗效果,使患者受益。肺癌从中医的角度分析其病因是人体气滞血瘀,痰热湿毒等结于肺,进而出现咳嗽,出血,胸痛等相关症状。中医上肺癌通常是以患者所属的证型进行辩证整体治疗,但正因为中医治疗观念的整体性,多靶点性,不精确性,不定量性,使其难以像西医那样实现可预估的精准治疗,因此,运用现代先进的数据挖掘及分析手段,对传统中医治疗方案进行汇总分析,找到其治疗的共性和个性,加以分析,对中医治疗方案进行改进,对中医临床诊疗水平的提高有十分重大的意义。目的通过应用数据挖掘技术分析近年来我院诊治的肺癌处方,旨在从中发现出用药特点,组方规律以及挖掘出新方组成,并挑选其中的新处方通过肺癌动物模型对新处方的有效性及抑癌率进行验证,为中医临床肺癌的诊治提供合理的理论依据和数据支持。研究方法第一部分1病例收集本研究采用回顾性研究方法,所有病例均来自2011年12月—2014年12月,本院肿瘤科及中医科诊治的肺癌患者,共收集98例患者,121张处方。2患者纳入标准(1)患者个人信息、疾病信息、处方用药信息记录完整的。(2)患者符合西医肺癌诊断标准,症状、胸片、CT、MIR、病理等检查均确诊为肺癌。(3)患者症状表现、脉象体征、舌象、辩证等均符合肺癌中医诊断标准。(4)既往治疗史(包括是否手术、放化疗情况及用药情况等)信息完全。(5)就诊回访次数达到三次以上,经过治疗后,有较明显的症状减轻或检查显示好转。3患者排除标准(1)临床诊断不明确,如临床分期不明或病理类型不明确者。(2)有其他恶性肿瘤转移至肺部的患者。(3)合并或既往史有其他恶性肿瘤的患者。4处方纳入标准(1)入选方剂须是针对肺癌设计的方药。(2)治疗方法以中药为主,包括术后配合其他补助疗法,如化疗、放疗期间的配合用药。(3)中药复方务必药味完全,药量准确,主治明确,疗效确实。(4)因症状而作的加减用药,在统计范畴内。5处方排除标准(1)药味不全、有方无药或方剂重复。(2)疗效不确切。(3)无证候。(4)没有药物剂量或剂量不准确的。6数据录入及数据库建立通过 Exce12010、中医传承辅助平台(Traditional Chinese medicine inheritance auxiliary platform,TCMISS)(V2.5)(该软件由中国中医科学院中药研究院提供)等软件将所收集的患者的姓名、性别、年龄、分次就诊日期、疾病诊断及分型、中医辨证、处方数目及用药等信息统一字段后分别录入。数据输入的规范标准参照:药物名称参照《中药学》及《中华本草》;中医症状及诊断参照2008年版《肿瘤中医诊疗指南》。建立数据库,且由两名专业技术人员分别审核数据,保证录入信息准确无误。7数据分析通过“TCMISSV2.5系统”中“数据分析”功能,通过其模块中“方剂分析”功能,进行用药规律分析:①频次统计:将方剂中药物出现频次从高到低排序;②组方规律:将支持度设为40%(96则处方中至少出现38次),置信度设为0.95,进行组方规律分析;③新方分析:将相关度设为8,惩罚度设为2,进行聚类分析,然后点击“提取组合”按钮发现新组方,进行数据挖掘,分析药物频次,将结果导出至Excel文件。第二部分1建立肺癌模型将5只Lewis肺癌荷瘤种鼠,脱颈处死,完整剥离出肿瘤,剪成碎块,按照肿瘤组织1,无菌生理盐水3的比例混合均匀,研磨成混悬液,经粗滤后离心,去除上清液,剩余内容物经台盼蓝染色后,调整活细胞浓度至2 ×106/mL,接种到C57BL/6J小鼠的两侧前肢腋下,0.2mL/只。2制备中药汤剂常规中药组方:黄芪30 g,南北沙参各15 g,天麦15 g,天冬15 g,桑白皮10 g,制首乌15 g,枸杞15 g,生牡蛎(先煎)30 g,浙贝10 g;肺癌新组方1:桑白皮10g,黄芪30g,五味子15g,制半夏15g,川贝母30g,枇杷叶15g,茜根10g,三七15g,山药15g,丹参15g,仙鹤草10g;将上述组方中的药材用蒸馏水浸泡1h,大火煮沸5min后,转小火慢煮30min,倒出药汁并过滤,第二次加入蒸馏水,大火煮沸5min后,转小火慢煮30min,倒出药汁并过滤,与第一次倒出的药汁混合,制成浓度为3.25g/ml的药液。3动物分组及药物干预将30只接种过肿瘤细胞的C57BL/6J小鼠按照区组随机化方法分为模型组、常规组方组、新组方组,每组10只。常规组方组:于造模后第5天开始每日一次按照0.2ml/20g体重的标准用浓缩后的常规组方药液给小鼠灌胃,连续12天。新组方组:于造模后第5天开始每日一次按照0.2ml/20g体重的标准用浓缩后的新组方药液给小鼠灌胃,连续12天。模型组:于造模后第5天开始每日一次按照0.2ml/20g体重的标准用无菌生理盐水给小鼠灌胃,连续12天。4取材及标本制备于最后一次给药的后一天,颈椎脱臼处死各组小鼠,剥离出肿瘤组织,称取瘤体重量后,计算肿瘤抑制率,将组织取一半放入福尔马林中固定,另一半投入液氮中备用。抑制率(IR)=(肿瘤模型组平均瘤重—实验组平均瘤重)/肿瘤模型组平均瘤重 ×100%5病理切片染色瘤体组织包埋成蜡块,切成5um厚的切片,各组取3张切片进行HE染色,于光学显微镜下观察。6免疫组织化学法检测肿瘤组织中Ezrin蛋白、HSP70蛋白及PRDX1蛋白的表达各组取3张切片进行免疫组化实验,在光学显微镜下观察(400X),用Biosens Digital Imaging System v1.6测定观察区域阳性细胞积分光密度值(IOD)。7 逆转录聚合酶链反应法(reverse transcription polymerase chain reaction,RT-PCR)检测肿瘤组织中EzrinmRNA、HSP70mRNA及PRDX1mRNA的表达将冻存管中的肿瘤组织投入液氮研碎,Trizol提取总RNA,行逆转录反应。取5ulPCR扩增产物进行琼脂糖凝胶电泳,进行灰度扫描分析,目的基因EzrinmRNA的表达量是EzrinmRNA与β-actin的PCR条带灰度值之比,HSP70mRNA的表达量是HSP70mRNA与β-actin的PCR条带灰度值之比,PRDX1mRNA的表达量是PRDX1mRNA与β-actin的PCR条带灰度值之比。8数据处理及统计学方法用SPSS 20.0统计分析,计量资料以均数±标准差(x±s)表示。多组间差异采用单因素方差分析方法,统计前首先对各个检测指标数据进行正态性检验和方差齐性检验;方差分析有差异时,则进一步采用LSD-t法进行两两比较,P小于0.05为有统计学差异。结果1.经过纳入和排除标准的筛选,共纳入患者64例,处方96张,年龄<40岁的患者例数所占比例为3.13%,40-50岁患者例数所占比例为12.5%,50-60岁患者例数所占比例为39.06%,60-70岁患者例数所占比例为32.81%,70-80岁患者例数所占比例为9.37%,>80岁患者例数所占比例为3.13%,占比最高的为50-60岁年龄层,占比最低的为<40岁及>80岁的年龄层。2.64例患者中分期为0期的有6例,占比为9.37%,Ⅰ期的患者有19例,占比为29.69%,Ⅱ期的患者有28例,占比为43.75%,Ⅲ期的患者有10例,占比为15.63%,Ⅳ期的患者有1例,占比为1.56%,占比最高的为Ⅱ期患者。3.64例患者中气滞血瘀证有5例,占比为7.81%,肺脾气虚证有8例,占比为12.50%,痰热阻肺证有10例,占比为15.63%,气阴两虚证有11例,占比为17.18%,肺阴虚证有6例,占比为9.37%,气虚痰湿证有9例,占比为14.06%,阴虚内热证有8例,占比为12.50%,热毒炽盛有7例,占比为10.75%,占比最高的为气阴两虚证。4.96张处方中共有121种药物,其中频次≥30的药物共计21味,丹参89次,党参88次,黄芪88次,当归86次,茯苓84次,白术81次,牛膝77次,蛇舌草77次,麻黄75次,白芍73次,杜仲73次,制半夏71次,五味子67次,香附62次,太子参58次,川贝母55次,延胡索53次,杏仁51次,莪术48次,麦冬47次,桑白皮44次,使用频率前三的为丹参,党参,黄芪。5.将“支持度”设置为40%,“置信度”设为0.95时,出现频次高于38次的药物组合有18对,包含8味核心药物,分别为丹参、黄芪、白术、当归、牛膝、制半夏、麻黄、川贝母。丹参-白术74次,党参-黄芪72次,黄芪-茯苓68次,当归-黄芪66次,茯苓-麻黄63次,白术-当归62次,牛膝-丹参62次,制半夏-黄芪60次,麻黄-白术57次,川贝母-黄芪54次,丹参-牛膝53次,制半夏-川贝母51次,五味子-当归51次,制半夏-当归49次,太子参-丹参47次,川贝母-麻黄44次,延胡索-黄芪42次,白术-麻黄41次。6.据方剂的数量,经由不同参数提取出数据的预读相结合,设置相关度为8,惩罚度为2,进行聚类分析,得到治疗方剂中121味中药两两药物间的关联度,关联系数前15的药对为茯苓-黄芪,麻黄-黄芪,牛膝-丹参,当归-白术,茯苓-党参,黄芪-当归,黄芪-白术,制半夏-白术,麻黄-丹参,牛膝-黄芪,丹参-川贝母,当归-川贝母,麻黄-制半夏,当归-制半夏,白术-五味子。7.以改进的互信息法的分析结果为基础,按照相关系数和惩罚系数的约束,基于复杂系统熵聚类,演化出4-7味药的核心组合,共计15个,茯苓-黄芪-鱼腥草-鸡内金,麻黄-柴胡-陈皮-黄芪,杏仁-鸡血藤-牛膝-丹参,制半夏-石斛-当归-白术,三七-仙鹤草-茯苓-党参-夏枯草,生龙骨-莪术-黄芪-当归-三棱,黄芪-白术-紫苑-石斛-制半夏,乳香-槟榔-莪术-制半夏-白术,麻黄-紫苑-款冬花-半枝莲-丹参,牛膝-蛇舌草-半枝莲-藿香-厚朴-黄芪,生牡蛎-生龙骨-三棱-莪术-丹参-川贝母,莪术-三棱-紫苑-款冬花-蛇舌草-当归-川贝母,厚朴-蕾香-黄芪-当归-桑白皮-麻黄-制半夏,延胡索-香附-夜交藤-茯神-桑白皮-当归-制半夏,黄芪-柴胡-丹皮-麦冬-天冬-白术-五味子。8.在以上核心组合提取的基础上,应用系统集成的“聚类”“提取组合”功能,通过无监督的熵层次聚类算法,得到3个新组方,组方1:桑白皮,黄芪,五味子,制半夏,川贝母,枇杷叶,茜根,三七,山药,丹参,仙鹤草;组方2:黄芪,桑白皮,杏仁,制半夏,白芥子,薏苡仁,茯苓,香附,陈皮,白芍,延胡索,牛膝,杜仲,三棱,莪术,桑寄生,蜈蚣,全蝎;组方3:黄芪,五味子,太子参,款冬花,紫苑,川贝母,前胡,枇杷叶,杏仁,枳壳,蛇舌草,半枝莲,莪术,三棱,丹参,生龙骨,生牡蛎,鳖甲。9.实验验证结果显示,模型组平均肿瘤重量为(6.75± 1.04)g,高于常规组方组和新组方组(P<0.05),常规组方组平均肿瘤重量为(5.86±0.86)g,高于新组方组(平均瘤重为4.95±0.62g)(P<0.05);常规组方组肿瘤抑制率为13.18%,新组方组肿瘤抑制率为26.67%,高于常规组方组(P<0.05)。10.模型组切片视野中肿瘤细胞呈密集分布,坏死区域较少;常规组方组切片视野中肿瘤细胞密度较模型组低,坏死区域增多;新组方组切片视野中肿瘤细胞相对最少,坏死区域最多。11.显微镜视野下,模型组视野中可见大量Ezrin阳性细胞,且Ezrin的IOD值为(12.41±2.77),表达水平高于其他两组(P<0.05);常规组方组视野中可见少量Ezrin阳性细胞,Ezrin的的IOD值为(8.36±1.25),表达水平高于新组方组(IOD值为6.03±1.04)(P<0.05);此外,模型组条带颜色最为明亮,EzrinmRNA转录水平为(14.28±2.76),均高于常规组方组和新组方组(P<0.05),常规组方组条带颜色稍显暗淡,EzrinmRNA转录水平为(10.25±2.11),均高于新组方组(P<0.05),新组方组条带颜色最为暗淡,EzrinmRNA转录水平为(7.30±1.62),低于其他两组(P<0.05)。12.显微镜视野下,模型组视野中可见大量HSP70阳性细胞,且HSP70的IOD值为(1.86±0.33),表达水平高于其他两组(P<0.05);常规组方组视野中可见少量HSP70阳性细胞,HSP70的的IOD值为(1.24±0.27),表达水平高于新组方组(IOD值为0.52±0.21)(P<0.05);此外,模型组条带颜色最为明亮,HSP70mRNA转录水平为(6.88±1.26),均高于常规组方组和新组方组(P<0.05),常规组方组条带颜色稍显暗淡,HSP70mRNA转录水平为(4.37±0.94),均高于新组方组(P<0.05),新组方组条带颜色最为暗淡,HSP70mRNA转录水平为(1.95±0.42),低于其他两组(P<0.05)。13.显微镜视野下,模型组视野中可见大量PRDX1阳性细胞,且PRDX1的IOD值为(0.88 ±0.05),表达水平高于其他两组(P<0.05);常规组方组视野中可见少量PRDX1阳性细胞,PRDX1的的IOD值为(0.61±0.03),表达水平高于新组方组(IOD值为0.37±0.02)(P<0.05);模型组条带颜色最为明亮,PRDX1mRNA转录水平为(9.30±2.16),均高于常规组方组和新组方组(P<0.05),常规组方组条带颜色稍显暗淡,PRDX1mRNA转录水平为(7.48±1.92),均高于新组方组(P<0.05),新组方组条带颜色最为暗淡,PRDX1mRNA转录水平为(5.02±1.33),低于其他两组(P<0.05)。结论1.数据挖掘技术可挖掘出肺癌组方的用药特点,组方规律。2.通过数据挖掘得到了 3条诊治肺癌的新组方。3.新组方1可降低肺癌小鼠的肿瘤重量和提高肿瘤抑制率。4.新组方1可降低肿瘤肺癌小鼠肿瘤组织中Ezrin、HSP70、PRDX1蛋白和基因的表达,其肿瘤抑制作用可能与此相关。