基于元数据的Spam APP检测与研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：ahphone

【摘要】

：

近些年来,由于Android平台的开放性和易用性,基于Android的智能手机受到越来越多的消费者的青睐,越来越多的开发者转向了Android应用的开发。一些企业、团体或者个人为了推广

【作者】

：

司帅帅

【出处】

：

上海交通大学

【发表日期】

：

2004年期

【关键词】

：

spam app 决策树随机森林支持向量机 Boosting

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近些年来,由于Android平台的开放性和易用性,基于Android的智能手机受到越来越多的消费者的青睐,越来越多的开发者转向了Android应用的开发。一些企业、团体或者个人为了推广自己的app,会向应用市场上传多个功能类似的app或者为其应用添加一些不相关的描述信息和关键字以提高被搜到的概率,还有一些恶意攻击者通过向一些流行的应用中添加自己的一些侵犯用户隐私的代码,然后重新上传到应用市场。由于应用市场对上传的app不仅缺乏有效的检测,而且上传门槛较低,所以不法分子利用相关的漏洞上传一些spam app。这些spam app不仅降低了用户的使用体验,还加重了应用市场工作人员的负担。Spam app有很多比较明显的特征,例如,没有特定的功能、不相关的app描述信息、不相关的关键字、功能相似的应用等等。应用市场工作人员通过人工的方法按照spam app鉴定规则检测app,并删除被鉴定为spam的app,这种方法效率低下,不能及时的发现并删除spam app。本文设计了一种新的spam app检测方法,同时采用了不同的分类器模型进行实验,并分析比较了分类器模型的性能差异及原因。实验中,spam app检测的精确度、准确率和召回率均取得很好的结果。本文首先采用一些比较明显的特征作为监测点,并且收集了前人实验用到的数据集,然后分别采用了决策树、支持向量机、随机森林和boosting分类器模型进行实验。决策树分类器模型以其可读性好,有助于人工分析,效率高,一次构建反复使用等优点被广泛采用;支持向量机在解决小样本、非线性及高维模式识别中表现出许多特有的优势;随机森林是利用多棵树对样本进行训练并预测的一种分类器,其输出结果是由个别输出结果的众数决定的,Boosting算法是把若干个分类器整合到一个分类器的方法。最后取得比较好的实验结果,对比了不同分类器模型实验结果的差别,并分析了实验结果优劣的原因。本论文一方面证明了论文中选用的特征的有效性与正确性,另一方面利用我们设计的分类器模型可以很好的检测spam app。

其他文献

肺癌胸腔积液中挥发性有机物的SPME-冷阱聚焦-GC/MS分析研究

胸腔积液是机体内多种疾病在胸膜上的反映,主要由肺部病变直接产生,是肺部疾病患者最为特异的人体体液,与疾病发展密切相关。其中,50%左右的肺癌患者在其发病过程中都会伴随

学位

气相色谱/质谱法固相微萃取冷阱聚焦挥发性有机物胸腔积液肺癌

传递签名的两类扩展形式及应用研究

图状结构可以用来描述大数据等复杂环境中实体间的关系。其中,很多图满足“传递”的性质。传递签名作为同态签名的一种特例,可以用来认证动态增长且传递封闭的图状结构,在军

学位

图状结构传递签名代理签名广义指定验证者传递签名隐私

Ⅰ至Ⅲ级胆管切开联合输尿管硬镜钬激光碎石在弥漫型肝胆管结石的临床应用

背景:肝胆管结石病是我国常见的多发病,而弥漫型肝胆管结石病情更复杂,病变部位广泛,常伴随Ⅰ至Ⅲ级胆管狭窄、肝实质纤维化、肝脏形态比例失调、肝门内陷、结石弥散分布,导

学位

Ⅰ至Ⅲ级胆管输尿管硬镜钬激光弥漫型肝胆管结石

基于单目视觉/惯性传感器的室内自主导航与定位技术研究

室内导航一直是导航领域研究的热点之一。室内环境下,GPS定位技术受信号遮挡影响而无法工作。因此,作为其替代的室内导航方案需要能适应各种复杂的室内环境。惯性导航与视觉

学位

单目视觉惯性导航卡尔曼滤波组合导航

《内蒙古生活周报》（2013-2018）新闻照片研究

《内蒙古生活周报》是我国唯一一个以少数民族语言出版的生活类报纸。2013年改版的《内蒙古生活周报》把报纸和杂志的特点相结合,装订成有独立封面的彩色版本,其中新闻照片作

学位

《内蒙古生活周报》新闻照片研究

热化疗对口腔鳞癌细胞CRT及HMGB1表达影响的实验研究

研究目的:探究热疗（hyperthermia,HT）联合平阳霉素（pingyangmycin,PYM）化疗对口腔鳞癌CAL27、SCC-15及Tca8113细胞凋亡、细胞膜表面钙网蛋白（calreticulin,CRT）表达及高迁移率族蛋

学位

口腔鳞状细胞癌热疗热化疗钙网蛋白高迁移率族蛋白B1

基于代理模型的软件体系结构层性能优化

在软件体系结构(SA)设计阶段进行性能评估可以尽早的发现性能问题,进而可在软件生命周期的早期达到性能优化的目的。针对传统应用SA层性能优化,人们已经提出了基于规则和基于

学位

软件体系结构性能优化云应用代理模型

九世班禅出藏和返藏研究（1923-1937）

1923年末,九世班禅秘密逃出西藏,进入内地,令国人看到了解决西藏问题的希望。国内各大报纸追踪报道了九世班禅的行踪。旅京川藏士绅和国会藏籍议员,热议西藏问题,并联名“上

学位

九世班禅“出藏”“返藏”舆情

亲环素J的表达水平与结直肠癌临床特征及预后的相关性研究

目的:结直肠癌(Colorectal Cancer,CRC)是目前我国发病率较高的恶性肿瘤之一,它起病隐匿,早期症状无特异性,晚期的患者预后较差,死亡率逐渐上升,严重影响了我国居民的生命健

学位

结直肠恶性肿瘤总生存期亲环素J预后

机械性创伤对SD大鼠盲肠黏膜的损伤及GLP-2对其的保护作用

实验目的:中重度的机械创伤(Mechanical trauma,MT)可以引起心肌细胞凋亡从而造成心脏功能降低,很多研究表明MT可以导致机体强烈的氧化应激反应和大量细胞炎性因子的释放。创

学位

机械性创伤盲肠黏膜损伤GLP-2

基于元数据的Spam APP检测与研究

其他学术论文