结合PCA的混合机器学习方法对4FGL中的BCU进行预测

来源 :广州大学 | 被引量 : 0次 | 上传用户:crazy5555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Fermi卫星巡天的进展,越来越多的活动星系核被发现。作为活动星系核的一个特殊的子类,耀变体具有与一般天体不一样的物理性质。耀变体的喷流方向几乎直接面对着观测者,因此能被探测到很强的辐射流量。在这种表现为强流量的天体中,天文学家们观测到了很多极端的观测性质。耀变体一直是天文学中的一大研究热点,而对其进行分类是进行进一步研究的必要前提。目前,对于类星体的分类仍存在较多方法。当前比较常用的方法是利用光学光谱将耀变体分成蝎虎天体(BL Lac)和平谱射电类星体(FSRQ)两个子类。受观测限制,部分耀变体难以获得其光学光谱,定义为待定分类的耀变体(Blazar Candidate of Uncertain type,BCU)。我们尝试利用有监督的机器学习方法其进行分类,但计算耗时十分长。为了减少参与运算的指标数,我们计算了各个观测指标对分类的贡献程度,结果和前人们的工作都不尽相同,于是尝试着利用几种机器学习结合主成分分析(Principal Component Analysis,PCA)的方法,计算出原始数据中的主成分个数,从而作为剔除无关指标的参考。在经过PCA算法后,我们将PCA给出的参数空间中14个指标降至6个,通过降低指标数来尝试减少引入的偏差。结果模型正确率普遍提高,调整参数的耗时普遍下降。其中5种机器学习的模型中,神经网络的模型正确率最高。我们利用这种方法对待定分类的耀变体做了分类预测,结果和前人的利用其他方法得到的基本一致。最后,我们利用4FGL中已被证认的部分与预测结果进行比对。结果显示我们对3FGL中BCU的预测结果很大程度上符合4FGL数据。最后,我们利用这一验证过的方法,对4FGL中的Blazar候选体进行预测分类。并针对利用4FGL建立的机器学习模型性能进行评估:评估结果显示,我们的方法对4FGL数据建立的模型分类器有着很好的表现,分类具有较高的正确率和鲁棒性。
其他文献
人类在生产和生活中产生很多难以生物降解的有机污染物,如染料、抗生素等,由于它们在环境中存留时间长,成分复杂,可生化性差,在水体中易积累、迁移,常规活性污泥处理工艺难以将其去除。Fenton试剂(Fe2++H2O2)利用羟基自由基(·OH)降解难生化降解的有机污染物,但是Fenton方法存在p H适用范围窄、Fe(II)再生难、铁泥二次污染及H2O2利用率低等缺点。异相Fenton技术,与均相Fen
知识图谱是问答系统的数据基础,随着数据挖掘、信息采集技术的高速发展,一大批规模庞大、涵盖多个领域的知识图谱开始出现,但是足球领域的知识图谱仍然存在很大的缺口。因为足球领域的特殊性,开放域的知识图谱无法适用于足球问答任务研究,而现有的足球相关的知识图谱则因为其内容相对单一而无法满足足球问答任务的需求。因此,构建面向足球问答的知识图谱对于提升足球问答任务的效果有着重要意义。另一方面,足球领域较多地涉及
非甾体抗炎药(Nonsteroidal anti-inflammatory drugs)是一类普遍使用于治疗人体关节炎、皮肤过敏、消热消肿以及缓解术后情况下的疼痛与炎症的药物,它的治疗作用主要体现为抗炎、镇痛或解热三大方面。这类药物多数为非处方药,购买途径多样。由于人类和动物对NSAIDs的滥用,部分药物及其未代谢物会以尿液和粪便形式直接排入环境水样中。一些研究表明,环境水样中已经存在大量的NSA
目前电子商务已发展成为主流的购物方式,推荐系统的出现在一定程度上地缓解了信息过载的问题。服装作为网络购物的重要商品类别,如何实现高效的服装搭配推荐也成为产业界和学术界的热门研究内容。本文以用户个性化偏好特征分析、深度学习的特征提取、个性化服装搭配推荐技术和算法为研究内容,提出了基于用户历史记录的个性化服装搭配推荐算法。本文的主要工作包括:(1)提出了基于用户个性化特征的服装推荐算法。利用CNN对用
城市化推动人类的进步,但在城市化进程中也不断出现严峻的挑战与问题。城市水质污染、空气环境问题、气候变化、生态安全风险过高等问题不断出现。其中,随着城市化进程的不断加快,城市人口迅速增长,城市建设用地急速扩张,城市下垫面急剧改变。城市下垫面的改变,导致城市的热力性质发生变化,进而使得城市内部气候发生显著变化,城市热环境发生剧烈变化。城市热环境的危害,表现在影响城市气候,导致城市环境质量受到威胁,影响
进化算法是人工智能算法的分支,经过几十年的发展,已广泛用于计算机相关的许多方面。基因表达式程序设计(Gene Expression Programming,GEP)作为进化算法的一种,因其编码简单却能解决复杂问题的能力而受到了研究者们的广泛青睐,现已在时间序列预测、大数据分析、多目标优化等诸多领域取得了丰厚的成果。但经典的GEP算法也存在一些不足:基因型某种意义上多为随机产生,这使得种群中存在大量
交通标志检测与分类是辅助驾驶和无人驾驶系统的重要组成部分,对于减少交通事故和减少人员伤亡至关重要。传统的交通标志识别系统主要针对在良好环境条件下的交通标志图像。然而,在实际场景中,由于不利的因素,所捕捉的图像会变形和模糊。使用深度学习算法检测交通标志具有更高的准确度和检测速度,可以保证检测的实时性。随着深度学习与卷积神经网络的发展与广泛应用,一些交通标志检测与分类算法陆续被提出,但是,实际的检测效
牙隐裂的诊断问题一直以来是口腔医学界的重点难点问题。其重点在于,医病则诊断先行,没有诊断无从谈其治疗对策。其难点在于,牙齿微裂纹检测问题涉及固体力学、检测学、医学、材料学等多学科的综合交叉,需要融合多学科知识,以“多管齐下”的方式才有可能有所突破。目前常见的临床诊断手段均有一定的局限性,鉴于DIC技术的无损检测,高精度,设备系统相对简单等特点,本文提出了一种基于图像的无损检测模拟隐裂牙微裂纹的方法
社会经济的快速发展,农业、工业以及家庭用水中排入水体中的含氮污染物在不断增加,水处理工艺末端出水常面临着硝酸盐氮(NO3--N)和总氮(TN)超标问题。与其他硝酸盐氮(NO3--N)处理技术相比,电化学脱氮技术具有无需外加试剂、操作简单、环境友好的特点。但电化学脱氮技术也存在电极使用寿命短、去除效率低和能耗高等问题,难以满足实际工程应用。因此,开发高效脱氮、性能稳定、经济效益高的电极材料用于电化学
水体污染对人类健康和水生生态系统都造成了极大的威胁,是当前国际研究的热点和难点问题。多相芬顿催化技术作为一种新型高效的废水净化技术,近年来在废水处理中受到了人们的广泛关注。然而,由于多相芬顿反应需要依赖单一金属位点发生氧化还原反应来实现对H2O2的活化,导致其仍存在催化剂稳定性差,中性条件下催化活性低及H2O2过度消耗等问题。本文以水中难降解新兴有机污染物的去除为目的,针对当前芬顿反应体系的这些缺