【摘 要】
:
LAMOST目前作为天体光谱获取率最高的天文望远镜是进行大视场、大样本天文学研究的有力工具,其最新一期释放的数据集已经超过1000万条光谱,是世界上第一个获取光谱数据超过千
论文部分内容阅读
LAMOST目前作为天体光谱获取率最高的天文望远镜是进行大视场、大样本天文学研究的有力工具,其最新一期释放的数据集已经超过1000万条光谱,是世界上第一个获取光谱数据超过千万量级的望远镜设备。本文主要针对LAMOST所获取的海量天体光谱数据,进行天体光谱自动处理算法,特别是恒星大气参数的自动测量算法方面的研究。在恒星光谱中,线指数能够较好地保留恒星的物理特征信息,利用线指数这一物理特征对恒星进行参数测量能有效解决高维光谱数据运算复杂度较高的问题。本文即是基于LAMOST望远镜观测光谱数据,采取线指数作为主要输入特征,研究分析了极端随机树(Extremely Randomized Trees,Extra-Trees)、极端梯度提升树(Extreme Gradient Boosting,XGBoost)两种集成树模型在A型恒星大气物理参数自动测量方面的应用。工作内容主要包括:(1)设计并实现了基于极端随机树模型(Extra-Trees)的恒星光谱参数测量算法。利用LAMOST-DR6中A型恒星光谱数据集进行了一系列的实验测试,详细进行了基于该算法下26个线指数与恒星有效温度、表面重力及金属丰度三个参数的相关性分析,发现不同参数对26个线指数的依赖性有所不同,本文利用该结果分别采用了相关性较大的线指数来分别测量三个参数。同时,分析了三个物理参数与峰值波长的相互作用,发现峰值波长仅可以影响恒星有效温度和金属丰度的测量精度。最终的实验结果表明,参数测量精度优于随机森林(RF)和支持向量机回归(SVR)两种常用算法。(2)设计并实现了基于极端梯度提升树模型(XGBoost)的恒星光谱参数测量算法。XGBoost算法是对传统梯度提升决策树(GBDT)算法的一个重要的改进算法,该算法能够分布式处理高维稀疏特征,具有运行速度快、准确度高、不易过拟合的优点,本文通过引入网格搜索算法对XGBoost模型的主要参数进行了参数调优。同时本文亦考虑了输出三个大气参数之间的相关性,通过实验分析得到了在进行每个参数测量时输入特征加入了另外两个输出参数的次序,这一改进能够增加测量算法的输入特征信息量。一系列设计的实验结果表明,该算法相比于Extra-Trees和传统GBDT及SVR三种算法在三个参数取得的测量精度上都得到了有效提升。
其他文献
许多数学学者在最近几年针对连通图的谱进行了大量的刻画.在已有的研究结论基础上,这篇文章主要研究了距离矩阵的最小特征值在(-2-(?),-2]中的所有三圈图,以及刻画了邻接矩阵仅有三个非负特征值的部分图.设G是一个点集为V(G)={v1,v2,...,vn}的简单无向图.D(G)=(dij)n×n是图G的距离矩阵,其中dij是vi到vj的距离,这里D(G)的最小特征值称为图G的最小距离特征值.A(G
聚合物材料具有易于合成、结构可控、便于加工等优点,为了在杂化材料中引入聚合物的优点,可以使聚合物材料与无机材料进行结合形成聚合物/无机纳米杂化材料,这样既结合了无机
随着生物柴油产业的发展,有大量的甘油作为副产物生成,为了保持甘油原有市场的平衡,如何将甘油转化为高附加值的产品,实现资源的高效利用成为了人们研究的重点。利用甘油和CO
牦牛低海拔舍饲是缓解藏区草畜矛盾的重要手段,同时也可有效解决牦牛在冷季生长发育迟缓的难题,促进肌内脂肪沉积,提高牦牛肉品质。本研究选用10头36月龄体重、体况相近的健
增材制造技术是《中国制造2025》中指出的五大核心技术之一。对于大尺寸FDM模型,由于模型接触面的面积大,打印路径长,导致在模型打印进程中的相变过程会有不均匀的温度梯度和残余应力分布,使得打印模型翘曲变形。打印模型的翘曲变形轻则会影响打印模型质量,降低打印效率,重则会导致打印模型脱离工作阀台,使得打印失败,造成大量耗材浪费。为了解决大尺寸模型接触面翘曲问题,本文进行了以下三个方面的研究:(1)分析
地震勘探领域的不断扩大、勘探地区复杂多变的地质环境、废炮废道的剔除以及各种人为因素,导致地震勘探实际采集到的数据往往是不完整的。不完整的地震数据会导致成像假频和
习近平总书记曾说过:“历史文化是城市的灵魂。”而非物质文化遗产则是一个国家和民族历史文化成就的重要标志。早在十年前的2009年6月份,张家界市委市政府就明确提出了:“全面搜集,深入研究,系统整理张家界历史文化,打造有张家界特色的文化品牌”。(1)张家界地处武陵山脉腹地,传统武术文化丰富多彩。研究传统武术文化不仅有利于提升张家界本土民族文化特色,提高经济效益,更能为中华武术添上浓墨重彩的一笔。本文通
菊花(Chrysanthemum morifolium)是我国十大传统名花之一,是有较高的观赏和经济价值。菊花的自然花期大都集中在秋季,受光周期的影响较大,且花期较集中,不能满足市场的周年均
产科电子病历作为医生全面了解孕妇和胎儿情况的主要渠道,对于提高人口的生育健康水平有着重要意义。结构化处理方案是一种对电子病历中非结构化文本进行信息挖掘的重要手段,提升了医护人员的工作效率与信息的利用程度。文本分类作为结构化功能中的关键模块,对最终结构化效果起着至关重要的作用。深度学习技术的快速发展为文本分类任务的解决带来更多可能性,研究如何将新技术与现有解决方案相结合,进一步提高现有方案的准确率,
酿酒酵母蛋白酶A是一种定位于酵母细胞液泡内的天冬氨酸蛋白酶,参与液泡内多种蛋白酶的成熟激活过程。胁迫条件下,酵母细胞中的蛋白酶A能够被分泌到细胞外。本课题对液泡分选