论文部分内容阅读
在矿产资源预测研究中,地学大数据信息反映地质样品的原始空间状态,直接计算样品问亲近关系往往存在偏差,应对变量空间进行重新标度。在对样品单元(己知、未知)全部赋予定性变量条件下,通过构建新的组合匹配系数,并使之与样品在最大相关准则下,寻求最佳空间维数下的样品标度,依此作为样品的空间预测标准。所谓地学大数据在定义上区别传统地质变量,前者是将通过获取手段集成的全部地学数据集合,这些数据除去大数据所具有的4"V"特性外,严格不同的是地学数据具有多元性、异构性、周期性与广延性四大特征,因此,地学大数据所代表的地质时空演化过程是地壳动力学系统或地质作用行为产生的数据集合;而后者是指通过人工或定量筛选办法,在地学数据中掘取典型有代表意义的地质标志集合,一般情况下不具备上述四大典型特征。根据大样本空间下的大数据集合建立定量模型,需有效的进行大数据同化整合,使之成为不同尺度、不同分辨率下的广义相似模型,为此,首先进行大样本容量下的大数据广义相似性融合分析,通过所谓空间匹配性度量实施广义相关分析,从而对大样本给出某正交空间下的最小维数度量,同时定义最小维数标度之间的马氏距离,进行大样本的正交空间分类,依此进行空间预测。上述最小维空间标度相当于对大样本容量下通过大数据融合处理进行空间压缩,用独立因子空间表达大数据向量空间,其所用的正交子空间可通过斜交变换形成相关子空间,更加贴近数据自然模型。在矿产资源预测中,依大数据特征将全部样品单元进行数字分类,并依分类特征实施空间预测不失为一种行之有效的预测方法,尤其是大比例尺的矿产资源预测过程,地学数据的观测尺度与学科类型之间不可机械罗列叠加,需经融合处理方可应用于模型外推,上述定量预测方法可作为一种尝试性的研究案例。