论文部分内容阅读
集值或区间值数据在现实生活中是比较常见的.例如在医学影像学检查中,得到的病灶图像通常是平面图形,这可以看成R2中的闭集合.又如在股票和期货市场中,作为用于决策的重要工具,K线图是一个包含了当日开盘价、最高价、收盘价和最低价的区间.另一方面,由于系统复杂性使得数据是某个范围而不是实值数据,例如让专家预估中国明年的经济增长率,专家们往往会给出3%到6%,3.5%到5.7%这样的区间值数据.由于集值或区间值数据广泛存在,建立集值或区间值的统计模型,并进行数据分析、推断和预报很有必要.本学位论文主要研究集值数据与区间值数据的若干统计模型,包括区间值和集值的非参数回归模型、带约束的区间值线性回归模型、区间值时间序列模型以及多元集值时间序列.具体研究内容概括如下:关于区间值和集值的非参数回归模型,首先讨论响应变量和解释变量均为区间值的非参数回归模型,通过区间的中心和半径建立模型,然后使用基函数进行估计并推导估计的渐近性质,数值模拟与实证分析验证模型与估计方法可以较好地拟合一类数据.接下来讨论响应变量为实值,解释变量为集值的非参数回归模型,将集值的dp距离与非对称核函数相结合,给出由集值空间投影到实数域的未知泛函的估计,并推导估计的渐近性质,数值模拟与实证分析验证模型与估计方法的有效性.对于带约束的区间值线性回归模型,通过区间的左右端点建立响应变量带约束的二维线性回归模型.为解决模型中出现的有偏性和异方差问题,提出三步估计方法,通过误差协方差矩阵的估计给出加权最小二乘估计.理论与数值上的结论均显示出所提出的估计方法更有效.关于区间值时间序列模型,首先给出广义区间值高斯随机变量的定义,并进一步讨论在两个不同假设下的广义区间值高斯白噪声过程.然后基于误差的中心和半径服从某一分布的假设下,讨论区间值自回归-移动平均模型,并给出模型的估计、识别、预测和诊断的方法,数值模拟与实证分析验证模型与估计方法的有效性.接下来讨论约束条件的区间值自回归模型,并给出这个模型的三步估计及其识别、预测和诊断的方法,数值模拟与实证分析验证所提的估计方法更有效.对于集值多元时间序列,主要给出一些初步理论与基础概念.首先给出集值向量与集值随机向量的定义及性质.然后给出集值多元时间序列及其平稳性的定义,并给出平稳的集值多元时间序列的期望向量、交叉协方差阵和交叉相关阵的定义及性质,以及最优线性预测.最后讨论区间值多元自回归模型及其估计,模拟研究与实证分析验证该模型及估计方法的合理性.