分享到:

对几个统计模型的构造和数据分析

通常统计模型是基于现实世界的数据而构造的;这些模型然后又被用于描述产生数据的现实。数据和模型有非常密切的关系:一方面可以利用数据中所含有的信息来构造,核对和改进模型;另一方面,数据中的少数的影响点可能会严重影响建模。所以,识别并妥善处理影响点或者利用数据本身的信息重构模型估计过程往往会改进模型估计的精度。因此通过诊断手段来识别影响及根据数据的具体特征改进模型的有效性在实践中是十分重要的。基于对上述方向的兴趣,本文的主要内容可以分为识别影响点和利用数据改进模型两个方面。诊断:●识别偏最小二乘(PLS)模型的影响点:采用Wu& Luo(1993a,b)提出的局部影响二阶诊断方法。在推导出用X和Y直接表达的参数估计式,并解决了扰动后特征向量的二阶导数问题后,得到了识别多重影响点的具体公式。模拟表明该方法好于逐点删除法。●识别最小一乘(LAD)拟合的AR(p)模型中的影响点:采用的是Hampel(l974)提出的影响函数的方法,以避免破  (本文共72页) 本文目录 | 阅读全文>>

《卫生研究》1980年50期
卫生研究

强影响点的诊断

强影响点指对参数估计的稳定性及真实性具有很大影响的数据,一般用经验影响函数θ-θ(i)度量,θ-θ(i)为多维向量,为方便,常用θ-θ(i)的某种数量函数g...  (本文共3页) 阅读全文>>

云南财经大学
云南财经大学

线性模型中模型平均估计强影响点的探测

模型平均估计是一种重要的多模型推断法,通过组合不同备选模型的估计值或者预测值,以获得更稳健或者预测效果更好的估计量。模型平均估计的理论研究得到了日益增长的关注,并被广泛运用于计算机科学、经济学、医学、生物学等领域。同大部分的统计估计方法一样,强影响点的存在会影响模型平均估计的效果。因此在模型平均估计研究的背景下,研究强影响点识别的统计方法非常重要。但目前已有的统计诊断的研究通常很少考虑多模型推断的背景,少有文献研究模型平均背景下的强影响点的识别问题。本文回顾了模型平均中的权重选择法,研究了模型平均背景下的强影响点的识别,结合统计诊断中的数据删除法推广了适合模型平均背景下的Cook距离作为诊断统计量。通过模拟研究考查了所提出方法的有效性。最后,使用所提出的诊断方法分析了波士顿房价数据和汽车安全座椅数据,得到了较为合理的结论。  (本文共44页) 本文目录 | 阅读全文>>

山西医科大学
山西医科大学

医用多元线性回归方程中共线影响点的诊断

在医学研究领域中,多元回归方程往往用来反映生命现象中的科学规律。在使用通常的最小二乘估计时,共线性的出现,往往导致方程不可靠,重要的变量可能变得无统计学意义,所得的方程无法解决实际问题。特别是一些数据点可能会掩盖或诱发了共线性,称之为共线影响点。共线影响点会使最小二乘估计的回归系数与其专业解释相反,诊断这些数据点有助于建立正确的模型。本文主要是讨论如何诊断共线影响点及在这种情况下如何采用正确的回归估计方法。1.本文首先介绍了共线性的定义、来源以及诊断常用的方法,即容许值法、方差膨胀因子、以及特征根系统。其中特别介绍了特征根系统中的条件数。应用条件数和方差分解比可以发现发生在自变量空间内的共线性。2.系统地介绍异常点的来源以及常用的诊断方法,这些异常点在X和Y方向上既可单独出现,也可同时出现。其中在X空间内有些点可能造成诱发或掩盖共线性,这些共线影响点的存在往往对回归系数估计有不良的影响。3.文章还综合介绍了三种诊断共线影响点的方...  (本文共37页) 本文目录 | 阅读全文>>

《英语画刊(高级版)》2020年16期
英语画刊(高级版)

为了精通而教,而非分数(英文)

学习是一个循序渐进、不断精通所学的过程,但传统的教学模式似乎只是为了完成上课进度的"为教而教,为学而学"。我们人为地限定了学习一个知识点的时间,却忽略了这本身是个变量。在线教育平台可汗学院的创始人美国教育家萨尔曼·可汗认为,教学真正要抓住的是那个不变的量,即切实地掌握学习内容。I’m h...  (本文共3页) 阅读全文>>

《应用数学学报》2005年01期
应用数学学报

含有不等式约束的回归问题的影响分析

影响分析是回归问题中非常重要的一环,对于含有不等式约束的回归问题同样如此.对...  (本文共8页) 阅读全文>>