分享到:

基于熵相关系数的关联性自动判别方法——COCA

数据库自管理、自调优中查询计划的自动优化是目前的关注热点。为保证优化器估值精度,用统计学方法,给出了一种基于熵相关系数的对字段关联性的自动判别的新算法———COCA。该算法有下列特点:(  (本文共4页) 阅读全文>>

《西南石油大学学报(自然科学版)》2010年06期
西南石油大学学报(自然科学版)

相关系数的意义

相关系数是衡量观测数据之间相关程度的一个指标,一般情况下,相关系数越大表明相...  (本文共1页) 阅读全文>>

北京交通大学
北京交通大学

基于距离相关系数的分层聚类法

随着大数据时代的到来,各个领域涌现出海量数据且结构复杂,如变量的维数不同、尺度不同等.而现实中变量之间往往存在着不确定关系,经典的Pearson相关系数仅能反映两个同维变量间的线性相关关系,不足以完全刻画变量间的相关关系.2007年Szekely等提出的距离相关系数则能描述不同维数变量间的非线性关系尤其是变量间的独立性.为了探索变量之间复杂的内在联系,本文仿照最大系数法的思想,用距离相关系数替换其中的相关系数刻画变量间的相似性,首先提出了最大距离相关系数法对变量聚类,且该方法有超度量性质和空间收缩性质.为充分发挥距离相关系数可用于计算不同维数变量的优势,对上述方法改进得到类整体距离相关系数法.该方法在刻画两类间相似性时,将每类中的所有变量合并成一个整体,再计算这两个不同维数的整体间的距离相关系数作为两类间相似性的度量,且该方法有顺序可交换性质.最后,将类整体距离相关系数法应用到几个实际问题中,验证了算法的有效性.  (本文共51页) 本文目录 | 阅读全文>>

南昌大学
南昌大学

几类拓广犹豫模糊集的相关系数及其应用

由于很多内部和外部因素的影响,因此在决策过程中决策者如果仅仅利用犹豫模糊集,则很难做出合理且准确的判断.为了处理这种情况,近年来很多学者致力于研究一些拓广犹豫模糊集理论,并且将这些理论应用于医疗诊断,人事评估,信息检索等诸多领域.本文的主要研究对象为几类拓广的犹豫模糊集.主要研究内容和创新性工作如下:第一章本章介绍了本文的选题背景,几类拓广犹豫模糊集的历史背景、研究现状和相关概念.第二章本章提出了扩张犹豫模糊元的平均值和方差,并且给出了扩张犹豫模糊集的相关系数以及加权相关系数,最后将其应用于医疗诊断的实际应用中.第三章本章提出了离散型和连续型概率犹豫模糊集的相关系数,并且定义了概率犹豫模糊元的信息能量,数学期望和方差的概念.最后将其应用于交通安全管理的实际应用中.第四章本章提出了一种新的语言犹豫模糊集的相关系数和加权相关系数,并给出了它们的一些基本性质.最后通过一个实例证明了其可靠性.第五章本章提出了概率语言犹豫模糊集的概念,定...  (本文共64页) 本文目录 | 阅读全文>>

山西大学
山西大学

类间线性与非线性相关系数的研究及应用

在大数据时代,数据具有海量性、多样性等复杂特征,数据的相关分析开始引起人们的重视。世界上任何一个事物都不可能是独立存在的,他们或多或少都有联系,而相关系数可以反映事物之间的相关程度,因此研究相关系数是非常有意义的。本文就是在大数据背景下对相关分析的进一步探究,取得如下成果:(1)相关系数的研究通常是基于普通的确定性集合,比如Pearson相关系数、偏相关系数等,对不确定性集合各元素间的相关关系研究较少。受到学者对模糊集相关系数研究的启发,把皮尔逊相关系数和粗糙集结合,开创性地提出了建立在粗糙集上的相关系数计算方法,鉴于皮尔逊相关系数的适用条件,该方法刻画的是粗糙集各等价类之间的线性相关关系。文中不仅证明了该方法的正确性,而且用实例验证了该方法的有效性。(2)传统的统计相关分析是用来刻画变量间的线性关系的,基于互信息的相关分析是用来描述两个变量间的非线性关系的,基于距离的相关分析是用来描述高维数据的非线性相关关系的。上述线性关系和...  (本文共55页) 本文目录 | 阅读全文>>

北京工业大学
北京工业大学

多元方向变量的相关性分析

本文研究了多元方向数据相关性的度量问题.方向数据在生物、医学、地质、天文、气象等领域都有广泛应用.研究问题有一定的理论意义和实用价值.本文重点研究多元方向变量的样本相关系数问题,主要是基于两变量的样本相关系数形式.通过和标准化随机变量的联系,得出多个变量的相关系数.根据相关系数和内积矩阵的关系,通过内积矩阵行列式给出相关系数的定量估计,以及通过分析内积矩阵的性质进而给出多变量样本相关系数的性质.完善方向数据的多元相关性度量.对于两个相关的方向变量,利用非三角函数给出了其连接函数.根据连接函数的性质,从分布角度度量了两个方向变量的相关结构.明确表示出了变量相关性在联合分布中的具体体现形式.同时也说明了非负三角函数和分布族在方向数据的应用中更具实用性.为进一步验证及检验多变量方向数据的样本相关性.从国际浮标中心网站上获取了浮标的风向数据,从西班牙北部观测站获取了风向和降雨量数据.利用R语言计算样本数字特征,检验均匀性,展示其分布形式...  (本文共56页) 本文目录 | 阅读全文>>