分享到:

隐私保护关联规则挖掘

数据挖掘研究如何从大量数据中发现潜在模式及趋势,在科学研究、医学研究及商业等领域,正得到越来越广泛的应用,具有很大的发展潜力。由于数据挖掘是发现数据中不容易发现的模式和规律,如果利用不当,可能对隐私和信息安全构成威胁。因此,如何在保证隐私的情况下挖掘出有用的信息是近年来数据挖掘领域研究的热点之一。本文首先结合数据分布方式、隐私保护目标和隐私保护技术和隐私保护的对象等多个角度,对当前流行的隐私保护关联规则挖掘方法进行了深入浅出的分析和介绍。其次,论文主要针对隐私保护关联规则挖掘提出相关的两个算法:(1)从隐私保护对象为原始数据集的角度出发,总结Rizvid提出的的MASK算法优缺点的基础上,提出了一个基于多参数随机扰动的布尔规则挖掘算法DMASK。该算法同MASK算法相比,能够按照用户对隐私关注不同设置不同的扰动参数,从而降低了隐私泄露的可能性。通过合理的参数设置同时满足挖掘结果的准确度和隐私保护度。另外,我们利用集合原理对算法实  (本文共57页) 本文目录 | 阅读全文>>

东华大学
东华大学

面向隐私保护的关联规则挖掘研究

数据挖掘目前是数据库研究中最活跃的分支之一,不论科学研究还是商业应用,数据挖掘都取得了可喜的成果。但与此同时,数据挖掘也面临着很多问题的挑战。其中,数据挖掘的个人隐私与信息安全问题尤其得到关注。误用、滥用数据挖掘可能导致用户数据特别是敏感信息的泄漏,越来越多的人们对此表示担忧,甚至拒绝提供真实的数据。如何在不暴露用户隐私的前提下进行数据挖掘,也就成了人们非常感兴趣的课题。本文针对关联规则挖掘中的隐私保护问题进行研究。首先介绍了相关背景知识,对现有的隐私保护关联规则挖掘作了分析和介绍。接着详细阐述并分析了典型的Apriori算法。以及对隐私保护关联规则挖掘算法MASK算法作了详细介绍,并且对MASK算法和Apriori算法在运行时间上作了个比较;针对MASK算法其存在的问题及其原因进行了详细分析。在此基础上,从隐私保护对象为原始数据集的角度出发,针对关联规则挖掘中如何保护隐私数据信息的问题,首先从数据存储结构角度进行改进,利用数学...  (本文共81页) 本文目录 | 阅读全文>>

河北工程大学
河北工程大学

隐私保护的关联规则挖掘在商务智能中的应用研究

随着网络贸易的飞速发展,越来越多的企业迫切需要高效、精确、安全地收集分析数据,挖掘出潜在的商机,在激烈的现代竞争中出奇制胜。面对大量分布零散、无法集中处理的数据信息和企业对信息集中整合利用的迫切需求,商务智能由此应运而生。本文分析了商务智能的研究现状,针对商务智能中的关联规则挖掘技术展开了深入研究,重点研究了多层次的关联规则挖掘和隐私保护的关联规则挖掘,以完善商务智能分析决策的准确性和安全性。本文主要内容如下:(1)针对商务智能系统的安全性和智能性问题展开深入分析,综述了商务智能、商务智能的数据挖掘技术和商务智能的隐私保护技术的研究现状。(2)介绍了商务智能的相关概念、体系结构、工作流程等,商务智能对于客户关系管理的作用,分析了商务智能系统的关键技术,重点研究了数据挖掘的相关理论和技术。(3)介绍了关联规则的基本概念、性质以及经典的Apriori算法,然后重点介绍了正负关联规则和多层关联规则,针对正负关联规则可以挖掘低频率、强相...  (本文共89页) 本文目录 | 阅读全文>>

山东大学
山东大学

基于关联规则挖掘的背景知识攻击及隐私保护研究

为了政务公开、信息共享、科学研究等目的,政府部门、研究机构等数据收集者将收集到的数据进行选择性发布。由于发布的信息中可能涉及个体隐私,如患病情况、消费记录、社会关系等,需要在发布数据的同时进行隐私保护,使攻击者不能以高置信度推断特定个体的敏感信息,以确保隐私信息安全,这就需要对原始数据进行匿名化处理,而数据发布的目的是为了使用和分析数据,所以数据一旦经过了匿名化发布,可用性也随之降低。因此,研究基于隐私保护和高数据可用性的数据发布技术具有理论和现实意义。现有的针对发布数据中敏感信息的攻击和隐私保护可以分为两类,一是直接根据发布的数据进行推断,现在广泛使用的K匿名,L多样性等隐私规则解决此类攻击;另一种是借助攻击者已经掌握的背景知识来推测目标个体的敏感信息,现有的方法是数据发布者假设攻击者可能具备一些特定背景知识,在原有隐私模型的基础上,加入约束,部分的解决了背景知识攻击的问题。但是在连续发布的数据中,攻击者可能利用连续发布的大量...  (本文共62页) 本文目录 | 阅读全文>>

南京邮电大学
南京邮电大学

基于隐私保护的关联规则挖掘研究

大数据时代的来临,隐私保护的问题愈加凸显。然而隐私保护的研究却和信任的研究密不可分,因为在很多环境中隐私和信任是相互依赖的。现实中不同的信任程度直接导致了人们不同程度的隐私保护需要。在多数的网络环境中的安全问题主要就是隐私保护问题和信任问题,而且两者之间存在着极大的关联。由此可见在隐私保护研究同时有必要对信任进行深入研究。目前有关信任模型的研究已有数十年,已经比较成熟,然而信任模型中关于推荐信息的选取以及计算的研究却普遍存在两个问题。第一,推荐信息依靠的推荐链的选择依赖几个简单的主观条件的判断。第二,在信任的计算上,关于直接信任和间接信任的聚合参数采用静态的固定参数,并不根据实际情况而定。针对以上问题本文提出了一种基于推荐链分类的信任模型。该分类方法基于节点间的诚实属性,在实际经验数据的基础之上能选择出有效的推荐链。针对推荐信息的传播使用了以信息增益为基础的参数,使推荐信息更精准,考虑了时间的影响并且能把交互能力与诚实属性清楚地...  (本文共70页) 本文目录 | 阅读全文>>

南京邮电大学
南京邮电大学

分布式环境下关联规则挖掘的隐私保护方法研究

随着网络、通信和计算机技术的迅速发展,数据挖掘呈现出数据海量化,分布式挖掘等特点,如何在挖掘过程中保护隐私数据和防止敏感信息泄露已成为当前面临的重大挑战,隐私保护数据挖掘(PPDM)也已经成为数据挖掘(DM)领域的一个重要课题。关联规则挖掘是应用最为广泛的数据挖掘方法之一。本文对分布式环境下关联规则挖掘的隐私保护方法进行研究,目的就是在最大化地挖掘出数据库中潜藏的知识的同时保护数据隐私。本文从敏感数据的保护和敏感知识的保护两个方面,介绍了数据挖掘中常用的隐私保护技术;在概述了数据挖掘技术的基础上,重点介绍了分布式关联规则挖掘的原理和流行的算法,分析了各种算法的优缺点。在此基础上,本文针对分布式关联规则挖掘中敏感知识的保护进一步做了以下研究工作:(1)对于水平划分的数据集,设计了一种在本站点隐藏敏感规则的数据清洗算法。该算法在对本站点的数据集做最小改动的基础上,实现了对本站点数据集中敏感规则的完全隐藏,较大程度地保证了全局挖掘结果...  (本文共72页) 本文目录 | 阅读全文>>