分享到:

HotRank:热度敏感的非结构化数据检索排名算法

大数据时代,企业中积累了大量办公文档、PDF、视频等非结构化数据,这些数据来自于企业员工工作过程的多种操作,有的由员工自己创建,有的来自于邮件,有的则来自网络下载。想要在积累起来的大量非结构化数据中搜索需要的文件,需要经过多次搜索尝试,也需要花费相当长的时间。为加强非结构化数据检索效果,涌现出很多针对搜索排名方法的研究,有的研究通过为文件之间建立链接以提高检索排名效果,有的研究通过记录用户搜索历史来提高再次检索的效率,还有的研究通过让用户添加自己对目标数据的记忆来帮助提高检索效率。现有研究对检索结果的排名基本是在“数据是平等的”前提下进行的。实际上,对数据的任何操作总是处于用户的某个任务中,如果对数据的任务上下文进行标志,检索结果中将任务属性与用户检索行为的当前任务相似数据的排名提前,显然更能够让用户满意。此外,用户在完成一项工作或者任务的过程中,有一部分数据会被频繁操作(如一个项目中的项目需求文档),而另一部分数据仅操作过数次...  (本文共3页) 阅读全文>>

《计算机工程与设计》2013年03期
计算机工程与设计

基于主体行为的非结构化数据模型

0引言随着大数据时代的到来,数据中非结构化数据占越来越大的比例。IDC(即互联网数据中心)报告显示,至2012年,非结构化数据占有比例将达到互联网整个数据量的75%以上,其中50%~75%都是以人为中心产生的。非结构化数据不仅涵盖多种数据类型,包括文档、图片、HTML、图像和音频/视频等[2],还具有明显的用户特性、存储介质多样、所属应用程序多样等特征。现有的非结构化数据通常分布式地存储在企业服务器中或个人电脑中,数据所有者通过文件系统或数据管理系统等进行管理。然而,在大数据环境下,数据的非结构化特征对数据组织和管理方法提出了新要求[1]传统非结构化数据管理技术也面临新问题。例如,目前针对非结构化数据的检索多是针对数据题名或内容的关键字检索,检索结果的准确度难以达到用户期望;同时,随着数据量的增长,数据检索速度受到很大制约。尤其在数据模型方面,现有模型无法满足复杂检索对数据模型的需求,对数据的描述局限于数据文件本身的基本性质,因...  (本文共5页) 阅读全文>>

《中国机械工程》2013年08期
中国机械工程

基于词语语义和隐喻逻辑的顾客非结构化需求分析

O引言顾客需求获取和转换在产品生态链中处于十分重要的位置,顾客需求分为结构化和非结构化两类〔‘一幻。企业要设计制造出一款受消费者追捧的新产品,就必须满足顾客的结构化和非结构化需求。通过问卷调查和QFD等方法的结合川,能实现从顾客结构化需求到产品功能技术特性的分析转换;而顾客的非结构化需求的获取和转换则相对困难[‘]。SanderS等〔5」、Prahalad等巨6〕的体验设计,Battarbee等[7」的移情设计,以及Nor-man[s]的情感化设计,都是针对顾客一种主观难以用文字描述的心理体验即感性需求分析的产品设计方法,这些方法目前更多的还只是作为一种设计理念而未形成完备的方法。长叮三生提出感性与工学相结合的感性工学技术川,通过对产品进行形态分析,并对产品形态特征进行定义和编码,结合意象评分的结果,利用统计分析方法,建立产品意象与产品形态特征间的对应关系,这一方法随后得到广泛应用〔’。一‘5〕,但这一方法在形容词选择上容易限制...  (本文共6页) 阅读全文>>

《课程·教材·教法》2013年04期
课程·教材·教法

论非结构化教学

一、非结构化教学的生成背景“教学结构是指在一定的教育思想、教学理论和学习理论指导下的、在某种环境中展开的教学活动进程的稳定结构形式。”[1]罔顾课堂教学具体实情而机械套用某种预设的教学结构,势必会导致僵固的“结构化教学”———基于某种特定结构范例的教学实施及由此所产生的固化教学态势。结构化教学因为有现成教学结构可供利用而确保了教学效率,但是由于它将特定结构奉为圭臬以至于在实践过程中发生异化,从而引发了课堂教学缺乏生命活力等诸多问题。在当前我国课堂教学改革日益深化的背景下,为了优化与创新课堂教学的实施,必须适时突破结构化教学的限制,实现“非结构化教学”的生成与变革。(一)结构化教学的异化“任何一种课堂教学结构,无论是理论形式或实际活动形式,都有它的局限性,都有它的适用范围和限度。在适用的范围内使用,就会有一定的价值,超出了就会丧失实际意义。”[2]如果不顾教学情境而盲目生搬硬套某种教学结构,非但不能发挥教学结构优化教学的功能,反而...  (本文共5页) 阅读全文>>

《信息技术与标准化》2013年10期
信息技术与标准化

面向大数据的非结构化数据管理平台关键技术

1引言随着互联网与数字化信息获取技术的快速发展,新的数据源不断涌现,各种应用所产生的数据呈指数级增长。根据互联网数据中心监测,全球数据量大约每两年翻一番,预计到2020年,全球的数据量将达到35 ZB,预示着我们已经进入大数据时代。大数据处理可分为三个阶段:数据获取与抽取、数据存储与管理及数据分析与挖掘。其中,数据存储与管理负责把有潜在价值的海量数据进行表示、存储并提供数据关联、检索等操作,为进一步进行数据的深度分析提供必要的支持。同时,人们可以看到,由于微博、社交网等互联网应用以及娱乐、媒体、医疗保健的蓬勃发展,使图像、音频、视频、文本等数据大量涌现。据Gartner Group统计,如今80%的数据为非结构化数据,并且仍保持高速增长态势,非结构化数据已逐渐成为大数据的主体。因此,如何建立有效的非结构化数据管理平台,已成为大数据处理相关研究中的一个核心问题。非结构化数据包含复杂的内容,并具有不同的结构特点,传统关系数据库无论从...  (本文共4页) 阅读全文>>

《网络安全和信息化》2016年07期
网络安全和信息化

安全问题不是大数据发展拦路虎

大数据带来了新的安全问题,大数据的非结构化特性的确使其更容易受到安全破坏。尽管事实如此,CIO不应该让安全相关问题成为大数据发展的拦路虎。安全解决方案不应该在事后才“拧到”您购买的新解决方案上,而应该内置到解决方案中。安全...  (本文共1页) 阅读全文>>