分享到:

面向Web文本语义挖掘的SKR/MetaMap输出概念共现分析系统的开发尝试

1关于概念共现分析与SKR/MetaMap根据心理学的邻近关系法则,曾经在一起感受过的对象往往在想象中也联系在一起,当想起它们中的某一个的时候,其他的对象也会以曾经同时出现时的顺序想起。可以推论,两个词之间的联系可以用同时感知到两词的相对频率来衡量,词之间的联系强度决定了用语过程中词汇的选择:只有存在关联的那些词汇才能被想起、说出或写下[1]。只要该假设成立,运用文本中词语的普遍共现现象预测词汇的关联就是可行的。从这个方法论出发,可以利用共现分析研究词汇之间的关联度,挖掘词汇之间的内在联系[2]。当然,这种方法存在着不足。目前的文本处理基本上都是依据一定的词语库分词后,简单地统计自然词汇的出现频率来作为文本分类的基础。自然词汇之间往往存在着多种复杂的关系,如同义、近义、反义、属类(或上下位,即大概念和小概念)等等。因此,人们已经考虑到运用知识本体来解决自然语言处理问题[3]。语义知识表达(Semantic Knowledge R...  (本文共5页) 阅读全文>>