分享到:

网络资源搜集系统的设计与实现

本文实现了一个自然语言友好的、基于配置的网络资源搜集系统,并能直接为NERMS 服务。自然语言文本的关键词抽取、搜索引擎的搜索结果的抽取是两个难点。针对这两点,本文首先采用基于统计的最大概率分词算法对自然语言文本进行分词处理;并采用基于隐马尔可夫模型(HMM)的Viterbi 算法进行词性标注(pos tagging)处理;试图给出并编程实现了识别未登录的专有名词的一种方法(尚需进一步证明):把词性标注得到的名词作为专有名词的候选词,并向此词的两侧试探,计算所有的可能专有名词的出现频率,并按一定规则选出专有名词,即关键词,此算法从根本上讲也是基于统计的;实现了J. Hammer 等给出的Wrapper 方法,对各引擎返回的搜索结果进行抽取。本系统可搜集并下载文本、图片、文献(doc 及pdf)、课件(ppt)、动画(swf)、音频,共6 类资源。本系统的数据源采自多个搜索引擎,且只取每组搜索结果的前10 条记录,故在查准率和查全  (本文共54页) 本文目录 | 阅读全文>>

电子科技大学
电子科技大学

汉语语言处理中专有名词的提取和识别

为了让计算机具有处理甚至理解自然语言的能力,人们发明了很多自然语言语义分析理论。而在汉语的计算机处理中,大部分的语义分析都是以汉语分词作为基础。目前,很多的汉语分词方法都已经被发明出来,但无论使用哪一种分词方法,都会碰到分词歧义现象。在分词歧义现象中,有很大一部分又是由于句子中的专有名词引起。专有名词存在新词出现快,成词无固定规则,容易变化等特点,给汉语分词带来了很大的干扰,使专有名词的识别成为汉语分词的一大瓶颈。本论文主要致力于解决汉语分词中的专有名词识别问题。文章首先介绍了计算机自然语言处理,特别是汉语的计算机处理的现状以及目前汉语分词中使用的专有名词识别方法。接着本文详细讨论了专有名词识别系统所使用的识别算法:首先将专有名词分成了两类:一类是稳定的专有名词,此类名词具有长时间和较大范围存在的特点。另一类是容易变化的专有名词,这类名词新词出现速度快,并且没有明显的规律可循,这类名词主要就是中国人名。然后对这两类专有名词设计不...  (本文共58页) 本文目录 | 阅读全文>>

苏州大学
苏州大学

基于转换学习的专有名词识别

中文信息处理的基础是分词。影响分词准确率的重要因素之一就是未登录词的识别,而未登录词识别的难点是专有名词识别。本文针对专有名词内部结构特点及其上下文词语环境特点,提出了一个以规则方法为主的专有名词统一识别方案。该方法利用从语料库中自动提取到的专有名词信息和采用基于转换的错误驱动学习方法获得的规则,对切分文本进行属性标注,最终实现专有名词的识别。此方法中专有名词词语信息和规则的提取完全采用机器学习的方式,具有在不受人工干预的情况下,改变训练样本即可适应新环境的特点。本文首先围绕专有名词识别问题展开讨论,在分析和比较了现有的专有名词识别方案和常用方法后,明确了课题目标;在此基础上,提出了一个以规则为主的专有名词统一识别方法;然后,在提出了课题的设计思想,对课题的设计方法进行了一个整体的概括介绍后,进行了详细的系统设计说明,主要包括:基本概念的定义、文本预处理、专有名词特征信息集的建立、规则的提取和属性标注等五个方面。最后,将系统的实...  (本文共78页) 本文目录 | 阅读全文>>

《安徽教育科研》2018年02期
安徽教育科研

浅析专有名词翻译原则和策略

名词分为普通名词和专有名词。专有名词是相对于普通名词而言,表示具体的人、事物、地点、团体或机构的专有名称(首字母要大写)。而除去专有名词之外的其他名词都是普通名词。人名、地名、品牌名称、电影报刊书籍名称、机构名称以及一些承载特定文化含义的例如“阴”、“阳”等都属于专有名词。霍布斯曾指出:“专有名词只能使我们心中想起一个对象,而普通名词则会使我们想起许多对象中的任何一个。”宋柔和邹嘉彦认为,“专有名词是用于在一个集合中将某个个体从其他个体中区分出来的一类指称性词语,与所指称的具体事务的使用场合无关。”专有名词翻译研究开始于胡以鲁在1914年的《庸言报》发表文章《论译名》,引发了那个时代学者就专有名词翻译策略的热议。文章中,胡以鲁认为,语义翻译即意译应该被广泛应用于专有名词翻译中,并且第一次引入了“借词”这一说法。朱自清在1919年《新中国》上发表了《译名》,在文章中,朱自清列举了五条翻译专有名词的原则:一半音译一半意译、音译意译融...  (本文共2页) 阅读全文>>

《职业教育(下旬刊)》2018年03期
职业教育(下旬刊)

摆脱“差生思维”,迈向优秀行列

每个学校都有一些所谓的“差的“差生”。班主任还专门为他指定了生”,而且一旦被贴上“差生”标签,想一个“扶差”干部,一对一帮助他。但翻身似乎非常困难。那么,“差生”是老师与班干部想尽了办法,也未能使不是真的会差上一生呢?有无咸鱼翻他的学习产生显著的变化,成绩始终身的可能?我们的回答是:“差生”不稳定在班级倒三。经过“把脉问诊”,是某些人的专有名词,它不会跟随你我们明确了他的病症就是“差生思一生,只要摆脱“差生思维”,你也能维”。原来,他在读初三时因为沉迷游走向优秀。戏,导致成绩急剧下滑,老师和父母翻翻心理学著作,似乎只有“穷就把“差生”的标签贴在他身上了,他人思维”“学生思维”等概念,而没有也慢慢认同了这个标签。从此,一遇“差生思维”一说。确实,“差生思维”问题他就从“差生”的角度来思考,以是我们创造的一个术语,但它不是生此来为自己错误的行为开脱,久而久造,而是确实存在着的。它与“穷人思之,他就真的成了“差生”。中考失利维”有着某...  (本文共3页) 阅读全文>>

《文教资料》2009年21期
文教资料

英语专有名词普通化的词源分析

英语专有名词是指个别人、团体、地方、机构或事物的专有名称。用专有名词表达普通概念又称“专有名词普通化”,主要是借换称、转喻、典故等英语修辞手段得以实现。探究用作普通名词的专有名词的词源,旨在了解专有名词的本义和衍生义,并了解专有名词普通化过程所蕴涵的文化背景知识。一、人名普通化用作普通名词的专有人名主要来源于真实人物的姓名,或是文学作品中虚构人物的姓名。1.源于真实人物的姓名为了纪念一些科学家、发明家和首创者,人们常以他们的名字命名某事物,他们的名字被当作普通名词使用,指计量单位或发明物,例如:Joule(英国物理学家焦耳)→joule(焦耳,功或能的单位)Ampere(法国物理学家安培)→ampere(安培,电流单位)Ohm(德国物理学家欧姆)→ohm(欧姆,电阻单位)Volt(意大利物理学家伏特)→volt(伏特,电压单位)Braille(法国发明家布莱尔)→braille(盲文)此外,通过借用转喻这一修辞手段,一些著名作家...  (本文共2页) 阅读全文>>