分享到:

基于语料库的第二语言词汇学习策略的实验性研究

写作本论文的出发点是基于现实考虑(在目前国内学习外语的热潮中英语专业和非专业学习者都面临如何增加词汇量的问题)和建构主义与发现式学习在理论上的启发。本论文围绕基于语料库的上下文词汇学习展开。文章主体分为三部分:第一部分较为详细地对词汇知识加以定义。并基于此提出在语料库提供的上下文中进行词汇学习的设想。本文的第二部分对此设想提出理论上的支持,并阐述了与此相关的心理学和第二语言习得方面的研究成果。文献综述中的理论支持包括建构主义和发现式学习理论,还包括认知语言学中的留意假说和信息深度处理学说。所有综述都是围绕语料索引对词汇学习的作用展开的。Tom Cobb、Chris Greaves和Marlise Horst关于R-Read的研究成果和Goodfellow的“Lexica”研究对本文的实验研究有很大启发。本文第三部分是实验描述。本文作者试图以此实验来验证语料索引对刻意词汇学习在词汇知识和记忆时间两方面的影响。作者对实验结果进行了定  (本文共74页) 本文目录 | 阅读全文>>

山西大学
山西大学

大规模语料库分词质量评价方法研究

在自然语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要的任务。然而,对语料库加工质量检验方法的研究却很少。语料库分词质量的评价问题是汉语语料库的特有问题,已有的简单随机抽样的方法,当语料库规模变大时,无法精确估计分词质量评价中语料库样本的总体方差,同时,为了保证检验的精度,传统抽样方法的检验费用太高。本文针对大规模语料库分词质量评价中存在的问题,提出了基于聚类的大规模语料库分词质量评价方法。该方法通过对语料库抽样样本进行聚类,实现对语料库抽样样本分词正确率的有效分层,然后对各层样本进行简单随机抽样。主要工作如下:a.研究语料库分词质量评价的抽样方法,采用改进的ISODATA聚类算法实现语料库样本的分层;b.给出语料库样本的结构化方法,用影响分词正确率的主要因素代表语料库样本向量;C.研究聚类中的样本相似性度量公式,采用改进的绝对值法计算。该公式既能反映样本向量间的距...  (本文共45页) 本文目录 | 阅读全文>>

《情报学报》2013年09期
情报学报

突发公共卫生事件网络语料库系统构建

突发公共卫生事件在给国家和人民造成直接财产损失的同时,也给社会发展带来了广泛而深远的影响。互联网的快速发展使得突发公共卫生事件信息传播速度加快、范围变广。为了对突发卫生事件网络舆情进行有效的监测、...  (本文共9页) 阅读全文>>

《乐山师范学院学报》2019年11期
乐山师范学院学报

华裔美国作家哈金作品《落地》建构的中国形象——基于语料库的考察

以形象学理论为阐释框架,使用在线语料库统计检索工具Sketch Engine,从词汇层面,以"China""Chinese""Party"搭配词的语义韵和检索行为核心考察美籍华裔流...  (本文共7页) 阅读全文>>

《外语与外语教学》2019年06期
外语与外语教学

近十年国际语料库翻译研究文献计量分析(2008-2018)

本文通过CiteSpace文献计量工具对近十年(2008-2018)国际语料库翻译研究文献进行考察分析。研究路径为学科分析、关键词分析、共被引分析、典型聚类分析、时间线分析和结构变异分析。研究发现:1)近十年间语料库翻译研究的主要问题为:翻译文本共性特征的验证,语言对比研究,"受限语言"的探索,研...  (本文共13页) 阅读全文>>

《中国科技资源导刊》2019年06期
中国科技资源导刊

科技大数据背景下的中英双语语料库的构建及其特点研究

首先通过对双语语料库全过程构建的描述,提出基于专业领域词库快速构建双语语料库的方式,并用于快速发现科技大数据基础语料的多属性,完成语料的标注,这对于科技大数据知识检索、知识图谱方面的应用具有基础性支撑作用。然后通过分析新...  (本文共6页) 阅读全文>>