分享到:

语言信息处理的基石

对北京大学计算语言学研究所《综合型语言知识库》的研究人员而言,2007年2月13是一个令人激动的日子,北京大学计算语言学研究所自1986年以来在863、973、自然科学基金、社会科学基金等国家计划的支持下,历时20多年的研究成果《综合型语言知识库》这一天通过了技术鉴定,并且受到了鉴定专家的一致好评。 $$  《综合型语言知识库》是一个庞大的工程,由以下部分组成: 其中的《现代汉语语法信息词典》包括34个数据文件,收录词语8万条,描写的语法属性总项数超过360万项,是目前国内外最有影响的汉语词汇知识库;《汉语短语结构知识库》包含600余条汉语短语规则,涵盖了汉语基本短语结构的各种合理组合;《中英文概念词典》实现对词网中近10万个英文概念的汉语对应,是全球多语词网建设中具有标志性的一项成果;《现代汉语大规模基本标注语料库》切分标注的总量超过5千万字,《汉英双语对齐语料库》规模达80万句对,规模...  (本文共1页) 阅读全文>>

《中文信息学报》2005年03期
中文信息学报

“第十届少数民族语言信息处理研讨会”征文通知

为了交流民族语言文字及多语言信息处理的最新研究成果 ,促进中国少数民族语言文字信息技术发展 ,中国中文信息学会、青海省教育厅五省区藏族教育协作领导小组办公室、青海师范大学、中国科学院软件研究所联合举办“第十届少数民族语言信息处理研讨会”。会议定于 2 0 0 5年 7月 1 6 - 1 8日在青海师范大学召开 ,会期三天。会议将邀请著名中文信息处理专家做专题报告。会议将选取优秀论文推荐在《中文信息学报》发表。论文文字 :中文或英文 ,论文必须有中文和英文的题目与摘要。会议的议题如下 (不限于 ) :多文种软件体系结构 ...  (本文共1页) 阅读全文>>

《高技术通讯》1991年11期
高技术通讯

智能型机器翻译与语言信息处理产业

一、高性能机译研究的意义 高性能机译研究是一个涉及语言学、计算数学、计算机技术、自动化技术等多学科的综合性研究课题,几乎覆盖了语言信息处理产业的所有研究领域,是当前语言信息处理产业发展的“瓶颈”和突破口之一。谁最先突破高性能智能型机译及其相关研究领域中的关键技术,谁就有可能在语言信息处理产业的发展中夺得主导地位。由于高性能机译技术在语言信息处理产业中具有重要的现实意义和潜在的应用前景,它已成为当前国际上激烈竞争的研究领域之一。发达国家不惜投入巨额资金开展全国性或多国性的联合攻关。据国外有关报导,高性能机译产品已被权威机构列为2]世纪世界十大高科技产品之榜首。智能型机译研究是高性能机译发展的主要方向,它作为人工智能的重要应用,被认为是第五代乃至将来第六代计算机的最大应用领域,它已成为整个语言信息处理产业的核心之一,其战略地位和竞争的激烈程度可想而知。 从近期的研究来看,高性能机译系统的初步成就将会带来巨大的直接与间接的社会经济效益...  (本文共5页) 阅读全文>>

《学习月刊》2015年22期
学习月刊

大数据对语言信息处理的挑战

一、语言信息处理及其发展1、语言信息处理的定义语言信息处理(LIP,Language In-formation Processing)有时也称作自然语言处理(NLP,Natural Language Pro-cessing)或自然语言理解(NLU,NaturalLanguage Understanding),自然语言处理是上位概念,包括理解和生成,而语言信息处理可以分别理解为语言信息|处理”和“语言|信息处理”。前者指的是对各种语言信息进行处理,后者指对语言本身进行信息化的处理。[1]语言信息处理源自20世纪50年代和60年代的机器翻译,其基本原理是结合其他边缘学科的知识,解决机器在语言理解和生成中语法和语义消岐问题。自然语言处理系统首先把指令“Deletefile x”在音位学平面转化成音位系列“/dilit fail eks/”,然后在形态学平面把这个音位系列转化为语素系列“delete”“file”“x”,接着在词汇学平面...  (本文共2页) 阅读全文>>

《信息与电脑(理论版)》2012年03期
信息与电脑(理论版)

中文文献与语言信息处理教学实验中心管理体制和运行机制的探索和建立

1.引言在21世纪网络信息化和社会主义市场经济迅速发展的潮流中,教育已经面临了来自各方面的挑战,大学毕业生也必然需要经过人才市场的一道道“体检程序”。实验室教学作为高等教育的一个重要组成部分,它对于培养学生实践和创新能力至关重要[1]。近年来,中国各高校都十分重视对实验室的建设,其中理工科类的实验室建设已经达到一定高度,相对比较成熟,但人文社科类实验室的资源相对比较缺乏[2]。深圳大学文学院中文文献与语言信息处理实验中心于2006年获学校批准建立,本教学中心目前只下设一个实验室,即中文文献与语言信息处理实验室。实验中心成立以来,首先着眼于对中心的设备购置、人员引进,制度建立,资料库建立等工作,这里主要谈谈本中心的管理体制和运行机制的探索和建立工作。2.中心发展定位中文信息处理技术是我国高科技发展的一个重要方向,是我国信息产业最重要的技术支柱之一。中文信息处理是指用计算机对中文的形、音、义等信息进行处理和加工,是一门与计算机科学、...  (本文共2页) 阅读全文>>

《长江学术》2009年02期
长江学术

论语言信息处理的四个层面

一、导言用计算机来处理自然语言的信息,无论是对计算机科学还是语言学而言,都是一场学科和技术上的革命。事实上,数字电子计算机在非数值领域的最早应用正是从自然语言的信息化处理开始尝试的。上世纪40年代,电子计算机问世不久,就开始了机器翻译试验。经过大半个世纪各国学者的共同努力,语言学和计算机科学的结合越来越深入和广泛。以语言学、计算机科学、数学、认知心理学为基础的一个崭新的研究领域——语言信息处理蓬勃发展起来,并逐渐形成了一个新的学科分支,跨越文理工多个学科,成为世界范围内的热点课题。人类社会进入二十一世纪以来,信息化革命的不断深入对自然语言的信息化处理的需求日益增强,语言信息处理的理论研究和应用范围越来越广泛,实际运用中“语言信息处理”这个概念的外延在不断扩大。那么,理论、技术和应用发展到今天,如何进一步界定和理解“语言信息处理”的内涵和外延,不仅成为多学科关注的一个新的焦点,而且也成为语言信息处理学科长远发展和学科定位的迫切问题...  (本文共6页) 阅读全文>>