分享到:

维文Unicode在线处理技术与实现

近几年来,随着计算机软硬件技术和Internet技术的迅速发展,计算机已经深入到了人类社会的每一个角落。新疆是个少数民族聚居的地区,很多方面都有使用少数民族语言文字的要求,最近的Windows环境下多文种信息处理平台的开发研究不仅丰富了多文种平台的开发理论和方法,而且有助于少数民族语言信息的计算机处理的推广应用。另一方面,民文信息处理过程中所使用的没有规范化的字符编码方案给民文信息资源的资源共享和Internet技术的普及带来了很大麻烦。这种情况下,为了促进实行已进入Unicode的维文编码方案和实现维文信息处理的标准化,开发一个高性能智能化的维文Unicode在线输入技术成为维文信息处理中十分关键和活跃的领域。在我区,民文信息处理技术的发展过程大致经历了以下几个阶段:● DOS下文字处理和排版阶段(1984-1994),其主要特点是初步研究并理解计算机的体系结构和工作原理。在这一时期,主要为政府部门和媒体部门开发了一些小型文字  (本文共52页) 本文目录 | 阅读全文>>

《新疆大学学报(自然科学版)》2004年03期
新疆大学学报(自然科学版)

维文Unicode在线处理技术与实现

1 在线维文处理技术的设计原则和设计目标  为了在任何 Windows平台上在线处理维文 Unicode和实现维文的标准化 ,我们的总体设计原则和目标是 :1 .创建符合国际标准的维文 Unicode标准字库 ,而不是像以前那样替换原有阿拉伯文字符或字库 .2 .通过浏览器在线处理方式来实现维、中、英 ,日等文的在线混合输入和显示 .3.输入时自动选型技术与键盘切换技术实现智能输入提高录入速度 ,使得维文字符都能准确相连并不影响其他文种正确显示 .4.设计并实现多方向文字转换技术给使用者提供极大方便并保留用老系统输入的数据 .5 .为了实现在线输入法的共享 ,考虑程序的移植性、通用性和安全性 .2  Unicode的益处  编码标准是指一套将计算机内码编配给不同字符的标准 ,以使计算机能够处理及显示这些字符 .采用 Unicode,计算机系统可准确地处理及显示不同语言的电子资料 .用户毋须使用转换工具来处理不同编码的电子资料 ....  (本文共3页) 阅读全文>>

《和田师范专科学校学报》2010年01期
和田师范专科学校学报

民文在线处理系统的设计与实现

网络正在渗透着生活的每个角落,悄然改变着人们的生活方式和思维意识。网络带动着人类从工业经济走向信息经济。我国是一个多民族的国家,共有56个民族,使用汉字的人占绝大多数,具有本民族语言的少数民族有17个。新疆是个多民族地区,新疆少数民族语言文字软件拥有相当大的用户市场。全自治区1000多万少数民族人口,15个地州(市),96个县市。为了使新疆少数民族人民适应时代和经济的发展,在社会上已经有许多个人或机构纷纷使用维吾尔文字体下载、图像、统一拉丁文等传统的方式,创建本民族自己的语言网站,传播本民族信息,促进本民族的经济发展。由于技术水平上的限制,多年来新疆少数民族民文文字编码没有一个统一的方案,不同网站采用不同的维吾尔文字库,同时维吾尔文字符本身又有几种编码方式且都不支持国际代码标准10646(Unicode)或国家新的GB18030代码标准,而且各类所开发的系统软件互不兼容,这些因素增大了实现少数民族文字直接上网技术难度。在这种情况...  (本文共5页) 阅读全文>>

《内蒙古民族大学学报》2009年03期
内蒙古民族大学学报

基于Unicode的中国蒙古文古籍版本数据库的构建

中国蒙古文古籍版本数据库项目计划使用传统蒙古文作为描述语言,对我国蒙古文古籍的版本信息进行著录,并形成可通过网络访问使用的数据库系统。本项目的技术架构主要面对三个问题:传统蒙古文信息化处理、数据库建立及应用架构的选择和项目可持续性维护问题。一、传统蒙古文信息处理平台的选择(一)蒙古文信息处理研发综述传统蒙古文的计算机处理研究始于20世纪80年代,先后经历了早期开始在传统DOS下的开发研究,后来在Win-dows系统下的挂靠开发和再后来各种平台上的软件开发。蒙古文信息处理近三十年的研究过程中,逐渐认识到使用基于Unicode的OpenType字库技术才是传统蒙古文信息处理的根本途径。从1999年的Unicode3开始,Unicode中已经加入了蒙古文编码(包括传统蒙古文、托忒蒙古文、满文、锡伯文、阿礼嘎礼字母等),同时,《蒙古文编码系统实现用户协定》中规定了每个蒙古文字符输入的方法。因为OpenType字体的使用通常还需要另一个组...  (本文共2页) 阅读全文>>

《科技信息》2006年03期
科技信息

Unicode及中文到Unicode转换

0、Unieode产生的背景在计算机诞生之初,编码问题并不是很重要。因为当时计算机基本上是在英语语系的国家内使用,所以编码只要考虑英语二十六个字母就行了。因此美国制定了使用七位编码的ASCll码(0一127)。这很快就成为了世界性的标准,也是现在所有字符集的基础,通常被称为基本拉丁字符集。事实上,ASCll码仅仅定义了用于书写美国英语的全部字符,它甚至缺少一些写英语所必须的符号,如版权符号等,这主要是当时计算机主要用在军事上,同时由于采用的是有符号数作为编码,使得所定义的字符只有128个,不能包括太多的字符。随着计算机在全球的发展,以及在各个行业的普及,编码的问题日益重要,原有的ASCll码已经不够用了,于是人们通过把有符号数变为无符号数,使得编码范围从0一127变为O一255,把附加的字符指定给128以上,来扩展ASCll码。在这一方面,国际标准化组织做了很多工作。它定义了很多基于ASCll的字符集标准(150-一8859一1...  (本文共2页) 阅读全文>>

《个人电脑》1995年02期
个人电脑

Unicode尽收全球文字

ASCll时代即将告终,Unieode纪元即将来临。届时完全国际化计算将为人类交流铺筑康庄大道。 今天的操作系统只能识别256个不同字符,仅够容纳欧美国家的字母和标点。未来基于Unicode的系统允许使用65000个不同的字符,足以覆盖全世界所有语言的所有字母,外加数千种符号。 U币cede现在已置人Wlndows Nl,中。等到Windows 4.x的某个早期版本采用Unicode时,后者将成为台式机中的一个标准。使用Uni。。de的应用程序随后也将出台。Borland、IBM、Lotus、Mierosoft和WordPe浦ect是Unieode eonso币um的积极成员,该组织正在制定Unicode标准以及从ASCll平滑过渡至Unicode的方案。现有的应用程序和字体依然有效,因为Unieode字符集前256个字符同Latin-1字符集前256个字符完全一样。┌─────────────────┐│软件销售排行榜 │├─...  (本文共1页) 阅读全文>>

《现代语文(语言研究版)》2011年09期
现代语文(语言研究版)

Unicode标准下古籍数字化的异体字处理

14odMXIANDAUnicode字符集的全称为“通用多八位编码字符集”(Universal Multiple-Octet Coded Character Set),它支持现今世界各种不同语言的书面文本的交换、处理及显示。自Unicode标准产生后,它已经成为全世界通用软件以及互联网信息传输的基础字符集。由于具有良好的国际通用性和跨平台兼容性,为方便国际交流和知识的传承,Unicode也成为学术界所遵循的基本字符标准。一、Unicode设计原则与异体字为保证其良好的通用性、可继承性及高效性,Unicode在制定之初就规定了若干设计原则。其中和异体字关系较大的是“字符、非字形”原则。Unicode标准对字符和字形加以区别。字符是具有语义值的用以书写语言的最小组成要素的抽象表示。字形反映的是字符呈现的形状。与字符相比,字形是作为一个或多个字符的特殊表现形式出现在屏幕上的[1](P15),这一原则在计算机上表现为同一字符在不同字体下...  (本文共2页) 阅读全文>>