Word 2007中藏文排序的研究

来源 :商 | 被引量 : 0次 | 上传用户:sfsfsfsdfsdfsdfsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:藏文文字的排序是藏文信息处理领域的一项不可缺少的关键所在。也是一直以来有待解决的问题。目前,word成了最广泛的应用程序之一,如果word中实现符合藏文文字结构特点和语法规则的藏文排序,将会为以后藏文研究工作者带来很大方便。
  关键词:藏文排序;结构;排序;word
  1. 藏文字与文法规律
  目前,藏文是藏文民族在日常生活中所使用的书面文字之一,它属于拼读性文字,由30个辅音字符和4个元音字母组合而成,其中,辅音字母是分为八组,每组四个字符,最后一组两个字符。四个元音中三个加在辅音字母(或上加字)上面,一个加在辅音(或下加字)下面。藏语的发音跟其他语言有所不同,发任何一个音都附带一个辅音“a”,在书写中为了方便等原因略写了后加字“a”,除了辅音和元音字母外,还有标点符号,藏文的标点符号没有汉语的那么丰富,常用的符号有“分界符()”和“分隔符(·)”两种,其中分界符是每一个完整的句子后面或者前半句和后半句连接处,一般情况下,文章的结尾会放两个分界符表示此文以结束,有些文章的结尾也有四个分界符的情况。分隔符是藏文中特别重要的符号,每一个藏文字都是以分隔符来隔开的,这个跟英文中每一个单词间用空格符隔开相似。藏文也有数字符号,用法跟阿拉数字一样,写法上有些差别。
  辅音中分割10个后加字母,5个前加字母,2个又后加字母,以及3个上加字和4个下加字的情况下表1
  由此不难看出,10个后加字外其余的20个辅音字母不能相互搭配,如:这种不符合后加字规律会出现错误。10个后加字中分割了5个前加字和2个又后加字。3个上加字是后加字中最后3个字母。两个又后加字字可以加的后加字共有3个,分别是。现在藏文字中一般很少写。字可以加的后加字共有4个,分别是。现在藏文字中一般很少写。3个上加字和4个下加字与辅音字母固定搭配已确定。其中,字可以加在基字之上的共有12个,字可以加在基字之上的共有10个, 字可以加在基字之上的共有11个①。
  1)前加字和辅音字母之间的固定搭配规律如下:
  2、藏文结构
  藏文文字的结构是30个辅音字母和4个元音字符相互组合而成的。藏文文字的基本结构各不相同,至少1个辅音字母,最多的7个(6个辅音字母和1个元音字母组成,其中元音字母加在结构中基字的上方或下方)构件构成。但现在受语法影响也有双后加字或双元音的藏文文字结构。不管是怎么样的结构都以一个构件字为核心而成,称之为“基础字”简称“基字”,也是藏文字中唯一不可或缺的构件。其余的字母都以基字的前面的称(“前加字”),加在基字后面的(后加字),最后(又后加字)和元音字符组合一个完整的藏文字的结构(图1)(注:此处的元音只能出现一处)。藏文文字具备纵向结构和横向结构的非线性结构的文字,纵向结构具有前加字、基字、后加字、又后加字的先后顺序成线性结构,纵向结构具有元音、上加字、基字、下加字(元音最上面或下面)上下叠加的结构特征,所以藏文字是结构上十分复杂的文字。
  完整的藏文字结构藏文字的构造序和拼写上有区别的,其中拼写序是拼写藏文字时符合从左到右、从上到下规则的书写顺序或拼读顺序。
  藏文文字构造的顺序是按照基字、前加字、上加字、下加字、元音、后加字、又后加字。每一个构件是一个层次,基字居于核心层,又后加字在最外层。每一级字符按字符序循环,每次一次构件发生一次字符序变换,整个循环条件不变又从最低构件开始新的循环。总之,各个构件上的字符以基字为中心,按照循环构造序顺序变换,知道这个循环完了,基字开始更换,依次重复这种循环的同时构造排列和字符交替而形成了多个以基字为中心的循环集,所有的藏文字就在这个循环中定位。
  在藏文文字排序的时候发现几个问题,第一、藏文基字判断上出现歧义性,如等藏字的第一个可以是基字也可以是前加字,所以这种情况应该在算法中加入规则来解决;第二、在藏字中有双后加字的存在,如这种情况把双后加字都放在一个排序单位当中来排序。
  3、word 2007中实现藏文的排序的开发环境与步骤
  Word 2007中对藏文排序的开发和系统的运行有着紧密的关系,整个word 2007中对藏文排序时采用Microsoft Visual Studio 2010平台上用Visual Basic 2010语言编程。
  具体步骤如下:1)获取选定的表格;2)获取需排序的数据;3)对数据中的字分解成字符序列;4)对字符序列排序;5)排序结果存入选定的表格中。 (作者单位:青海民族大学计算机学院)
  参考文献
  [1]黄鹤鸣,达飞鹏. 基于排序的现代藏文音节判定[J]. 计算机应用,2009(7).
  [2]黄鹤鸣,赵晨星.引入排序码实现藏文字符的排序[J]. 计算机技术与发展,2008(10).
  [3]黄鹤鸣,赵晨星.基于DUCET的藏文排序方法[J]. 中文信息学报,2008(7).
  [4]江荻,等.论藏文的序性及排序方法[J].中文信息学报,2000,14(1).
  [5]林河水,等.一种符合ISO14651 语义的藏文排序实现方法[J].中文信息学报,2006,20(2).
  [6]扎西次仁.藏文的排序规则及其计算机自动排序的实现[J].中国藏学,1999(4).
  [7]珠杰,欧珠.基于藏文编码GB的藏文排序方法研究[J].西藏大学学报:自然科学版,2008,23(1).
  [8]东噶洛桑赤来.东噶藏学大辞典[M].中国藏学出版社.2002.4
  [9]新编藏文字典[M].青海民族出版社。1989.6
  注解
  ①多吉杰布,藏文文法知识. 西藏人民出版社.2005年7月.
其他文献
IEE泰国是一般的东南亚旅行中必选的地方,不仅仅是因为那里有着神秘的金三角,那里的人,那里的物,无一不勾起我们的好奇心,向往的旅程即将开始。最能代表泰国的城市,无疑就是
部分心性猝死由于缺乏明确的病理学改变,其鉴定工作一直是法医工作者的一大难题.近年来,与长QT综合征、心房颤动等致死性心律失常疾病相关基因(KCNE基因家族与KCNQ1)等研究逐
1 饲料产量温和增长rn综合评价全国水平,预计2015年饲料总产量2亿t,同比略有增长.从饲料产品看,由于生猪规模化水平不如家禽业成熟,也因为母猪饲料目前的技术难度最大,所以,
泰国是一个拥有着历史悠久的社会习惯和传统的国家,今天仍受到所有泰国人的重视和尊重.学习一些基本的泰国民俗习惯,并遵循几点简单的旅行须知,我们的泰国之旅将变得更加丰
习近平总书记对全党开展"两学一做"学习教育作出重要指示强调,要把全面从严治党落实到每个支郊、每名党员。这是对推进"两学一做"的新要求,也是检验学习教育成果的新准则。"两学一做",面向全国380多万个党支部、8700多万名党员,从"关键少数"向"绝大多数"拓展,从集中性教育向经常性教育延伸,发展到基层党组织的"神经末梢"。这无疑是确保我党始终成为有理想、有信念的马克思主义政党的关键所在。可谓因势而进
高校社团社区服务活动比较深入,但在某些方面还有待加强,社区服务活动的方式有待进一步改善;社区工作者对高校社团活动的总体评价积极,也充满了期待.高校社团要知行统一,接受
现代社会有谁没吃过泡面呢!泡面有很多别名,快餐面、方便面之类,反正居家旅行必备.然而,你看大多数的泡面包装上的食用指南,基本上都是3分钟.对,吃一碗泡面,官方建议是请你用
期刊
期刊
2009年5月4日,这是60万诏安人民的一个值得永远记住的光辉日子--福建原中央苏区县名单上又增加了诏安这个县份.两天后,国务院出台了.真是双喜临门,喜上加喜.诏安作为中央苏区