用户登录  |  用户注册
首 页商业源码原创产品编程论坛
当前位置:PB创新网文章中心解决方案工业自动化

机器翻译中汉语动结式生成的过程和困难

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-01-10 15:08:54
在《现代汉语语法信息词典》(注:由北京大学研制的用于信息处理的电子词典,其中有按义项收录的14479个动词,2856个形容词。通过检索每个词的属性,我们可以知道哪些动词可以带结果补语,哪些形容词、动词可以作结果补语。)(俞士汶,1998,以下称《语法信息词典》)中,列出了可以作结果补语的单音节形容词204个,(注:马真等(1997)列出了可以作结果补语的单音节形容词153个。)单音节动词112个。经过一一搭配测试,其中有54个形容词和30个动词能作“学”的结果补语。这样我们就从《语法信息词典》中一共得到了84个可能的动结式实例。然后按照《知网》(注:用于自然语言处理的知识系统,由董振东等研制。以从大量词语中提取出来的“义原”为基本描述单位,采用一种结构化的描述语言来描述概念与概念之间,以及概念的属性与属性之间的关系,包括上下位关系、同义关系、反义关系、对义关系、部件与整体关系、材料和成品关系、属性和宿主关系,以及属性值和属性的指向关系、时间和角色关系。互联网网址:http://www.keenage.com)(董振东等,2001)的定义为每一个实例的补语作语义类别标注,再作聚类分析,整理出“学”的结果补语的六个语义类别。其中A、E、F三类作补语的是形容词,B、C、D三类作补语的是动词,分别列在下面(括号里面是《知网》定义的义原)。
  A.人的客观属性(智能、举止、年龄、外貌、品性、经济状况)
  A1.[智能]学笨了 学昏了 学蒙了 学痴了 学蠢了 学土了 学呆了 学木了 学乖了 学傻了
  A2.[举止]学刁了 学歪了 学贼了 学油了 学浮了 学狠了 学犟了 学俗了 学倔了 学皮了 学酸了 学混了 学抠了
  A3.[年龄]学老了
  A4.[经济状况]学富了 学穷了
  A5.[品性]学差了 学废了 学好了 学黑了 学坏了 学糟了
  A6.[外貌]学俏了
  B.人的主观感受(态度、感知)
  B1.[态度]学烦了 学够了 学惯了 学迷了 学恼了 学腻了 学怕了
  B2.[感知]学懂了 学乏了 学会了 学累了 学通了 学忘了
  C.人的状态和行为(状态、行动)
  C1.[状态]学病了 学成了 学疯了 学垮了 学亏了 学蔫了 学瘸了 学死了 学瘫了 学哑了 学晕了
  C2.[行动]学哭了 学跑了 学散了 学走了
  D.事物的状态(状态)
  学丢了 学没了
  E.事物的特性(特性)
  学反了 学活了 学偏了 学浅了 学深了 学杂了 学窄了 学足了
  F.事件的特性(特性)
  学遍了 学迟了 学重了 学错了 学对了 学多了 学久了 学滥了 学全了 学少了 学透了 学晚了 学早了
  可以看出,“学”和它的结果补语之间在概念意义的组合上遵循一定的规律。能否根据这些规律,用计算机可操作的方法,在一定范围内判断词表以外的动结式实例是否合法?比如,《语法信息词典》没有把“精”列入可作结果补语的形容词当中,但是“学精了”是个合法的动结式实例。计算机可以这样来确认它的合法性:根据《知网》,“精”的定义是[智能>灵](“>”的右部是左部的下位概念。下同),在A1类[智能>愚/讷/智/灵](“/”表示“或”的意思。下同。)的范围内。同样,与“精”定义相同的“鬼”、“灵”、“巧”,虽然也没有被《语法信息词典》指明可作结果补语,但计算机仍然能够判定“学鬼了”、“学灵了”和“学巧了”是合法的动结式实例。
  对于动补之间的语义组合,结果补语的概念意义是在动词概念意义的制约下起作用的。我们再来看与“学”有对义关系(Converse)的动词“教”。“学”和“教”都表示认知行为,前者是使自我认知,后者是使他人认知。因此有可能要求相似的结果补语。实际上,“学”的结果补语基本上都可以作“教”的结果补语。(注:尽管各自的语义指向可能不同,比如:“学笨了”和“教笨了”。这与动词的配价结构有关。在机器翻译生成动结式的过程中,由“整合语义结构”这一步处理。)它们或者表示认知行为对其主体(“学”的施事、“教”的与事)产生的效果:改变主体的客观属性(智能、举止、年龄、外貌、品性、经济状况)、主观感受(态度、感知)、状态和行为;或者表示认知行为对其涉及的事物产生的效果:改变涉及对象的状态、性质(长短、宽窄、深浅、多少、正反、美丑);或者表示认知行为本身的特性(度量、频率、程度)。不同的“动作—结果”关系产生了不同的动补组合关系,要把它们研究清楚,整理成规则,是一件非常复杂的事情。
  即使有了基于词语概念意义的规则,也还不能完全解决问题。在《知网》中,与“懂”有相同定义的单音节动词还有“认”、“审”、“识”、“通”、“悉”、“晓”、“知”。除了“通”以外,其余的都不能作“学”的结果补语。与“精”定义相同的双音节形容词“聪明”、“机灵”、“伶俐”、“乖巧”可以作“学”的结果补语,而同样定义的“聪颖”、“聪慧”却不行。这说明影响动词和结果补语组

上一页  [1] [2] [3] [4] [5] [6] [7]  下一页

Tags:

作者:佚名

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论
PB创新网ourmis.com】Copyright © 2000-2009 . All Rights Reserved .
页面执行时间:7,953.12500 毫秒
Email:ourmis@126.com QQ:2322888 蜀ICP备05006790号