用户登录  |  用户注册
首 页商业源码原创产品编程论坛
当前位置:PB创新网文章中心解决方案工业自动化

机器翻译中汉语动结式生成的过程和困难

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-01-10 15:08:54
合关系的因素不仅仅是词语的概念意义。那么,到底还有哪些因素可以作为判断动结式合法与否的条件?如何把这些条件变成计算机可以操作的规则?我们现在还不得而知。
    5.从语义结构到句法表现形式
  在动结式的整个生成过程中,选择什么样的句法手段来表现其语义结构是比较复杂的一步。人们常说,汉语句法结构和语义结构之间的联系比较松散,或者说句法成分和语义成分的配位很灵活,一种结构形式经常表示多种意义,一种语义内容也可以用多种结构形式来表示。这就给机器翻译的汉语生成带来很大的困难。对于动结式表层句法结构的选择,我们目前能用到的条件非常有限,所以能生成的句型也很有限。
    5.1 使生成目标受限
  通过整合语义结构我们得到了动结式的配价结构,价语的数量可以帮助我们选择句型。如果动结式是一价的,选择有一个体词性成分出现的句型;是二价的,选择包含两个体词性成分的句型。至于在同属一类句型的多个表层结构形式中间应该选择哪一个,还需要更细致的条件和规则。下面讨论如何把动结式组成成分之间的语义关系作为选择的条件。
  为了简化讨论的过程,我们在这里只考虑二价动结式的情况(略去“妈妈急哭了”、“他看书看花了眼”、“他扔进屋一块石头”等)。这样,讨论的范围就限制在只含有两个体词性成分的表层结构形式里面。吕叔湘(1986)曾经按照补语跟主语或宾语的语义关系,把动结式述补结构分成15类(略去“得”字句等),其中有两个体词性论元成分出现的共9类(包括用“把”和“被的句子),分属以下三种语义关系格式,其中S是V的主体格。(注:在本节讨论的范围内,主体格包括施事、当事;客体格包括受事、内容。)
  附图
  综合上述各种情况可以看出,二价动结式的六种语义结构可以用以下五种表层结构形式来表达。下面的讨论将在这个范围以内进行:
  表层结构1:S+V+C+O
  表层结构2:S+“把”+O+V+C
  表层结构3:O+“把”+S+V+C
  表层结构4:O+“被”+S+V+C
  表层结构5:S+“被”+O+V+C
  我们注意到,同时与二价动结式的六种语义结构有对应关系的只有表层结构1(S+V+C+O),所以可以把它当作生成动结式表层的首选。可是进一步观察就会发现,在用表层结构1表达某些语义结构时会受到限制。譬如语义结构Ⅱ,我们可以说“大家吃腻了剩菜”,却不能说“我丢怕了钱包”,也不能说“他看傻了那幅画”。能说与不能说应该有条件来控制,O和C之间的语义关系可能是一个控制条件,但是目前还没有确切的规则可用。
  在这种情况下,只好先避开表层结构1,选择2和3。经过初步实验我们看到,就表达命题意义来说,用表层结构3表达语义结构Ⅱ,用表层结构2表达语义结构Ⅰ、Ⅲ、Ⅳ、Ⅴ、Ⅵ,受到的限制最少。这样,讨论的范围又缩小到了两种表层结构形式。问题就变成了:如何找到用这两种句法形式表达六种语义关系格式的控制条件。我们把这种逐步缩小问题范围的做法叫作使生成目标受限,实际上这是对复杂问题的一种妥协。也就是对二价动结式,放弃生成所有的表层句式,寻找尽可能简单和有效的控制条件,先用部分表层结构形式表达其多种语义格式。
    5.2 生成表层结构的控制条件
  从语义结构生成表层结构的主要控制条件是动结式组成成分之间的语义关系。
  对于二价动结式的组成成分S、O、V、C,如果S是V的主体格,而且:
  (一)如果S、O、V、C相互之间满足下列五个条件之一,则可以用表层结构2表达:
  1.(O是V的客体格)且(O是C的主体格)且(C是一价的)
  2.(S是C的主体格)且(O是V的客体格)且(O是C的客体格)
  3.(O是C的主体格)且(V和C都是一价的)
  4.(S是C的主体格)且(O是C的客体格)且(V是一价的)
  5.(O是V的客体格)且(C是V的修饰成分)
  (二)如果S、O、V、C相互之间满足条件6,则可以用表层结构3表达:
  6.(O是V的客体格)且(S是C的主体格)且(C是一价的)
  表层结构2和3都是“把”字句。关于“把”字句,很多学者从各种角度作过研究。张伯江(2000)曾根据句式语法的观点指出,除了组成成分的作用以外,“把”字句的整体意义当中还有句式意义的作用。因此,生成的时候还应当考虑上述控制条件能否符合“把”字句句式意义的要求。我们注意到,动结式与“把”字句似乎有一种自然的联系。“把”字句中V的“处置”意义、C是“把”后面宾语产生的变化等句式意义与动结式的句式意义基本相似。(注:在动结式的表层结构2中,宾语是O;在表层结构3中,宾语是S。)另外,为了体现“把”字句里动作过程的完整性,我们在生成过程的最后一步(处理表层词语)规定,“把”字后面排斥否定谓语形式。
  根据我们的观察和实验,在二价动结式述语结构的五种表层形式中,“把”字句在语义表达的适应性上比较好,常常能够包容除语义关系之外的其他一些选择控制因素。譬如,补语是双音节的动结式一般不宜选择表层结构S+V+C+O,但“把”字句不受这个限制。再如,用“把”字句来表达“

上一页  [1] [2] [3] [4] [5] [6] [7]  下一页

Tags:

作者:佚名

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论
PB创新网ourmis.com】Copyright © 2000-2009 . All Rights Reserved .
页面执行时间:8,171.87500 毫秒
Email:ourmis@126.com QQ:2322888 蜀ICP备05006790号