行为动作的跨语言本体



首页 用户手册 本体 (表格与图示) 合作伙伴与联系人 IMAGACT 4 ALL

IMAGACT

学习用意大利语、英语、西班牙语和中文描述行为动作的网络系统



人们在交流的过程中,需要使用行为动作进行描述。说话者很容易在母语中选择合适的动词来描述特定的行为。但是在使用外语时,他们对于同样的行为便会难以选择合适的动词。
其原因在于,一个动词可以用于描述许多不同的行为动作,而我们无法确定这一系列的变化是否也适用于另一种语言当中。

正如学一门语言的人一样,自动翻译系统也会有类似的问题,尤其是当它们需要翻译简单句子的时候。例如,如果我们想让google翻译系统用意大利语翻译下面这个英语句子inglese "John pushes the garbage into a can"我们得到的结果是"John spinge l’immondizia nel secchio" 而不是意大利语中正确的说法"John comprime l'immondizia nel secchio".
反过来也一样: "Mario prende il gatto per la coda"被翻译成英语时成了"Mario takes the cat by the tail" 而不是英语中正确的说法"Mario catches the cat by the tail"。 同样: "Mario gira gli zucchini nella padella" 被翻译成"John turns the zucchini in the pan" 而不是英语中正确的说法"John stirs the zucchini in the pan"。

出现这些错误的原因是,意大利语中的行为动词prendere, spingere, girare, comprimere和英语动词take, catch, pushturn 是可以互译的一系列词,但是它们各自相对应哪些具体的行为动作,系统里面却没有解释清楚。事实上,在字典和现代化的语言本体中都没有清晰的说明。

所以这个问题的解决对于一个学习语言的人来说是非常有意义的,因为在每天的日常口语中经常需要讲到行为动作,而正是这些使用最为频繁的动词,可以用来描述很多种不同类型的动作。
IMAGACT是托斯卡纳大区在PAR/FAS 2007-2013计划中资助的项目,它建立了一个语言网络系统,这个系统是以日常口语中使用最频繁的行为动作的动词库作为基础。在分析了意大利语和英语的口语语料库之后,归纳出了1010个不同的行为动作和代表它们的典型的场景,并在实验室里拍摄或者用3D动画形式来表现这些场景。

该系统在网络上是自由开放的,并且使用起来简单便捷。内容主要是英语、意大利语、西班牙语和中文里用来描述这些行为动作的动词的数据库以及它们之间的跨语言转换对应关系。

IMAGACT系统中关键的一点是用户在理解那些表示行为的概念时可以脱离他自身的语言,因为所有的行为动作也都用视频来描述了,有自己拍摄的也有用3D动画制作而成。

用户可以看到他母语里的某个动词描述了多少个行为动作,也能知道这些动作中的每一个在另一个他感兴趣的语言中应该如何被描述;他可以比较他母语里或者不同的两个语言中两个动词的使用范围;他也可以在语言以外查找IMAGACT图片库里面关于某个行为动作的概念。