建立CG专业翻译语料库的提议
请先看这里:
目前全球翻译软件分两大类:Machine Translation(机器翻译)和Translation Memory(记忆翻译)。机器翻译主要是面向外语水平一般的个人用户,及文档翻译需求量大的企业、公司。记忆翻译则主要面向外语专业水平较高的个人和组织。
www.chinatranslate.net/IT/it.htm何为记忆翻译?
翻译记忆(TM)的原理其实非常简单。由于专业翻译领域所涉及的翻译资料数量巨大,而范围相对狭窄,集中于某个或某几个专业,如政治、经济、军事、航天、计算机、通讯等专业都有自己的专业翻译公司或部门。这就必然带来翻译资料的不同程度的重复。据统计,在不同行业和部门,这种资料的重复率达到20%~70%不等。这就意味着译者至少有20%以上的工作是无谓的重复劳动。翻译记忆技术就是从这里着手,首先致力于消除译者的重复劳动,从而提高工作效率。
翻译记忆(TM)技术原理是这样的:用户利用已有的原文和译文,建立起一个或多个翻译记忆库(Translation Memory),在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落),给出参考译文,使用户避免无谓的重复劳动,只需专注于新内容的翻译。翻译记忆库同时在后台不断学习和自动储存新的译文,变得越来越"聪明",效率越来越高。几乎所有翻译记忆厂家都会告诉用户:有了TM,你永远不必对同一句话翻译两遍!
机器翻译界一位著名专家曾经说过,机器翻译做了人愿意做的工作,却没有做好;翻译记忆则做了人不愿做的工作!可不是吗,有谁愿意把时间花在重复劳动上,又有谁乐意让一台技术不成熟机器来代替自己的工作呢?翻译记忆技术,实际起了辅助翻译的作用,也就是"计算机辅助翻译",简称CAT(Computer Aided Translation)。
翻译流程
我们来看一个典型的翻译记忆软件工作的例子。启动TM系统来翻译句子"This is a file for demo."。由于这是TM第一启动,当然没有任何"记忆",需要用户输入译文:"这是个演示用的文件"。TM在翻译下一句的同时,也把这一原文和译文做为一个翻译单元储存了起来。当我们再来翻译另一个句子"This is a demo file."时,TM会搜索翻译记忆库,对该句和记忆库中翻译单元进行对比和匹配,挑出原文最接近的翻译单元,给出参考译文。在这里,该参考译文就是"这是个演示用的文件。"用户当然可以接受该译文,也可以做一些修改,修改后的新译文会自动存入记忆库,供以后使用。翻译记忆库就这样储存每一句新的译文,随时为用户提供参考。由于专业领域词汇和句式相对固定,当用户积累了多个有一定规模的记忆库后,遇到的重复句子会越来越多,翻译工作也变得越来越轻松。
TM产品还都支持网络共享记忆库功能。也就是说,当多人同时进行翻译时,可以通过局域网共享一个翻译记忆库。比如,译员A刚刚翻译了"This is a file for demo.",当译员B遇到"This is a demo file."时,系统会给出A的译文"这是个演示用的文件。"。B可以接受,也可以修改,修改后的译文又可供自己或他人重复使用。翻译记忆库就在这样的不断补充和完善过程中,发挥着越来越大的作用。
有了TM,你永远不必对同一句话翻译两遍!
在工作中我们必须接触大量的外文,特别是英文资料,相当丰富,而且也对我们的工作学习影响极大,完全靠人工翻译这样的文章,是不可能的,而且实际上也不可能去做,所以必须有一套可以快速提供高质量译文的工具,词典类、全文翻译类软件是做不到的,只有CAT工具可以选择了,想必大家已经看懂上面的介绍了,其实我们要做的工作也是非常简单的,制作与CG,包括平面设计、多媒体、程序、三维、网络相关的翻译语料库:词库和例句库,并完全无偿的共享该语料库,大家一起来完善他,这样我们将在第一时间得到高质量的译文,开始干吧!
这里我们选择雅信公司的雅信CAT作为首选翻译工具,可以到雅信的站点下载该软件,下面介绍词库和例句库的制作:
一。制作词库
积累大量的与本专业有关的词汇,这些资源比系统提供的词库可能更准确、更有针对性,可以用以下方法转换为供雅信CAT使用的词库。
1、文件格式
有两种格式的文件可以导入雅信CAT词库,它们是:
1)用户格式:(文件后缀必须为.txt)
英文 + 制表符 + 中文释义(多义用“;”隔开)。例如:
=================================================
computer 电脑;计算机
computer aided translation 计算机辅助翻译
use 使用;利用;用法;运用
test 试验;测试;检验;考验;化验;接受测验;进行测试
=================================================
2)雅信SAW格式(文件后缀必须为.saw):
英文 + ^ + 中文释义(多义用“|”隔开) + ^ + 联想词 + ^ + 词性 + ^ + 属性
例如:
=================================================
computer^电脑|计算机^^n^机器
computer aided translation^计算机辅助翻译^软件|系统^^
use^使用|利用|用法|运用^^v^
test^试验|测试|检验|考验|化验|接受测验|进行测试^做^n|v^
=================================================
二。制作例句库
“雅信CAT”把例句库作为提高翻译效率的重要手段之一。如果用户有以前翻译的原文、译文,可以直接转换成可供“雅信CAT”使用的例句库。
1、素材要求
“雅信CAT”支持以下三种格式的文件:
1)单行格式文件
原文句子 ^ 译文句子↙ (换行回车)
注意原文和译文的分隔符为“^”,在键盘上数字6上面。
2)两行格式文件
原文句子↙ (换行回车)
译文句子↙ (换行回车)
3)雅信CAT系统产生的记忆库(后缀为:rf0)的文件
如果你有任何建议,请联系我:xy77510@163.net或者QQ13951625
雅信站点:http://www.yiba.com/
请大家提协作建议