为什么要用CAT辅助翻译?为什么要用翻译管理系统?以memoQ为例

文章节选改编自大辞科技官网文章《为什么要使用CAT进行翻译?以memoQ为例-大辞科技》

1. 为什么要用计算机辅助翻译工具(Computer Aided Translation,CAT工具)

1.1 计算机辅助翻译工具(CAT tool)是什么

对于CAT(英文名Computer-Assisted Translation Tool,缩写CAT tool)的定义有很多,但是我个人偏向的是徐彬老师在2007年提出的,CAT工具有狭义和广义之分

按照狭义CAT的概念,memoQ是一款CAT工具;它能够使用翻译记忆库、术语库以及特有的语料库等功能帮助译员减少重复翻译、提高翻译效率、减少翻译错误

而按照广义CAT的概念,其实word也可以是一款CAT工具。因为word本身就是一款计算机工具,也是服务翻译流程的。再比如语音识别,也是广义的CAT工具。

1.2 计算机辅助翻译工具(CAT tool)兴起的时代刚需

我们浅用两组数据来说明全球化背景下,语言本地化服务需求的市场及规模

第一组:

图1-2009至2021全球语言服务器产值情况(亿美元)


图2-2015至2021年国内行业产值对比(亿元)


综合以上两点,为什么要使用CAT工具呢?

一言以蔽之,就是以当前全球语言服务规模,减少重复劳动、提高翻译质量已经成为刚需

而一款好用的CAT工具正可以帮助企业和个人实现这些目标


大家试想一下,

按照当下的发展要求,传统的翻译工作“费时低效”,仅凭人力和简单的组织是无法高效高质量完成翻译工作的。

因此,一款能够

的CAT软件就成为了企业、语言服务公司和个人的刚需

根据2020年中国语言服务行业发展报告显示,从语言服务需求方的角度来看,有92.9%的翻译语言服务需求方受访者认同翻译技术的使用能够提高翻译质量,86.1%的需求方受访者认同翻译技术的使用能够降低翻译成本并提高效率。


图4-语言服务需求方对翻译技术评价


咦,细心的宝宝们也会发现,这不就是我们项目管理的“铁三角”嘛!没错!


图5-项目管理铁三角


1.3 “计算机辅助翻译(CAT)”和“机器翻译(MT)”的区别

经常有小伙伴问我,CAT=MT吗?当然不是呀!

——其实通过英文也不难发现,CAT可不是MT,CAT=Computer-Assisted Translation=计算机辅助的人工翻译,所以,CAT的主体是人,是人在做翻译

而MT呢?如图5所示,MT=Machine Translation=机器翻译,计算机在做翻译,是计算机把一种语言翻译成另一种语言。所以,MT的主体是machine,是计算机

图6-机器翻译


因而,倘若使用MT+CAT,也即“机器翻译+人工编辑”的方式,就可以大大提高效率

根据2022年语言服务行业发展报告,91%的语言服务企业认为采用“机器翻译+译后编辑”模式提高了效率,其中有25%的受访者认为“极大提高了效率”;有66%的受访者认为“提高了一些效率”。


图7-MT+CAT的效率统计


如果你看到这里,你或许已经发现,CAT可以帮到你。

那么,它具体是如何帮助你实现质量和效率的双提高呢?

今天我以memoQ为例,简单解释一下这个问题

2. 以memoQ为例,了解CAT的基本技术

推荐你购买这本书:《计算机辅助翻译概率》,是华树老师编的,很详细地跟大家讲解了CAT的各个技术。

2.1 CAT如何帮助提高翻译效率

在提高翻译翻译效率方面,CAT具有:

在这里我挑几个重点介绍

2.1.1 翻译记忆技术

翻译记忆的技术原理非常简单:

用户利用已有的原文和译文,建立起一个或多个翻译记忆库(Translation Memory,TM),在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落),给出参考译文,使用户避免无谓的重复劳动,只需专注于新内容的翻译。

译记忆技术是翻译技术的核心,有助于保持翻译的一致性,提高译员的本地化效率,同时提高翻译质量。


使用翻译记忆有什么好处?

图8-TM加快翻译速度



图9-TM降低翻译成本


图10-TM提高翻译质量


2.1.2 语词检索

语词检索也叫相关搜索( Concordance )。

前面我们讲了,翻译的过程中你可以在记忆库中看到之前翻译过的参考译文,但是前提是,必须达到一定的匹配率。

那,如果没有达到该匹配率怎么办呢?如果匹配率太低,怎么办呢?比如,翻译结果区呈现的记忆库结果默认只会显示60%以上匹配的内容,所以如果匹配率在60%以下,怎么办呢?

——这时,就要用到语词检索功能了:你可以在记忆库中搜索某个特定的词汇、词组、短语及其所在的句段

比如下图中,当前句段(第5句段)没有任何记忆库参考。

图16-翻译结果区


但是实际上,你曾经翻译过类似的内容,所以如果你想在记忆库中查一下,某个词,比如①"this"在记忆库中是如何翻译的,就可以使用②"语词检索(Concordance)"功能,这样你就可以知道:③"哦!原来之前是这样翻译的!"如图17所示。

图17-使用语词检索


然后如果你需要,你就可以使用④"插入"按钮,插入需要使用的译文啦~

这样是不是也可以加速你的翻译呀,从此再也不用担心找不到哪个词啦!

2.1.3 解析器(简化翻译格式)

判断一款CAT工具好还是不好,并不仅仅是靠记忆库和术语库,还有一个很重要的技术,就是解析器技术。也就是说:这个CAT能解析多少种文档?解析到什么程度?——这是经常被忽略的一点。

那,什么是解析器?

不论你的原文是什么,CAT工具都会用自己的解析器,将你各种各样的原文格式,解析为XLIFF格式,从而直接处理.html、.xml、.rtf、.docx、.json、.srt等文件

所以,你会发现,如图18所示,你的原文虽然是word文档,但是导入到memoQ中,会自动帮你解析出原文,所以你看到的是左边是原文,右边是译文。

图18-memoQ中的word文档


你的原文虽然是xml文档,但是memoQ依然帮你解析出需要翻译的那部分,你仍然只需要看左边解析器解析出来的原文,在右边的译文区翻译即可,不需要考虑代码和格式。

图19-memoQ中的xml文档


memoQ的强大在于,只要你的文档是可编辑的,它都能帮你解析!

在memoQ中,不同文档在导入时会使用不同的解析器,默认情况下,文档在导入时会按照默认的后缀名的解析器进行解析,如.html用HTML过滤器。

图20-memoQ的解析器


而且,memoQ的更强大在于,你还可以针对文档需求,自定义你的解析内容。

也就是说,你可以自定义:哪些要翻译,哪些不翻译

比如,如图21所示,假设原文档是excel表格,你可以自定义哪些工作表要导入,哪些文本框的内容要导入,甚至是否导入索引,是否导入注释等等。

图21-memoQ的自定义解析器

当然,不懂也没关系,你只要知道:memoQ会将你的几乎所有格式的原文都解析为适用于CAT工具的XLIFF格式


解析器的作用

相信经过上面的介绍你已经能够看出来,拥有一个强大的解析器对于实际应用中翻译的帮助是非常大的,因为它可以:

图23-保护源文档格式


图24-保护源代码

如果你正在选一款CAT,一定要考虑是否能解析你现有、及将来的源文档!

2.2 CAT如何帮助提高翻译质量

在提高翻译翻译质量方面,CAT具有:

我们依然来挑重点讲

2.2.1 术语库技术

什么是术语库呢?

术语库(term base,简称TB)指的是包含与特定主题相关的某个单词或特定表达的数据库。

——你可以把它理解为专业名词、专业术语的库

术语库中的术语往往是双语的,甚至是多语的。

图27-术语库


那么使用术语库有什么好处?

图28-保证术语一致


图29-提高翻译质量


当然,术语库还有很多其他的细节,我以后会慢慢分享,今天你只需要知道:
术语库是CAT的基本技术,帮助提高翻译质量。就好!

2.2.2 实时预览

实时预览即所见即所得,指在翻译的过程中实时预览最终的译文。

图34-实时预览


当然,memoQ不仅支持内部预览,还支持外部预览

2.3 CAT如何帮助降低翻译成本

CAT可以通过字数统计和加权字数统计,来降低翻译成本

详细的字数统计结果包括:

你译前和译后都可以进行字数统计~

图35-字数统计


这样,加上加权统计的话,你就可以降低翻译成本。

比如如果你设置好加权值,如图36所示。(加权也就是打几折嘛~)

图36-加权统计

你在统计时,就可以进行加权统计,直接计算出打折后的字数啦,就像图37~!

图37-加权后的结果

劳动人民赚钱不易啊呜~

3.总结

总结一下CAT的作用和基本技术:

提高翻译翻译效率方面,CAT具有:

提高翻译翻译质量方面,CAT具有:

在降低翻译成本方面,CAT可以进行:

当然,以上都是基本技术。

如果大家想要详细了解这些技术,可以点击这篇文章阅读欧 《为什么要使用CAT进行翻译?以memoQ为例》

展开阅读全文

页面更新:2024-03-05

标签:译文   术语   效率   记忆   语言   格式   文档   质量   工具   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top