XML类型的文件具有平台独立性和较高的结构化特征,可以表示从文本到图形等多种数据类型和格式,所以被软件开发行业广泛运用。对于软件本地化行业人士而言,XML文件的本地化翻译是经常要解决的问题。
使用翻译记忆技术对XML文件进行高效地本地化翻译是本地化行业通行的做法,这方面的工具很多,其中TagEditor是常用的翻译XML文件的翻译记忆工具之一。
TagEditor翻译XML文件需要翻译人员设置XML文件对应的DTD文件(扩展名INI),这个文件用于TagEditor解析需要翻译的文字,通常INI文件由客户提供,或者翻译人员分析XML文件的标识符(Tag),然后自己编写INI文件。
本文的重点不是讨论如何使用TagEditor具体设置INI和翻译XML文件(这个问题可以查看TagEditor的帮助文档)。本文以一个本地化项目的问题实例,描述使用TagEditor翻译XML文件经常遇到的问题,以及解决这类问题的思路和方法。这种方法同样适合使用TagEditor翻译Html,SGML等文件。
1.问题介绍
客户需要把一个XML文件从美国英语翻译成简体中文,客户已把XML文件转为TagEditor的TTX,并且提供了Trados 翻译记忆文件.tmw和对应的INI文件。
使用Trados打开客户提供的tmw文件,然后在TagEdtior中打开TTX时,弹出对话框,显示如下文字信息:
TagEdtior的工具栏中只有“open”、“Restore Source”、“Copy Source”、“Close”四个功能按钮可用,并且翻译无法存入TM。
2.陷入迷雾
从提示信息看,问题是TTX文件应用的TM库文件(tmw)与TTX文件需要的TM库文件不一致引起的。
首先看看客户提供的TM是否有问题。打开tmw文件,经查看Source language 和Target Language设置正确,分别是“EN-US”和“ZH-CN”。
为了彻底分析原因,使用Trados Workbench重建一个空的TM,源语言指定美国英语,目标语言设定简体中文。然后在TagEditor中设置好客户提供的INI文件,打开客户提供的TTX文件,相同错误提示对话框同样弹出,TM仍然无法工作。 是否是客户提供的INI错误呢?使用UltraEdit或“记事本”等程序,打开客户提供的INI文件,检查格式和内容,没有发现问题。
看来问题就出在客户提供的TTX文件上,那么到底是什么问题引起的呢?
3.水落石出
使用UltraEdit或者“记事本”打开客户提供的TTX,发现原语言是SourceLanguage="EN-US" ,而目标语言是TargetLanguage="EN-GB"!问题就在这里。请参看下图。
原来客户创建TTX时,使用的是从美国英语到英国英语(Great Britain English)的TM。而客户提供的TM是在源语言EN-US和目标语言ZH-CN,所以TagEditor打开TTX时,提示语言不匹配的错误。
4.解决方法
找到了问题的根本所在,解决这个问题就是“小菜一碟”了,可以使用以下两种方法之一。
方法之一:
请客户重新发送使用TM处理的TTX文件,然后本地化公司使用TagEditor处理。这是最安全的方法。
方法之二:
首先,创建一个SourceLanguage="EN-US" TargetLanguage="EN-GB"的TM,在TagEditor中,打开客户提供的TTX,然后“File” > “Save Target As”成单语言文件(.xml)。
接着,在Trados WorkBench中打开客户提供的TM,在TagEditor中处理上一步得到的单语言文件,保存成TTX文件,经过翻译就可以了。
5.经验体会
- TagEditor文件翻译中的问题大多数是当前使用的TM“语言对”设置与处理TTX的TM不一致引起的。
- 不要相信客户永远是对的,很多客户的项目管理人员不熟悉具体的翻译技术,或者文件经过多次转包,客户发错了文件。
- 尽可能根据现象和经验,分析可能的原因,想办法解决,并且解决后告诉客户他们提供的文件存在问题,以及解决问题的方法,这样能体现本地化公司的专业性。
|