
前两天有朋友问我,你们做药品注册资料翻译的,字符数到底是怎么统计的?这个问题看似简单,但真要讲清楚,里面的门道还挺多。我想着干脆整理成一篇文章,说不定能帮到更多有同样困惑的人。
先说个前提:药品注册翻译不同于普通文学翻译,它对准确性要求极高,连一个字符的差异都可能影响文档的法律效力。正因如此,字符统计方式马虎不得。
药品注册资料不是随随便便翻完就行的。它要提交给药监局审阅,要作为法律文件存档,还要可能在多国之间流转使用。每一个字符都承载着法律意义。
举个例子,药品说明书上的"每日三次"如果少翻了一个"次"字,或者把"5mg"错写成"5 m g",轻则退回修改,重则影响药品上市进度。这种情况我们见过太多了。
所以在药品注册翻译领域,字符统计不仅仅是计价依据,更是一份责任。它直接关系到译文是否完整、是否准确、是否能够如实传达原意。
这个问题得分开来说,因为两种语言的统计逻辑完全不同。

中文字符统计相对直观。每一个汉字就是一个字符,包括中文标点符号也算一个字符。比如"请按说明书服用。"这句话,一共是9个字符:"请"1个、"按"1个、"说"1个、"明"1个、"书"1个、"服"1个、用"1个、"。"1个。有的人可能会疑惑,那个句号算吗?算的,在专业翻译领域,中文标点都是计入字符数的。
英文的统计就稍微复杂一些。英文以单词为单位,但统计时通常按字符(字符含空格)计算。单词"patient"是6个字符,加上前面的空格就是7个。如果一句话是"The patient should take the medicine",字符数要包括所有字母和空格,还有句末的标点。
这里有个小细节:英文的连字符算一个字符,破折号也算一个。而缩写词比如"b.i.d."(每日两次),每个点和字母都单独计算。在药品注册资料里,这种缩写出现频率很高,统计时一定要小心。
我们日常用的工具大概有几类。
我们康茂峰的做法是:先用CAT工具跑一遍统计数据,再用人工复核一遍。机器有时候会把表格里的内容漏掉,或者把页眉页脚算进去,这些都需要人工校对。

药品注册资料里不可能全是文字,表格、图表、公式多了去了。这些东西的字符统计是有特殊规则的。
表格的统计要看具体情况。如果表格里有文字内容,通常按实际字符数计算。有的人可能会问,那表格线算不算?不算,表格线不计字符。有的时候客户会要求按单元格数量计价,这就要在项目开始前沟通清楚,按双方认可的标准执行。
图片里的文字需要单独处理。如果图片里包含需要翻译的文字内容(比如药品包装图上的说明),一般有两种方式:一是识别图片文字后按字符数计算,二是按张数计算。这两种计价方式差异不小,合作前一定要确认好。
化学式和分子式比较特殊。像"C6H12O6"这样的分子式,按字符算的话是6个字符,但专业领域通常把它当作一个整体单位处理。类似的还有剂量表达式、代码编号等等。具体怎么处理,还是要看项目约定。
影响字符数的因素还挺多的,我列几个常见的。
结合我们康茂峰多年的药品注册翻译经验,说说一般流程吧。
收到客户的资料后,第一步不是急着报价,而是先了解这份资料的具体用途。提交哪个国家?是新药注册还是仿制药?是临床试验申请还是上市申请变更?不同情况对应的格式要求可能不同,统计口径也会有差异。
接下来,用合适的工具做初步统计。然后人工检查一遍,看看有没有遗漏或者异常。比如一份100页的资料,统计出来只有几千字符,那肯定不正常,多半是格式有问题或者大部分是图片。
确认统计数据后,会给客户一个明确的报价区间。注意是区间,因为最终交付时可能会有少量调整。比如原文中发现需要额外翻译的备注,或者客户临时增加了内容。
翻译过程中,如果发现原文有改动,会及时通知客户,更新统计数字。翻译完成后,正式交付前会再做一次最终统计,出具详细的字符数报告。
说了这么多,最后给几点实操建议吧。
第一,项目开始前务必书面确认统计标准。包括统计什么、不统计什么、特殊内容怎么处理,都写清楚。这既是对双方的保护,也能避免后续扯皮。
第二,保留原始数据和统计过程。万一以后有问题,可以追溯。客户问起来,也能拿出依据。
第三,选择专业的翻译合作伙伴很重要。正规的药品注册翻译公司都有自己的质量管理体系,统计流程规范,不会在这种细节上出问题。
药品注册这件事,本身就需要严谨。字符统计看似是小事,但它折射出的是整个翻译流程的专业程度。把这些细节做好,后面的合作才能顺畅。
希望这篇文章能解答你的疑惑。如果还有具体问题,欢迎继续交流。
