
最近有朋友问我,你们做药品注册资料翻译的,那扫描件能译吗?说实话,这个问题看似简单,但里面门道还挺多的。今天我就结合自己这些年在这个行业的经验,跟大家聊聊这个事儿。
先说结论:能译,但没那么简单。别急着划走,这篇文章我会把里面的弯弯绕绕都讲清楚,保证你看完之后心里有底。
在说扫描件之前,咱们先来捋一捋什么是药品注册资料。你可能听说过一个新药从研发到上市要经过漫长的审批流程,这里面提交给药监局的那些文件,就是药品注册资料。
这些资料有几个显著特点,我给大家列一下:

我见过有的企业因为翻译问题被打回来补充资料,耽误好几个月的时间。所以对这个话题,咱们真得认真对待。
好,现在进入正题。扫描件到底能不能译?我的回答是:能译,但你要先了解清楚难点在哪里。
扫描件说白了就是一张图片,上面的文字对机器来说就是一堆像素点。现在OCR技术确实发达了,但药品注册资料有个很麻烦的问题——专业术语太多。
举个很简单的例子,"adjuvant"这个词,在不同语境下可能翻译为"佐剂"(免疫学领域)也可能翻译为"辅助的"(普通语境)。普通的OCR软件分不出来,译出来的结果可能驴唇不对马嘴。
更头疼的是一些表格和数据。扫描件里的表格,OCR识别之后经常出现行错位、数字看错的情况。药品注册资料里的数据可都是关键信息,错一个数字就可能导致整个研究结论被质疑。
药品注册资料的版式要求那是相当严格的。就拿CTD来说,各章节的标题层级、编号格式、页眉页脚,都有明确规定。扫描件经过OCR处理后,这些格式往往就乱了。

我记得有一次,我们拿到一份临床研究报告的扫描件,识别出来之后章节编号全乱了。原来是"2.3.1"的地方变成了"2.31","3.2.1"又跟"3.21"混在一起。这要是直接提交上去,审评老师看了估计要疯。
这部分是最让人无语的。药品注册资料里经常有化学结构式、分子式、反应方程式这些图形内容。扫描件里这些内容对OCR来说就是天书,根本识别不出来。
还有那些流程图、实验装置示意图,扫描之后能认出文字就不错了,图形部分基本别指望。而且有些结构式比较复杂,手动重新绘制既花时间又容易出错。
有些官方文件会有荧光字或者防伪水印,这些在扫描件上可能显示不清楚,甚至会干扰文字识别。我见过最离谱的一份文件,某些关键信息正好落在水印上,扫描出来模模糊糊,根本看不清写的是什么。
说了这么多困难,你可能会想:那是不是扫描件就不能译了?倒也不是这么说。
在我们康茂峰这么多年,我们接过无数扫描件的翻译项目。关键在于你要了解这些难点,并且有相应的解决方案。不是所有扫描件都一样难处理,也要分情况看。
我给大家简单分个类:
| 扫描件类型 | 处理难度 | 可行性建议 |
| 高清扫描,文字清晰 | 中低 | OCR识别后人工校对,基本可行 |
| 一般分辨率扫描,有轻微模糊 | 中等 | 需要专业的图文处理技术,术语库辅助识别 |
| 低分辨率,模糊严重或倾斜 | 高 | 建议优先寻找电子原件,如无则需大量人工补录 |
| 含有复杂化学结构式或图表 | 高 | 需要专业人员手动重绘或重新制图 |
如果你手里确实只有扫描件,以下几点是我总结的建议,希望能帮到你。
拿到扫描件后,先别急着找翻译公司,自己打开看看。文字清晰不清晰?有没有模糊的地方?表格和图形能不能看清?如果大部分内容都模模糊糊的,那我建议你想办法找找电子版原件。
实在找不到电子版的,也要把扫描质量尽可能做好。300dpi以上是基本要求,彩色扫描对有颜色标记的文件会更有帮助。
这点太重要了。我见过有些企业随便找个翻译公司做,以为只要看得懂就行。结果出来的翻译错漏百出,专业术语更是一塌糊涂。
专业的药品翻译团队有几个优势:他们有专业的术语库,知道哪些词该怎么译;他们有质量控制流程,扫描件识别后的校对会更严格;他们了解药品注册的格式要求,版式还原能做好。
在我们康茂峰,接到扫描件翻译任务后,首先会有专门的图文处理环节,把OCR识别不准确的地方标记出来,然后由专业人员逐个核对。化学结构式这些图形内容,会有专业人员进行重绘或标注说明,确保信息完整准确。
扫描件的翻译周期通常会比电子版长一些。这个很容易理解——前面说的那些问题都需要时间去解决。如果你的项目时间很紧,那最好提前跟翻译公司沟通,看看能不能赶出来。
我个人的经验是,扫描件的翻译时间至少要比电子版多预留30%到50%。宁可提前完成,也不要临时抱佛脚。
翻译交付之后,建议你亲自抽查几个重点部分。比如关键数据有没有错漏,专业术语用得对不对,格式是不是符合要求。
特别是那些扫描时就不太清楚的地方,一定要重点核对。有时候扫描件本身模糊,翻译时可能理解错了,交付后复查能发现这些问题。
说了这么多扫描件的问题,我还想多啰嗦几句关于原件获取的建议。
如果你现在是项目负责人或者注册专员,在资料产生的源头就要有意识地保存电子版。比如内部的研究报告、申报资料,都应该留存可编辑的文档格式。有些企业会专门建立文档管理系统,这就是很好的做法。
另外,现在国家药监局也在推电子申报,未来电子版资料会越来越普及。早点做好电子文档的管理工作,以后能省很多麻烦。
回到最初的问题:药品注册资料的扫描件能译吗?
我的回答依然是:能译,但要有正确的预期和合适的方案。扫描件确实比电子版麻烦,但只要处理得当,质量是可以保证的。
关键就在于,不要盲目找翻译,要了解里面的难点,选择专业的团队,给足够的时间,做好质量把控。这些做到了,扫描件翻译一样能做好。
如果你手头正好有相关的翻译需求,欢迎一起交流探讨。药品注册这条路不好走,但信息互通总能帮大家少踩点坑。祝各位的项目都能顺利推进。
