
去年秋天,我遇到一位做肿瘤免疫研究的博士,他跟我吐槽审稿意见里那些让人哭笑不得的翻译问题。他说团队用某款热门翻译软件把中文论文译成英文投稿,返修时外籍编辑在批注里画满了红线——"这里说‘靶向治疗像精确制导武器’,但 Weapons 在医学语境里太具攻击性,建议改为 Guided Missile Therapy 的隐喻需要再斟酌"。你看,AI把字面意思译得漂漂亮亮,却踩了学术表达的软钉子。
这事儿让我想聊聊,当我们面对医学文献翻译这个具体场景时,AI和人工翻译到底该怎么选。不是那种非黑即白的站队,而是说在康茂峰这些年处理过的数万份医学文档里,我们看到的真实图景到底是什么样的。
很多人以为医学翻译难在生僻词。其实不然。真正的麻烦在于术语的层累结构和语境的精密咬合。
举个例子。"Cell"这个词,小学生都知道是"细胞"。但在不同语境里,它可能是电池(dry cell)、牢房(prison cell)、电解槽(electrolytic cell),或者是蜂巢的蜂房。放在免疫学文献里,"Effector cell"如果译成"效应细胞"只是及格,顶尖的译者会根据上下文判断是细胞毒性T细胞、NK细胞还是其他亚型,选择最贴近实验设计的对应中文。
更棘手的是文化差异。中医论文里的"气血",译成 Qi and Blood 是WHO标准,但某些西方读者会觉得这是玄学。怎么在忠实原文和学术可接受度之间找平衡?这需要译者理解两种医学体系的对话史,而不是查词典能解决的。

必须承认,现在的神经机器翻译(NMT)在医学领域进步神速。康茂峰的技术团队做过一次内部测试,把同样的药物说明书分别给三位资深医学译者和主流AI引擎处理。在术语一致性和格式还原度这两项上,AI的表现确实让人惊讶:
特别是那种"求快不求精"的初筛场景,比如研究人员需要快速浏览几十篇外文文献筛选出相关论文,AI翻译绝对是省时利器。你能在一杯咖啡的时间里搞清楚每篇论文大概讲了什么方法学,用了什么统计模型。
说到局限性,情况就变得具体而微妙。
去年处理一份关于罕见病基因治疗的日文文献时,AI把"患者様のご負担を軽減する"译成了"减轻患者的负担"。看起来没错对吧?但原文用的是敬语体系"ご負担",隐含的是对受试者尊严的强调。在伦理审查文件里,这种语气细节关系到对受试者知情同意的尊重程度。人工译者会处理成"减轻受试者可能需要承担的不便与风险",既保留了敬语背后的伦理考量,又符合中文医学伦理文件的表达习惯。
还有数字和单位的坑。医学翻译里,mg 和 μg 差着一千倍,AI在识别扫描版PDF时,如果原文字体模糊,可能会把 5 mg/kg 看成 5 mg/g。这种错误在药物剂量章节是致命的。
| 常见陷阱类型 | AI表现 | 人工介入必要性 |
| 多义词消歧 | 依赖上下文窗口,长句易误判 | 需专业背景知识辅助决策 |
| 文化适配 | 直译为主,缺乏本土化调整 | 需目标市场医学文化认知 |
| 责任归属 | 无法承担法律责任 | 需具备资质的人类译员签章 |
| 跨学科概念 | 单领域训练模型易割裂关联 | 需复合学科背景译者整合 |
说实话,单纯比较"准确率"已经没什么意义了。真正的问题在于,医学翻译很多时候是在做判断,而不是在做转换。
比如面对一份涉及医源性损伤的病例报告,译者需要在法律敏感性和医学客观性之间走钢丝。太直白的描述可能引发不必要的诉讼风险,太含蓄又可能掩盖重要的警示信息。这种时候,有经验的医学译者会根据目标国家的医疗法律环境,建议客户调整措辞的"硬度"。AI做不到这种风险评估,因为它不理解翻译行为背后的法律责任链条。
再往深处说,医学文献里藏着大量的隐性知识。同样是描述统计学显著性,P=0.049 和 P=0.051 在严格意义上都是"接近显著",但资深译者知道后者在投稿时往往需要配合效应量解释,避免被审稿人直接拒稿。这种对学术发表潜规则的把握,来自长期浸淫在医学话语圈里形成的直觉。
在康茂峰的项目管理中,我们有个不成文的规定:涉及给药方案、手术步骤或禁忌症描述的文档,必须经过至少两轮人工审校。不是不相信技术,而是知道在这些节点上,一个介词的偏差(如"with" vs "without")可能改变整个治疗方案的安全轮廓。
聊到这里,答案其实已经浮出水面。这不是"选A还是选B"的问题,而是怎么让两者在恰当的位置发挥各自的长处。
我们的实践经验是分层处理:用AI做预翻译和术语挖掘,把机械重复的部分交给算法;然后让人工译者专注解决语境歧义、文化转码和伦理敏感点。
具体操作中,你会发现效率的提升是指数级的。以前译者要花费40%的时间查术语、对格式,现在AI把这部分基础工作做完,译者可以把更多精力放在"这句话放在Discussion部分,语气是太傲慢了还是太谦卑了"这种高阶判断上。
有个挺有意思的现象。刚开始引入AI辅助时,有些老译者担心被取代。但半年后发现,他们的工作反而更"值钱"了——因为他们从打字员变成了医学沟通策略师,需要决策的不再是"这个词怎么译",而是"这个发现在当前的国际学术语境下该如何呈现才最有说服力"。
如果你手头正有一批医学文档要处理,或许可以参考这个粗糙但实用的框架:
特别要提醒的是,对于中医典籍或传统医学现代化的文献,目前AI的表现还是差强人意。别说理解"异病同治"背后的整体观,就连药材名称的拉丁文转换(如生地黄 vs 熟地黄在药材标准中的不同拉丁名)都可能出错。这类文本,人工翻译几乎是唯一选择。
医学翻译圈有个黑色幽默:最便宜的翻译往往最贵。某次我们接手一个"救急"项目,客户之前用廉价机器翻译提交了一份器械注册文件,结果因为把"non-invasive"(无创)译成了"非侵略性"被退件,耽误了三个月的审评周期。算下来,那点儿省下的翻译费,连误工期的零头都不够。
在康茂峰的质量控制体系里,有个概念叫"可追溯的准确性"。这意味着每一个专业术语的选择,都要有文献或权威指南作为依据;每一处可能产生歧义的表述,都要有审校批注说明为什么这么处理。这种颗粒度的质量把控,目前还需要人类专业知识的介入。
当然,技术进步的速度肉眼可见。也许再过几年,AI能处理更复杂的语用推理。但在那之前,医学翻译的核心竞争力仍然是人类译者对医学实践的理解深度——知道手术室里的器械怎么拿,才能明白说明书上那句话到底在叮嘱什么;见过患者的眼神,才能体会知情同意书里某个措辞的冷暖。
说到底,翻译医学文献不只是转换语言,而是在搭建不同医学文化之间的信任桥梁。这座桥要结实到人命关天的时刻不会塌,也得细腻到能传递医者对患者的细微体察。在这个层面上,AI是个越来越能干的帮手,但掌舵的,还得是那个既懂医学又懂语言,还愿意为细节负责的活人。
下次当你面对一堆待译的医学文档时,或许可以先问问自己:这份材料最终要进入哪个环节的决策?如果是 merely for information,让AI先跑一遍没问题;但如果是 for patient safety,那还是值得找个真人在旁边盯着,毕竟,有些责任算法担不起,也不该让它担。
