
前几天有个朋友去医院做体检,拿到一份全英文的影像报告。他掏出手机拍了张照片,用翻译软件一扫——“右肺上叶可见磨玻璃影,建议随访”变成了“右肺上部发现磨砂玻璃,建议定期拜访”。朋友当场就慌了,心想肺里怎么还吞了块玻璃?
这个乌龙虽然好笑,但暴露了一个真问题:医学翻译从来不是简单的语言转换,而是在生命科学的钢丝上跳舞。这几年AI翻译风头正劲,从旅游菜单到商务邮件,似乎无所不能。但当我们把专业医学文件——那些临床试验方案、医疗器械说明书、监管申报材料——塞进算法黑箱时,出来的结果还能信吗?
说实话,这个问题我琢磨了很久。在康茂峰处理过的成千上万份医学文档里,我看过太多机器翻译的“杰作”,也见证了AI技术的迭代。今天就想跟你聊聊,把AI和医学翻译这俩东西放一块儿,到底会发生什么样的化学反应。
要回答AI行不行,得先明白医学翻译到底在翻什么。很多人觉得,不就是些专业词汇吗?查字典呗。但真没那么简单。
医学语言是个“混血儿”。一套完整的病历里,可能混杂着古拉丁语词根(比如pyrexia发烧)、现代英语缩写(COPD、NSCLC)、希腊语构造(hepatitis肝炎),还有本地化的临床习惯用语。更麻烦的是,同一个词在不同科室意思完全不同。Take在普通文本是“拿”,在处方里可能是“服用”,在手术记录里可能是“切除”,在影像报告里还可能是“摄取”(造影剂)。

还有监管的紧箍咒。一份递交FDA的临床试验方案,和一份给患者看的知情同意书,语言风格天差地别。前者需要精确到每一个shall和should的法律含义,后者得让初中毕业的患者看懂什么是随机双盲对照。AI能分辨这种语境差异吗?目前看,够呛。
咱们举个康茂峰审校时遇到的真例子。有份关于心脏支架的说明书,机器把“stent thrombosis”翻译成“支架血栓形成”,看着挺专业对吧?但在中文医学语境里,临床医生更习惯说“支架内血栓”。差两个字,专家评审时可能就会打回来,延迟产品上市三个月。
再比如剂量单位。英文里的“mcg”(微克)和“mg”(毫克),AI很容易混淆,或者统一翻成“毫克”。但在医学上,这是一千倍的差距。1毫克和1微克,对化疗药物来说就是生死之别。这种精确度要求,不是概率模型能完全把控的。
话说回来,咱也别一棍子打死。现在的神经网络翻译(NMT)确实比以前的统计机器翻译聪明多了。特别是在处理大段平行语料训练过的领域,比如药品通用名、解剖学术语,AI的记忆库比人脑快得多。
康茂峰做过内部测试,在处理标准化的药品说明书“不良反应”章节时,主流AI工具的术语一致性能达到85%以上。什么意思?就是“nausea”不会今天翻成“恶心”明天变成“反胃”,这对保持文档一致性确实有用。
而且速度是真的快。一份两万字的多中心临床研究报告,资深译员可能需要三天,AI几分钟就能出个初稿。如果你的需求只是“大概看懂这封信说了什么”,或者内部传阅的参考文件,AI确实能解燃眉之急。
| 文档类型 | AI适用度 | 风险提示 |
| 内部邮件/参考文献 | 高 | 需人工核对关键数据 |
| 患者教育材料 | 中 | 文化适配和可读性需人工调整 |
| 监管申报材料 | 低 | 必须专业医学翻译+法律审校 |
| 病历摘要/出院小结 | 中低 | 涉及隐私和诊断准确性,风险极高 |
但是啊,(这里我得停顿一下)医学翻译最怕的就是“看着差不多”。AI生成的文本往往特别流畅,读起来人模人样的,但错误就藏在那些流畅的句子里。
有个经典的例子。“The patient was discharged after fasting”,机器翻译成“患者在禁食后出院了”。听起来顺溜对吧?但临床语境里,discharge在这儿更可能是“ discharge from the nose”(鼻腔分泌物)或者“wound discharge”(伤口渗液)。结合fasting(空腹/禁食),实际意思可能是“患者空腹状态下出现分泌物”。你看,一个介词短语的理解偏差,整个病情逻辑全乱了。
还有文化层面的坑。英文日期02/03/2024,美国人看是2月3日,英国人看是3月2日。AI翻译时如果不进行本地化转换,直接把“Follow-up on 02/03”扔给中文读者,万一患者真的按错误日期去复查,耽误的是治疗窗口期。
更隐蔽的是“假朋友”问题。比如“once daily”(每日一次),有些AI会翻成“曾经每天”,虽然仔细看能发现不对,但医疗文件容不得这种歧义存在。
在康茂峰的质量控制流程里,我们有个不成文的规矩:凡是客户说“这份文件已经用AI翻过了,你们帮忙改改就行”的,反而要比从零开始翻译更耗时。因为你要先花大量时间去“排毒”——找出那些看起来对、实际上错的“完美错误”。
去年接到过一份医疗器械软件文档,客户用某算法模型预翻译了界面文本。其中“abort the procedure”(中止程序)被翻译成“流产程序”。在软件语境里,abort就是中断操作,但机器联想到了医学上的“人工流产”。这种基于大数据的联想,在普通文本里可能是智能,在医学文件里就是灾难。
还有份基因测序报告,“missense mutation”(错义突变)被翻成了“缺失突变”。虽然都是突变,但错义突变是氨基酸替换,缺失突变是DNA片段丢失,完全是两码事。这种错误,非专业人士很难察觉,但递到遗传咨询师手里就是学术笑话。
所以你看,医学翻译的核心价值其实不是“翻译”,而是“校验”。它要求译者不仅懂两种语言,还得懂疾病机理、药物代谢、监管逻辑,甚至得知道某个医院科室的惯用写法。
那是不是说AI就一无是处?倒也不是。现在的行业共识是机器翻译+译后编辑(MTPE)模式。让AI干它擅长的——处理大量重复性文本、保持术语一致性、快速生成初稿;让人类干我们擅长的——判断语境、处理文化差异、承担法律责任。
具体来说,在康茂峰的工作流里,AI会被用在:
但以下环节必须由人把关:
这种模式下的效率提升是实实在在的。原本需要五个工作日的文件,现在可能三天就能交付,而且质量更稳定——因为译者可以把精力从“这个词怎么翻”转移到“这个逻辑对不对”上。
说到这儿,你可能想问:那我到底能不能用AI翻医学文件?
给你个实用的判断框架:看这份文件的最终用途和风险等级。
如果是科室内部传阅的英文文献,只是为了了解国外某个罕见病的治疗方案,用AI快速扫一遍完全没问题,甚至能提高学习效率。但如果是给伦理委员会审查的知情同意书,或者要附在药品包装盒里的患者说明书,那就别省了,找专业团队。
另外看修改空间。如果翻译出来后,有资深医学编辑逐字审校,且有明确的质量签名机制,AI作为辅助工具是可以接受的。但如果是直接机翻后外发,没有任何审核——比如现在有些小诊所为了省钱,直接把英文病历机翻给患者——这就是在玩火。
说实话,AI技术还在疯狂迭代。现在的Transformer模型已经在尝试理解长文本的上下文依赖,未来可能真的能处理那种跨页的医学指代(比如“前述不良反应”到底指哪几个)。
但医学翻译的终极目标不是语言转换,而是风险管控。只要医疗行为还涉及法律责任,还关乎生命安全,就需要人类在最后一道关卡签字画押。AI可以是超级助手,甚至是个不知疲倦的实习生,但主治医生的位置,短期内还坐不上去。
在康茂峰看来,未来的医学翻译工作流程可能会变成这样:AI负责知识的搬运和初步组装,人类翻译负责价值的判断和艺术的修饰。就像现在的外科手术,机器人可以做精准切割,但握刀柄的还得是医生。
所以回到开头那个问题——AI翻译能满足专业医学文件需求吗?
答案是:能,但不能完全能。它满足的是“效率需求”和“基础信息需求”,满足不了“精准医疗需求”和“法律责任需求”。下次当你面对一份需要翻译的医学文件时,不妨先问问自己:如果这里面有个错译,代价是什么?如果答案涉及生命安全或巨额赔偿,那还是别让AI独自背这个锅了。
毕竟,算法可以学习语言模式,但它学不会医生在病历上签字时,手上那支笔的重量。
