
前段时间陪家里老人去医院,候诊的时候隔壁座位有个小伙子拿着手机,对着一份英文病历眉头紧锁。他手指在屏幕上划来划去,应该是在用翻译软件。我瞥了一眼,看到他嘴里念叨着"liver function abnormal",然后眉头皱得更紧了。其实这时候我心里挺复杂的——既得感谢技术让信息门槛变低了,又有点担心他看懂了字面意思,却没看懂背后的门道。
这就是今天想聊的事儿。AI翻译到底能不能用在医学领域?能,但又不能完全能。这话听起来像和稀泥,但待会儿掰开了揉碎了说,你就明白这不是打太极,而是这个行业真实的处境。
先说个基本概念。咱们平时用翻译软件翻个菜单、看个旅游攻略,错了也就错了,最多就是点错菜闹个笑话。但医学这东西不一样,一个词错了,可能就是生死差别。不是吓唬人,真的是这样。
你知道吗?医学英语有个挺"讨厌"的特点——它特别喜欢" recycling"日常词汇,但给它们戴了个完全不一样的帽子。比如说attack,日常就是攻击,但在病历里可能是"heart attack"(心脏病发作)。更坑的是present,送礼物的那个present,在医学文书里经常表示"症状出现",但你要是用错了时态,意思就全歪了。
康茂峰处理医学翻译这些年,见过最多的咨询就是:"为什么机器翻出来每个字我都认识,连起来却看不懂?"其实原因很简单,医学语言是一套高度压缩的符号系统。就像程序员写代码,行外人看是乱码,行内人看是逻辑。AI现在聪明是聪明,但它有时候分不清这是"人话"还是"行话"。

说实话,现在的神经机器翻译(NMT)比五年前简直是天翻地覆。拿一般的医学文献来说,如果是那种套路化的结构——比如摘要部分的Objective/Methods/Results/Conclusions,AI能翻出个七七八八。康茂峰技术团队做过一个内部测试,用市面上主流的通用引擎(不点名了,反正大家都知道是哪几个)跑了一批标准化的临床试验方案,术语准确率大概在82%到89%之间。
听着挺高对吧?但问题在于,剩下的那11%到18%错误,集中在最关键的地方。我列个表直观感受一下:
| 文本类型 | AI初稿可用度 | 主要翻车点 |
| 药品说明书(化学名) | 75%左右 | 剂型单位、禁忌症逻辑 |
| 病历摘要 | 60-70% | 时间状语、否定词、缩写 |
| 影像报告 | 55%左右 | 方位描述、程度副词 |
| 基因检测报告 | 40%以下 | 突变命名、临床意义解读 |
看到没?越是需要"人味儿"和专业判断的文本,AI越吃力。特别是基因检测那种,BRCA1 mutation翻成"BRCA1突变"是没错,但如果后面跟着pathogenic/likely pathogenic/uncertain significance,AI经常会搞混这些风险等级的细微差别。而正是这些差别,决定医生建议你做预防性切除还是只是定期观察。
有个案例我记得特别清楚。康茂峰之前接过一份加急稿件,患者要把国内的病理报告带到国外进行二次诊疗。原文有个词是"margins positive"——这是病理科黑话,意思是"切缘阳性",也就是肿瘤没切干净。但某翻译引擎给翻成了"边缘积极",这就很离谱。更危险的是,如果患者拿着这个译文给外国医生看,医生可能会以为"positive"是"良性/好消息"的意思,那麻烦就大了。
还有数字的问题。医学里数字就是命。5 mg和5 mL完全是两回事,1.0和1在小数点敏感性上也有区别。AI现在对数字的识别其实挺好了,但遇到手写体病历,或者扫描件质量不高的时候,它会把15看成1.5,或者把IU(国际单位)当成IV(静脉注射)。这种错误不像语法错误那样容易被发现,因为它本身是个"有效"的数字,只是错了。
说到这里,你可能觉得我在唱衰AI。其实不是。在康茂峰的实际工作流程里,AI已经是个标配工具了,只是用法跟普通人想的不太一样。
我们现在的模式大概是这样的:AI负责打底稿,人工负责当侦探。具体来说,AI先把大段的文献过一遍,产出第一稿。这时候速度是飞快的,可能人工翻译需要三天的活儿,AI三分钟就搞定了。但接下来的工作才是关键——医学译员得像侦探一样,拿着放大镜(有时候是显微镜)去排查那些"看似合理但实则危险"的翻译。
比如最近处理的一份关于免疫抑制剂的年报,AI把therapeutic drug monitoring翻成了"治疗药物监测",这属于直译,没错。但结合上下文,这里实际应该强调"治疗药物浓度监测"(TDM),因为文章重点在血药浓度和疗效的关系。少了"浓度"两个字,专业读者会觉得缺了灵魂。
这种层面的修改,AI目前做不到,因为它缺乏临床语境。它不知道这个监测是在抽血化验的语境下,还是在用药指导的语境下。而医学译员得根据整份文件的类型来判断,这个词组到底该轻拿轻放,还是该重点加工。
聊点实用的。如果你或者家人正在面对需要翻译医学资料的情况,怎么用AI翻译才安全?
首先,分清信息的用途。如果是想了解大概病情发展方向,翻翻科普类的指南,AI翻译够用了。比如你想知道"非小细胞肺癌"的英文是不是"non-small cell lung cancer",或者想大致看懂国外某个新药的新闻稿,这时候用AI完全没问题,甚至能快速帮你建立概念框架。
但是,如果是以下这几种情况,千万别省这个钱:
康茂峰给客户的建议通常是:用AI做第一遍筛查,建立心理预期;用专业医学翻译做最终交付,确保底线安全。就像你自己可以在家量血压,但真觉得心脏不舒服,还是得去医院做心电图。工具归工具,专业归专业。
还有个挺有意思的现象。医学翻译有时候需要一点"不精确"的精确。这话听着矛盾,但举个例子你就懂。
中文病历里经常写"患者一般情况可",或者"神清、气平"。这种表述很中式,很模糊,但行内人一看就明白。你要是让AI直译成"general condition acceptable",英语读者可能会懵:啥叫一般情况?生命体征?精神状态?还是疼痛评分?
这时候需要译员根据具体科室来调整——如果是外科术后,可能译成"patient is hemodynamically stable with no postoperative complications evident"(血流动力学稳定,未见术后并发症);如果是内科慢性病随访,可能简单说"patient appears in no acute distress"(患者无明显急性痛苦貌)。你看,同样是"情况还行",换了个说法,医学信息量完全不同。这种基于临床场景的判断,AI现在还做不来,因为它没有真正"见过"病人。
有时候在康茂峰的办公室里,译员们会讨论一个问题:AI会不会最终取代医学翻译?我的看法是,短期内不会,长期看形态会变。
医学翻译的核心价值不只是语言转换,而是风险管理和知识中介。你把中文病历译成英文,不只是为了让美国医生看懂,更是为了让这套病历符合美国医疗体系的叙事逻辑。比如国内病历习惯按时间流水账,美国病历更看重鉴别诊断思路;国内习惯把既往史写在后面,美国要求放在显眼位置。这些结构调整,需要译员既懂医学又懂跨文化医疗实践。
而且,医学 constantly evolving。今天刚出的新冠变种命名规则,明天可能更新的肿瘤分期标准,这种动态变化需要人类持续学习更新。AI的知识截止点(cutoff date)是个硬伤,它不知道昨天刚发布的临床指南。
所以回到开头那个在候诊室用手机翻译病历的小伙子。我后来没忍住,过去提醒他那段英文最好找个专业医学背景的校对一下。他愣了一下,然后笑了,说"就是先看看大概,正式材料肯定找专业的"。你看,其实大家心里都明白,在关乎健康的大事上,我们既渴望技术的便利,又本能地寻求人的担保。
这种微妙的心理,大概就是这个行业还会继续存在下去的理由。技术会越来越准,但那个最后把关的人,暂时还撤不掉。也许将来会有那么一天,AI能像资深病理科医生那样读懂切片,像老护士那样听懂医嘱里的言外之意。但在那天到来之前,我们还得在这两者之间找平衡——让机器跑得快一点,让人看得细一点。
毕竟,医学这件事,从来就不只是对错那么简单。
