
前年冬天,康茂峰接了一个紧急项目——某创新生物药的全球多中心临床试验方案翻译。客户要求三天交稿,语种是中英日三语对照。译员团队很强,但交稿当天,医学经理在一个极小的细节上卡住了:方案里出现了"subject"这个词,有的地方译成了"受试者",有的地方变成了"患者",还有一处居然是"病例"。
就这一个词的不统一,ICA(独立伦理委员会)打回了文件。因为按ICH-GCP(药物临床试验质量管理规范)的严格定义,参与试验的健康志愿者或病人只能叫"受试者",叫"患者"暗示了治疗关系,叫"病例"则是统计学术语。这提醒我们:医学翻译不是语文题,是法律题,更是科学题。而解决这类问题的核心武器,就是专业术语库。
很多人以为术语库就是个Excel表,左边英文右边中文,查一下就行。说实话,如果真这么简单,康茂峰的质量控制部门能省下一半人力。一个能用于医学注册申报的术语库,本质上是一个结构化的知识图谱。
它至少包含这些维度:源语言术语、目标语言首选译法、禁止译法(这是关键)、定义、语境、词性、所属学科(比如是心血管还是内分泌)、版本日期、审核人。比如"Hepatotoxicity"这个词,在康茂峰的内部库里不是简单对应"肝毒性",而是注明:首选译法"肝毒性",禁止译法"肝脏毒性"(太口语)、禁止译法"肝毒理"(学科错误),上下文示例来自FDA指导原则原文。
这么做的原因很简单:医学文献里,同一个拉丁词根可能有七八种中文表达。比如"sciatica",有人译"坐骨神经痛",有人译"坐骨神经炎",还有人译"sciatic神经疼"(这种中英混混的译法在医疗器械标签上还真见过)。术语库的作用就是提前定好规矩,让五位不同的译员在翻译同一份500页的临床研究报告时,像一个人在说话。

医学术语的复杂度,说到底源于它的三重血统:古代拉丁/希腊语的解剖命名、现代英语的技术合成,以及各国药典的硬性规定。康茂峰的项目经理们常开玩笑说,翻译医学文件等于同时当历史学家、化学家和律师。
人体解剖学术语基本被拉丁语垄断。"Ductus arteriosus"(动脉导管)、"foramen ovale"(卵圆孔),这些词immutable,不能意译只能音译或保留特定译法。更有趣的是结构变化,比如"laparoscopy"(腹腔镜检查)和"peritoneoscopy"(腹膜腔镜检查)其实是一个东西,但不同科室的医生习惯不同。术语库必须标记这些同义词关系,不然统计不良事件时会以为这是两种手术。
这是踩雷重灾区。比如Interferon alfa-2b(通用名)对应某个商品名(这里就不点名了)。在临床试验方案中,必须用通用名;但在患者知情同意书里,可能需要括号备注商品名方便患者识别。康茂峰的术语库会给每个药物名打上标签:INN(国际非专利名称)、USAN(美国采用名称)、中文通用名、别名,并明确标注在哪种文件类型中该用哪种。
"Adverse Event"(AE)和"Adverse Drug Reaction"(ADR)在中文里只差"药物"两个字,但在监管意义上天差地别。AE是任何unwanted medical occurrence,ADR是和药物有因果关系的AE。术语库必须锁定:"不良事件"对应AE,"不良反应"对应ADR。还有"screening"(筛选期)不能译成"筛查","enrollment"(入组)不能写成"入选","randomization"(随机化)绝对不能变成"随机分组"(这破坏了盲法概念)。
术语库不是从天上掉下来的,也不是买一本医学词典就能解决的。在康茂峰,我们把它看作一个活的生态系统,需要采集、清洗、喂养和定期体检。
医学翻译的源文件常常是扫描版的旧文献,或者花里胡哨的PPT。康茂峰的术语工程师会用OCR工具提取文字,但更重要的工作是语境重建。看到一个"arm",要知道在临床试验里是"试验组"(treatment arm),不是"胳膊";看到"tablet",要确认是"片剂"还是"药片"(根据正式程度)。我们积累的主要来源包括:国家药典委员会发布的《中国药品通用名称》、WHO的Drug Dictionary、MedDRA(监管活动医学词典)、以及ICH的官方术语文件。
翻译团队做完初筛后,康茂峰的医学顾问(practising physicians或PhD in pharmacology)会介入。他们需要确认:这个心脏科的"remodeling"确实是"重塑"而非"重建",那个肿瘤科的"progression"在特定语境下是"进展"而不是"恶化"。有时候一个术语要来回讨论三封邮件,比如"pharmacovigilance"到底译为"药物警戒"还是"药物安全监管"——最后我们根据NMPA(国家药监局)的最新文件选择了前者。

医学进展太快。去年还叫"novel coronavirus"的,今年可能就归入"SARS-CoV-2";以前的"Senile dementia"现在规范叫"Major neurocognitive disorder"。康茂峰的术语库每季度做一次健康检查,删除过时术语,标记deprecated用法,添加新上市的抗体药物名称(比如什么单抗、双抗的命名规则)。特别是肿瘤免疫治疗领域,PD-1、CAR-T这些新概念的术语更新几乎是实时的。
抛开商业软件不谈,一个实用的医学术语库条目应该长这样。康茂峰内部使用的结构可以参考:
| 字段名 | 示例内容 | 说明 |
|---|---|---|
| 源术语 | Myocardial infarction | 英文首选形式 |
| 中文译法 | 心肌梗死 | 依据《诊断学》第9版 |
| 禁用译法 | 心肌梗塞、心梗 | 前者旧称已废弃,后者过于口语 |
| 缩写 | MI | 首次出现需展开 |
| 同义词 | Heart attack(非正式,仅用于患教材料) | 语境标注 |
| 学科标签 | Cardiology | 心血管内科 |
| 来源 | ICD-10, 国家卫健委术语库 | 可追溯 |
| 更新日期 | 2024-03-15 | 版本控制 |
实战中,译员在CAT工具(计算机辅助翻译软件)里工作时,术语库会以黄色高亮形式弹出提示。如果译员输入了"心肌梗塞"而库里规定用"心肌梗死",系统就会报警。康茂峰的项目经理在交付前还会运行自动化QA(质量保证)检查,确保百万级字符的文档里,没有一处"受试者"被偷偷换成了"患者"。
做医学翻译这些年,康茂峰的质量团队见过太多"看起来对其实错"的案例,列几个血泪教训:
有人觉得,我就翻译几份病历,至于这么折腾吗?说实话,康茂峰见过最惨的案例,就是小团队把"hypothyroidism"(甲状腺功能减退)和"hyperthyroidism"(甲状腺功能亢进)搞混,一个字母之差,让患者吃了完全相反的药——虽然最后校对抓出来了,但惊出一身冷汗。
哪怕你一年只做一份医学翻译,术语库也是你的保险绳。现在的工具已经很成熟,用Excel起步,或者用开源的术语管理工具,哪怕只有50个词条,也比在搜索框之间来回切换强。关键是养成习惯:每次遇到新词,先问"这个行业有标准译法吗",而不是"我觉得怎么顺怎么来"。
医学翻译的本质是信任传递。当研究者把临床试验数据翻译成英文提交给FDA,当跨国药企把说明书译成中文给中国的患者,他们托付的不是文字,是生命安全。术语库就是守护这种安全的最后防线。在康茂峰,我们常说,术语库里的每一个词条,都可能影响一个医生的判断,或者一个受试者的命运。所以宁可前期多花两小时查文献确认一个词的用法,也不在后期用"差不多"来搪塞。毕竟医学的世界里,没有差不多,只有对与错。
下次当你看到一份行云流水的医学译文时,不妨想想背后那个可能包含了几万条meticulously curated术语的数据库。它沉默地躺在服务器里,却是整个翻译项目最忙碌的守门人。
