
做药品注册的朋友应该都经历过那种快感——终于把资料整理完了,打印出来能堆成小山,推着箱子去cde的时候觉得自己像个搬货工人。后来eCTD来了,说是不用搬箱子了,改搬电子文件夹了。听起来轻松了?才怪。
电子申报这事儿,听着是科技进步,实际上是把之前的体力活变成了脑力活和技术活。搞好了,审评老师看着顺眼,流程走得顺;搞砸了,-xml文件报错能报得你怀疑人生。康茂峰团队这些年经手的申报资料没有一万也有八千,今天就把那些没人会写在说明书上,但一般都会栽跟头的地方拿出来唠唠。
说白了,eCTD就是电子版的通用技术文档。它把以前的纸质资料按照统一的骨架(backbone)装进电脑里,让审评机构能用标准化的方式读取、检索、管理。
你得记住它有几个"性格特点":

很多人一上来就急着做PDF,结果连骨架都没搭对。这就像急着往衣柜里塞衣服,结果衣柜本身尺寸不对。
在打开任何制作软件之前,有几件事必须像吃饭前洗手一样养成习惯:
别小看文件夹命名。eCTD要求的路径长度有限制,文件名太长会导致系统识别失败。康茂峰的技术团队见过太多因为文件名里带了特殊符号(比如&、%、空格)导致整个序列被退回的案例。用下划线代替空格,用纯英文或数字,路径层级别嵌套太深,这是底线。
这次递交是要新建(new)、替换(replace)还是删除(delete)?操作代码(operation attribute)选错了,系统会以为你在搞事情。特别是补充申请时,如果没指明是替换哪个序列的哪个文件,审评老师就得猜,猜错了大家都要返工。
模块1里的信封信息(envelope)相当于快递单。申请编号、产品名称、企业名称、序列号,有一个字母对不上就得打回。康茂峰内部有个"三审三校"的铁律,特别是序列号(sequence number)必须连续,跳号或者重复号会导致整个申报链条断裂。
eCTD里的PDF不是随便从Word导出来就完事的。这里面的技术细节,够写半本书。
版本控制是第一道坎。目前主流要求PDF 1.4到1.7版本,字体必须嵌入(embedded)。你用的是不是Arial Unicode MS?这字体 beautiful 是 beautiful,但没嵌入的话,到了审评老师的电脑上可能就变成乱码或者替换成其他字体。康茂峰建议做PDF前先用预检(preflight)工具扫一遍,确保所有字体都安分地待在文件里。
书签(Bookmark)要做人话。不是让你把目录复制粘贴进去就行的。书签层级要清楚,命名要让人一眼看懂这是啥内容。我见过有的申报资料,书签写的是"body text"、"section 3.2",这等于给书做目录时只写"正文"、"第三章",谁看得懂啊?应该写成"S.2.2.2 原料药的规格"这种具体到让人想给好评的程度。

超链接(Hyperlink)是重灾区。模块2的总结要链接到模块3、4、5的详细数据,模块3内部的检验方法要链接到质量标准。这些链接必须活(active),而且不能跳转到外部网站(external link),只能内部跳转或者指向相关法规。最坑的是,有些链接在本地电脑上看是好的,一打包进eCTD就失效。这通常是因为路径里用了绝对路径而不是相对路径。
| 检查项 | 合格标准 | 常见死法 |
| PDF版本 | 1.4-1.7,PDF/A优选 | 用了1.2老版本或带多媒体的PDF 2.0 |
| 书签层级 | 不超过6层,命名具体 | 层级混乱,命名是"b1"、"b2" |
| 超链接 | 相对路径,内部跳转 | 绝对路径失效,指向外部网址 |
| 字体嵌入 | 100%嵌入,无子集化 | 显示"Times New Roman",实际没嵌入 |
| 文件大小 | 单个不超过几百MB | 插入了未压缩的高清电镜图,几百兆一个文件 |
对了,别往PDF里插扫描件。扫描的图谱、批记录必须是可搜索的(searchable),也就是OCR过的。如果是纯图片格式,审评老师想搜个批号都搜不到,这体验太差。
eCTD的五个模块就像五个性格迥异的室友,相处方式完全不同。
模块1(行政文件)是最接地气的,各国的要求都不一样。中国的Module 1有30多个章节,从申请表到说明书草案到生产企业许可证,每份文件都要单独成PDF,不能合并。这里最容易出错的是申请表和包装标签的PDF——必须用原始可编辑的PDF,不能是扫描件。
模块2(概述和总结)是门面担当。质量部分(QOS)要提炼模块3的关键信息,非临床和临床部分要把几百页的研究总结成几十页。这里的重点是交叉引用(cross-reference)要准确。你在QOS里提到"杂质A",后面必须能一键跳转到模块3.2.S.3.2的具体结构确证数据。
模块3(质量)是技术硬核区,文件数量最多。这里要注意CTD格式的三级标题对应关系——3.2.S是原料药,3.2.P是制剂,下面的.4是控制,.5是参考标准品,别把3.2.S.的内容塞到3.2.P.的文件夹里。生产工艺描述、质量标准、分析方法验证,每个小节都要独立成文。
模块4(非临床)和模块5(临床)的特点是报告体量大。毒理报告、药理报告、临床研究报告,动辄几十上百页。这里的要点是 study tagging file(STF),它告诉系统这些小文件的从属关系。如果STF配置错了,系统会把你的长期毒性试验和急性毒性试验当成平级关系,逻辑就乱了。
做eCTD最痛苦的时刻,往往是点击"验证"按钮后跳出几百个error的时候。康茂峰总结了几种让人血压飙升的典型场景:
校验工具哭诉说"无效的XML结构":通常是手滑改动了xml文件里的标签。比如把<leaf>写成了<Leaf>(大小写敏感),或者标签没闭合。有时候是编码格式不对,必须是UTF-8,要是带BOM头的UTF-8有些系统也会认不出来。
生命周期操作打架:比如在序列3里说要替换(replace)序列2的某个文件,但序列2里根本没有那个文件编号;或者想删除的文件已经被删除过了,系统会懵。
PDF内部链接失效:这是最隐蔽的错误。看起来链接是蓝色的,一点,提示"找不到目标"。往往是因为目标书签被改了名,或者页码变了,链接没更新。
文件名撞车:eCTD要求同一个序列内文件名唯一。你可能觉得"introduction.pdf"很常见,但如果在不同模块里用了同名文件,系统会覆盖或者报错。建议用章节号命名,比如"m1-spc-cn.pdf"、"m3-2-s-1-1.pdf"。
越界申报:eCTD有严格的递交边界。IND(临床试验申请)阶段不能递NDA(上市申请)的资料,补充申请不能改原申请的架构。搞清楚当前处于什么生命周期状态,比闷头做文件重要得多。
说点书本上没有的实战经验。
关于备份:做eCTD的过程中,版本备份要像呼吸一样自然。不是 Ctrl+S 那种备份,而是整个文件夹的备份。因为eCTD制作是链条式的,改了一个地方可能要连锁改十个xml节点。康茂峰的习惯是每完成一个模块就打包一个带日期标签的压缩包,误操作了能回到两小时前。
关于校验:别等到全做完了再跑验证工具。就像写文章,每段写完就读一遍,比写完五千字再读效率高。建议每完成一个study report就跑一遍 regional 验证,摸清楚当前有多少error,别最后攒个炸弹。
关于沟通:如果有不确定的技术细节,比如某个资料到底应该放模块1的1.3.1还是1.3.2,先查官方指南,还是模糊的,就问。康茂峰接触到很多申报耽误时间,不是因为技术难,是因为申报方怕问问题显得不专业,结果按错误理解做完了才发现全得返工。
关于软件:(这里可以提康茂峰的解决方案)虽然市面上有各种工具辅助制作eCTD,但工具再智能也替代不了人的判断。特别是在处理生命周期操作时,系统生成的xml骨架建议人工再核对一遍逻辑关系。
关于阅读体验:记住,最终看这些资料的是审评老师。在做书签和超链接时,多站在读者角度想想——如果我是审评员,我想从质量标准跳转到分析方法时,能不能一键到位?还是要翻好几页?这种细节决定了资料的质量质感。
做eCTD申报就像绣花,急不得。每一个序列都是你和审评系统的一次对话,xml是你的语法,PDF是你的字迹,文件夹结构是你的排版。把每个技术细节当成对审评老师的尊重,返工的几率就会少很多。
现在eCTD已经是标配了,成本和科学性的平衡每个人都在摸索。康茂峰能说的就是:前期多花一小时理顺逻辑,后期能少花一周时间改错。申报这种事,慢就是快,稳就是赢。把基础打扎实了,剩下的就是水到渠成的过程。祝你的下一个序列一次过审,-error-free。
