
说实话,第一次听说eCTD这玩意儿的时候,我脑子里蹦出来的第一个问题是:以前那些厚厚的纸质资料难道不能用了吗?非得搞成电子的?后来才明白,eCTD不是简单地把纸质文件扫描成PDF,而是给药品注册资料建立了一套"国际通用的数字语言"。
简单来说,eCTD就是电子通用技术文档(electronic Common Technical Document)的缩写。你可以把它想象成在给药品写一本结构化的自传,而且这本书有个严格的目录——全世界的药监机构(包括咱们中国的CDE)都用同一套"目录编号"来查资料。好处很明显,审评老师能快速定位到他想看的内容,不用在一堆A4纸里翻来找去。坏处嘛……准备起来确实比过去复杂得多。
那么具体到操作层面,咱得准备哪些东西呢?我把它拆成两块来讲:内容资料和技术外壳。内容资料就是实质性的申报资料,技术外壳就是让这些资料能被电脑系统识别的那套规则。
eCTD的骨架是ICH定的五个模块,这就像是五层抽屉,每一层放特定类型的资料。准备的时候得按这个结构来归置,不能乱放。

这是唯一一个各国要求不一样的模块,因为是"地域性"的。在中国申报,就得按CDE的要求准备:
这里容易踩的坑是时效性。很多企业习惯提前很久准备资料,结果到了提交的时候,GMP证书过期了,或者法人代表变更了没更新,这就得重新做书签和超链接,很麻烦。
这一层放的是"浓缩精华",是写给审评老师看的快速导读。包括:
写这部分有个窍门:模块2的内容必须与模块3、4、5的原始数据严格对应。不能综述里写杂质控制在0.1%,结果模块3的检验报告里写的是0.2%,这种不一致会被发补。
这部分是药学资料的大头,从原料药到制剂,从工艺到检验,全在这里:

模块3的文件往往是最多的,PDF文件大小是个隐形门槛。CDE建议单个PDF不超过50MB,但有时候一个完整的杂质谱研究PDF就几百兆了。这时候得学会合理拆分,比如按章节拆成(1)、(2),但拆了之后又得保证书签和超链接不断链,这就是个体力活。
这是动物试验的资料,包括:
这里要注意图谱文件的完整性。高效液相、气相、质谱的原始图谱往往占用很大空间,而且需要以可检索的PDF形式提交,图片格式的扫描件是不行的。
人体相关的资料都在这里:
模块5有个特殊要求:STF(Study Tagging Files)文件,这是给每个临床研究做的"索引卡",告诉系统这个研究对应哪些PDF。准备STF的时候得把研究编号、研究类型、用药人群这些信息填准确,不然后期变更(比如补充申请)的时候找不着北。
内容准备好了,只是完成了50%。eCTD麻烦就麻烦在,这些PDF不是随便存的,得符合ICH的eCTD技术规范。这就像是把书装进图书馆的书架,不仅要有书,还得有索书号、分类标签。
首先,必须是PDF/A或PDF/E格式,简单说就是"长期归档格式"。普通的Word转PDF有时候嵌的字体不对,到审评老师的电脑上打开可能出现乱码或者版式错乱。所以得用Acrobat的"印前检查"功能跑一遍,确保字体已嵌入,没有透明对象,没有JavaScript。
其次,书签(Bookmarks)和超链接(Hyperlinks)必须手工做。模块2的综述里提到"详见 module 3.2.P.5",这就得做成超链,点一下能跳过去。书签的层级也要清晰,不能所有章节都是一个层级,得体现出1.1、1.1.1这样的层级关系。
这是eCTD的"神经中枢"。ICH定义了标准的XML结构(ich-ectd-3-2.dtd),里面定义了:
准备XML的时候,文件名的命名规则是魔鬼细节。不能用中文文件名,不能用特殊字符(比如空格、&、%),不能用太长的名字(建议不超过64字符)。曾经见过有人用"原料药检验报告最终版_真的最终版_不改了.pdf"这样的名字,这在eCTD系统里会直接报错。
正式提交前,必须用验证工具跑一遍。中国eCTD有专门的业务验证和技术验证标准:
| 验证类型 | 主要查什么 | 常见错误 |
| 业务验证 | 文件的粒度(比如稳定性报告是不是拆得太细或太粗)、生命周期操作符是否正确、交叉引用是否有效 | 指向不存在文件的链接、模块2和模块3的数据不一致 |
| 技术验证 | XML格式是否符合DTD定义、PDF是否损坏、文件名是否符合规则 | PDF字体未嵌入、XML标签未闭合 |
| 样式验证 | 页眉页脚、页码、纸张大小(A4)、目录格式 | 页码不连续、缺少页眉 |
建议准备资料的时候,边做边验,别等到最后一天才想起来验证,那时候发现PDF书签层级错了,几百个文件重新生成书签会疯掉的。
说了这么多大框架,再聊几个实战中容易掉进去的坑。
关于附件(Appendices):有些资料比如方法学验证的完整图谱、电子化的病例报告表(eCRF),这些放在主体报告后面作为附件,但在eCTD里,附件也得有独立的书签,而且要在目录里体现。不能搞成一个巨大的PDF没头没尾。
关于生命周期管理:eCTD不是"一锤子买卖",药品获批后还有变更、补充申请、年报。每次提交新的序列(Sequence)时,得明确指出这次改的是哪里。如果第一次申报时模块3.2.S.4.1的杂质标准写的是"不得过0.5%",后来变更为"不得过0.3%",新的序列里要用"replace"操作符指明替换旧文件,而不是直接覆盖。
关于中文翻译:如果原始研究报告是英文的(比如进口的药品或者境外做的临床),需要提供中文译文。译文和原文要放在同一个PDF里,通常是左右对照或者前后排列,而且译文部分也得可检索,不能是图片。
关于电子签章:虽然现在eCTD提交多通过网络传输,但某些关键文件(比如自检报告、授权书)仍然需要有效的电子签章或手写签章的扫描件,且分辨率要足够高,不能糊成一片。
写到这里你可能会觉得,这也太繁琐了。确实,从纸质CTD转到eCTD,工作模式完全变了。过去是"写资料-打印-装订-递交",现在是"写资料-格式化-转换-验证-递交",中间多了很多技术环节。
但其实这套体系一旦跑顺了,长远来看是省事的。比如后续做一致性评价补充申请,或者新增适应症,你只需要准备变更的部分,系统会自动和之前批准的版本关联,审评老师也能快速比对差异。不像以前,每次补充申请都得重新印一大堆纸质资料。
对于刚开始接触eCTD的企业,特别是中小型企业,内部可能缺乏既懂药学又懂XML技术的复合人才。这时候借助像康茂峰这样专注于药品注册资料电子化的专业团队,在前期建立模板、PDF规范化、验证纠错这些环节上把关,能少走很多弯路。毕竟法规不等人,序列号一旦提交,发现有技术错误被退回,损失的不光是时间,还有排队的位置。
准备eCTD资料的过程,某种程度上也是企业内部质量管理体系的一次数字化体检。当你能把每一批检验报告、每一个稳定性数据点都准确地放在它该在的电子抽屉里,并且连好所有的线索时,你对这个药品的理解,也必定比过去更深了一层。
