众力资讯网

靶向多肽探针的 6 大筛选方法:从随机库到理性设计,精准捕获高活性分子

在肿瘤诊疗、靶向递送等领域,靶向多肽探针的核心价值在于 “精准识别特定生物靶标”,而高效筛选是获取这类分子的关键前提。目

在肿瘤诊疗、靶向递送等领域,靶向多肽探针的核心价值在于 “精准识别特定生物靶标”,而高效筛选是获取这类分子的关键前提。目前主流筛选方法已从传统的 “随机富集” 发展到 “理性设计 + 高通量验证” 的多元体系,不同方法在筛选通量、靶点适配性、活性保障上各有侧重,需根据靶标类型(如可溶性蛋白、膜蛋白、胞内靶点)与研发需求选择。本文将系统拆解 6 类核心筛选方法,解析其原理、优势及适用场景。

一、体外展示筛选技术:从 “海量库” 中淘选阳性序列

体外展示技术通过构建包含海量多肽序列的文库,利用 “表型 - 基因型关联” 实现高效筛选,是目前应用最广的方法,核心包括噬菌体展示、mRNA 展示与核糖体展示。

1. 噬菌体展示技术:胞外靶点的 “经典筛选工具”

核心原理:将多肽编码基因插入噬菌体(如 M13、T4)外壳蛋白基因(pⅢ/pⅧ),使多肽与外壳蛋白融合展示在噬菌体表面;通过 “吸附(多肽结合靶标)- 洗脱(去除非特异性克隆)- 扩增(感染细菌富集)” 的 3-5 轮循环,筛选出高特异性多肽。优势:

依赖大肠杆菌体内表达,多肽可形成正确二硫键(如含 2-3 对二硫键的抗菌肽),构象与天然状态一致性达 80% 以上,活性有保障;

操作简单,无需复杂体外系统,实验室可独立完成,成本仅为 mRNA 展示的 1/3;

可直接用活细胞筛选膜蛋白靶点(如 GPCR),避免纯化过程中靶标构象改变导致的假阴性。适用场景:胞外可溶性蛋白(如 HER2、EGFR)、细胞膜表面受体(如 PD-1、CTLA-4)的多肽筛选,尤其适合对构象要求高的功能肽(如中和肽、靶向肽)。

2. mRNA 展示技术:高难度靶点的 “高通量解决方案”

核心原理:纯体外完成 “转录 - 翻译 - 筛选”—— 体外转录多肽 mRNA,在 mRNA 3' 端偶联嘌呤霉素(与多肽 C 端形成共价键);在无细胞翻译系统(如兔网织红细胞裂解液)中形成 “mRNA - 核糖体 - 多肽” 三元复合物;通过靶标捕获复合物后,回收 mRNA 反转录为 cDNA 测序,获得多肽序列。优势:

库容极高(10¹²-10¹³),是噬菌体展示的 1000 倍,可覆盖低丰度高活性多肽,筛选成功率超 90%;

可灵活引入非天然氨基酸(如 D - 氨基酸、磷酸化氨基酸),显著提升多肽稳定性(抗酶解半衰期延长 5-10 倍)与特异性;

纯体外环境可模拟胞内条件(如添加胞内缓冲液),适配胞内靶点(如核转录因子 p53、胞内酶)。适用场景:胞内靶点、弱免疫原性靶点(如小分子化合物受体)、需非天然氨基酸修饰的多肽筛选,尤其适合临床级长效多肽药物研发。

3. 核糖体展示技术:无载体依赖的 “灵活筛选系统”

核心原理:通过设计终止密码子缺失的 mRNA,使翻译形成的 “mRNA - 核糖体 - 多肽” 三元复合物稳定存在于体外系统;直接用靶标捕获复合物,回收 mRNA 后反转录测序。优势:无需噬菌体 / 质粒载体,可快速构建文库(1-2 天);无细胞毒性限制,可筛选对细菌有毒性的多肽(如溶菌肽)。劣势:三元复合物稳定性差(4℃仅稳定数小时),需快速完成筛选;库容低于 mRNA 展示(约 10¹⁰)。适用场景:快速验证短肽序列(5-10 个氨基酸)、有毒性多肽的初步筛选。

二、细胞水平筛选技术:模拟生理环境的 “真实靶向验证”

体外展示技术筛选的多肽可能因体内环境(如酶解、细胞间质阻隔)失效,细胞水平筛选直接在活细胞 / 类器官模型中操作,更贴近生理状态,核心包括细胞亲和筛选与功能导向筛选。

1. 细胞亲和筛选:膜蛋白靶点的 “精准捕获”

核心原理:将多肽文库(如荧光标记肽库、噬菌体肽库)与表达靶标的活细胞共孵育,通过流式细胞术(FACS)或磁珠分选,收集结合多肽的细胞,再通过质谱或测序鉴定多肽序列。关键优化:

采用 “阴性筛选 + 阳性筛选” 两步法:先与不含靶标的细胞孵育,去除非特异性结合多肽;再与靶标阳性细胞孵育,提升筛选特异性;

对悬浮细胞(如免疫细胞),可通过荧光强度分选高亲和力多肽(荧光信号强的细胞结合的多肽亲和力更高)。适用场景:肿瘤细胞表面抗原(如 PSMA、CD19)、免疫细胞受体(如 CD47、TIM-3)的多肽筛选,尤其适合无法纯化的膜蛋白靶点。

2. 功能导向筛选:基于活性的 “反向筛选”

核心原理:不直接检测多肽与靶标的结合,而是通过监测多肽介导的生物学功能(如细胞增殖抑制、信号通路激活)筛选阳性序列,例如:

针对肿瘤细胞凋亡相关靶点(如 Bcl-2),筛选能诱导肿瘤细胞凋亡的多肽;

针对免疫检查点(如 PD-L1),筛选能恢复 T 细胞杀伤活性的多肽。优势:直接筛选有功能活性的多肽,避免 “结合活性强但功能弱” 的假阳性序列,后续开发成功率高。劣势:通量较低(一次筛选仅能检测数百个多肽),适合对初筛阳性序列的功能验证。适用场景:功能依赖性靶点(如酶、信号通路受体)的多肽筛选,或临床级功能肽(如凋亡诱导肽、免疫激活肽)的验证。

三、计算生物学辅助筛选:从 “结构” 到 “序列” 的理性设计

借助 AI 与分子模拟技术,可基于靶标蛋白结构直接设计多肽序列,大幅缩短筛选周期,减少盲目性,核心包括结构对接筛选与序列进化分析。

1. 分子对接与动力学模拟:精准预测结合模式

核心原理:通过 AutoDock Vina、Schrödinger 等软件,将虚拟多肽库(通常含 10⁵-10⁶条序列)与靶标蛋白的活性口袋进行对接,计算结合能(如氢键、疏水作用、静电作用),优先选择结合能低(<-8kcal/mol)、关键氨基酸(如 Arg、Tyr)与靶点残基匹配的序列。关键步骤:

预处理靶标蛋白:去除结晶水、加 Gasteiger 电荷,定义活性口袋(如以已知配体结合位点为中心的 10Å 范围);

虚拟突变优化:对初筛序列进行单点突变(如将 Ala 替换为 Lys),通过分子动力学模拟(100ns 以上)验证突变后结合稳定性的变化,进一步提升亲和力。优势:无需构建实体文库,周期短(1-2 周),可定向设计高亲和力多肽(KD 值可达 nM-pM 级)。适用场景:已知三维结构的靶标蛋白(如通过 X 射线晶体衍射、冷冻电镜解析的结构),或对现有多肽的亲和力优化。

2. 序列进化与机器学习:基于大数据的预测

核心原理:利用同源蛋白的保守序列(如天然配体的结合 motif)或已报道的活性多肽序列,通过机器学习(如随机森林、深度学习)构建预测模型,筛选潜在活性序列。典型应用:

基于数据库(如 PeptideDB、UniProt)中已有的 PD-1 结合肽序列,训练模型预测新的结合肽,准确率可达 70% 以上;

通过序列比对分析肿瘤抗原表位的保守区域,设计能被 T 细胞识别的肿瘤疫苗肽。优势:依赖现有数据,无需靶标结构,适合结构未知但有大量序列数据的靶点。劣势:预测结果需实验验证,避免因数据偏差导致的假阳性。适用场景:同源性高的靶标家族(如细胞因子受体、蛋白酶)、或基于已知活性肽的序列优化。

总结:筛选方法的选择逻辑

选择靶向多肽探针的筛选方法,需围绕 “靶标特性 - 研发阶段 - 性能需求” 综合判断:

靶标定位:胞外可溶性蛋白→噬菌体展示;膜蛋白→细胞亲和筛选;胞内靶点→mRNA 展示 / 核糖体展示;

研发阶段:初筛(海量序列)→mRNA 展示 / 噬菌体展示;功能验证→细胞功能筛选;亲和力优化→分子对接;

性能需求:需非天然氨基酸→mRNA 展示;需快速验证→计算生物学筛选;需临床级活性→功能导向筛选。

随着技术融合(如 “计算预测 + 体外验证” 的组合策略),靶向多肽的筛选效率与活性将进一步提升,为精准诊疗、靶向递送等领域提供更高效的分子工具。