摘要
METLIN 960K是当前全球规模最大的小分子实验串联质谱(MS/MS)光谱合集。本文介绍经重新工程化改造、可公开访问的METLIN平台,其整合了96万余种经验证分子标准品的高分辨串联质谱数据。该规模依托声学液滴喷射与高通量液质联用(LC−MS/MS)采集的高通量实验框架实现,可系统性地从标准品实测生成MS/MS光谱。除规模优势外,METLIN 960K提供高度标准化的MS/MS数据集,所有光谱在统一的电离模式与碰撞能量条件下采集,可实现可重复的光谱比对与机器学习应用。每种化合物均在正、负离子模式及0、10、20、40 eV四档碰撞能量下采集MS/MS光谱,实现全面碎裂覆盖并提升结构注释精度。该平台作为XCMS-METLIN的参考库且兼容机器学习流程,支持高保真光谱匹配、中性丢失分析与错误注释过滤,可识别源内碎片并按生物相关性排序代谢物候选。平台还通过METLIN-MRM为所有标准品提供实验推导的多反应监测(MRM)离子对,支撑代谢物、天然产物、脂质、多肽、药物、毒物等多样化化合物的定量方法开发。全新界面支持通过精确质量、分子式、结构高效检索,可直接获取整理后的光谱与元数据。平台另有2项补充资源:
(1)METLIN Core(高频使用子集,用于快速检索);
(2)超102万种无MS/MS数据的结构,用于科学假说生成。
METLIN 960K数据全部源自标准品实测,是目前最大的公开实验级MS/MS数据库,可为非靶向与靶向质谱流程提供高置信度注释。
https://metlin.scripps.edu
siuzdak@scripps.edu
结果与讨论
声学点样驱动的规模扩增
图1 用于METLIN MS/MS光谱生成与整理的高通量工作流程
分子标准品排布于384孔板,通过声学液滴喷射(每滴约50 nL)实现精准无接触上样,制备含约50–100种小分子标准品(约10 mM)的混合体系,随后用液相色谱兼容溶剂稀释。样品经LC−MS/MS分析,在正负离子模式下、多档碰撞能量(0、10、20、40 eV)完成自动化MS/MS采集,获得单个化合物的碎裂光谱。总离子流图(TIC)展示LC−MS/MS采集的代表性放大区段(5–14 min),用于说明多重进样模式,不代表完整色谱运行时间。提取的MS/MS光谱经自动化光谱提取与质量筛选(包括质量精度<20 ppm及信噪比筛选)后整合入METLIN数据库,光谱与经验证的分子结构关联并存储为整理后条目。
剔除计算机模拟MS/MS预测数据
图2 METLIN含MS/MS数据的分子标准品扩增与组成
左:METLIN 960K的分子量分布,中心值约400 Da;
中右:环形图展示覆盖350余个ClassyFire注释化学类别的化学多样性;
右:柱状图追溯METLIN从2005年1000种化合物到2025年96万种的扩增历程。
候选筛选性能指标
图3 基于METLIN 960K平台的整合式分子注释
(A) METLIN检索界面支持按化合物名称、分子式、CAS号、KEGG编号、SMILES表达式及前体质量范围灵活检索,图示「布洛芬」检索示例,返回多种注释结构(含羟基化与羧基化代谢产物);
(B) 碎片离子检索界面支持输入碎片m/z值,并设定质量偏差、离子模式、强度阈值及前体m/z筛选条件,图示用布洛芬6个碎片离子匹配实验MS/MS光谱;
(C) 结果表格展示匹配碎片m/z值、质量精度(Δppm)、相对强度及碎片观测的碰撞能量(CE)。
图4 METLIN分子候选筛选
(左)候选筛选流程:前体质量精度在±10.0、±5.0、±1.0 ppm窗口下逐级缩减数据库匹配数,最终经MS/MS光谱匹配验证,将96万余候选缩减至少量高置信度结果(如2个);
(右)实验高分辨MS/MS光谱与METLIN库条目匹配,碎片水平完全一致,验证化合物为烟酰胺腺嘌呤2核苷酸(NAD)。
中性丢失搜索与亚结构驱动的注释
图5 基于METLIN的中性丢失亚结构注释
左上:正离子电喷雾电离(ESI)实验MS/MS光谱显示141.02 Da的中性丢失,及对应中性丢失检索输入面板;
下方:141.02 Da中性丢失检索结果,匹配得到磷酸肌醇-O-磷酸及磷脂酰乙醇胺类脂质,METLIN同步给出匹配碎片m/z值与预测亚结构。
从注释到定量的uMRM工作流
图6 基于METLIN的分子注释与预测层级框架
METLIN多层次注释与定量工作流程示意图,支持小分子发现与鉴定:初步注释(前体m/z筛选)→高级注释(多碰撞能MS/MS匹配、源内碎片筛选)→上下文感知优先级排序(生物同步化)→实验级MRM预测(离子对优化),构成非靶向/微型/通用多反应监测(uMRM)工作流的核心基础。
详细总结
思维导图
核心数据参数
参考
Anal Chem. 2026 Apr 21. doi: 10.1021/acs.analchem.5c08031.
METLIN 960 K: An Empirical Tandem Mass Spectrometry Data Resource
260421METLIN960K.pdf
注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。