小分子的鉴定是生命科学一项关键任务。|新算法使用质谱数据准确、高效预测小分子「身份」,加速新药研发( 二 )


从GNPS搜索了800万个串联质谱 , 在严格的0%FDR水平下 , MolDiscovery注释了8倍多的光谱 , 并识别出比Dereplicator+(一种从MS中识别小分子的数据库搜索复制器)多6倍的独特化合物 。
MolDiscovery搜索在10个线程上花费了34天 , 与单线程上的预测329天非常接近 。 值得注意的是 , 在搜索如此大规模的光谱数据集时 , MolDiscovery比其他方法要高效得多 , 只需要对分子数据库进行一次预处理 , 可以有效地搜索未来的光谱 。
节省新药研发时间、成本
「科学家们浪费了大量时间来分离已知的分子 。 」研究团队成员HoseinMohimani说 。 「早期检测分子是否已知 , 可以节省时间和数百万美元 , 并有望使制药公司和研究人员更好地寻找可能用于新药开发的新型天然产品 。 」
Mohimani解释说:「例如 , 科学家检测出一种在海洋或土壤样本中有望成为潜在药物的分子后 , 可能需要一年或更长时间才能识别出这种分子 , 而不能保证该物质是新的 。 MolDiscovery使用质谱测量和预测机器学习模型快速准确地识别分子 , 且无需依赖质谱数据库进行匹配 。 」
该团队希望MolDiscovery将成为实验室发现新型天然产物的有用工具 。 MolDiscovery可以与Mohimani实验室开发的机器学习平台NRPminer协同工作 , 帮助科学家分离天然产物 。