学术速运 | 您所在的位置:网站首页 › excel复合图的标签顺序 › 学术速运 |
题目:MISATO - Machine learning dataset of protein-ligand complexes for structure-based drug discovery 文献来源: https://doi.org/10.1101/2023.05.24.542082 (biorxiv) 代码:https://github.com/t7morgen/misatodataset 简介:大型语言模型(llm)极大地提高了我们理解生物学和化学的能力。然而,基于结构的药物发现的可靠方法相对较少。迫切需要高度精确的生物分子-配体相互作用数据集,特别是对于需要大量训练数据的llm。作者提出了MISATO,第一个结合了小分子的量子力学性质和相关的分子动力学模拟约20000个实验蛋白质配体复合物的数据集。从PDBbind数据集开始,我们使用半经验量子力学来系统地细化这些结构。迄今为止最大的蛋白质配体复合物的分子动力学痕迹收集物,积累到170 μs。我们提供了ML基线模型和简单的Python数据加载器,并旨在围绕MISATO培养一个蓬勃发展的社区,为ML专家提供了一个简单的切入点,而不需要深入的领域专业知识来实现下一代药物发现人工智能模型。 主要内容: ------------------------------------------- 欢迎点赞收藏转发! 下次见! |
CopyRight 2018-2019 实验室设备网 版权所有 |