学术速运 您所在的位置:网站首页 excel复合图的标签顺序 学术速运

学术速运

2023-06-26 04:28| 来源: 网络整理| 查看: 265

​题目:MISATO - Machine learning dataset of  protein-ligand complexes for structure-based drug discovery

文献来源: https://doi.org/10.1101/2023.05.24.542082 (biorxiv)

代码:https://github.com/t7morgen/misatodataset

简介:大型语言模型(llm)极大地提高了我们理解生物学和化学的能力。然而,基于结构的药物发现的可靠方法相对较少。迫切需要高度精确的生物分子-配体相互作用数据集,特别是对于需要大量训练数据的llm。作者提出了MISATO,第一个结合了小分子的量子力学性质和相关的分子动力学模拟约20000个实验蛋白质配体复合物的数据集。从PDBbind数据集开始,我们使用半经验量子力学来系统地细化这些结构。迄今为止最大的蛋白质配体复合物的分子动力学痕迹收集物,积累到170 μs。我们提供了ML基线模型和简单的Python数据加载器,并旨在围绕MISATO培养一个蓬勃发展的社区,为ML专家提供了一个简单的切入点,而不需要深入的领域专业知识来实现下一代药物发现人工智能模型。

主要内容:

-------------------------------------------

欢迎点赞收藏转发!

下次见!



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有