看啥推荐读物
写篇读书笔记,理清辩证分析,翻开机器学习,一起走出生信pipeline的陷阱,扛起基因造福苍生的大旗。
今天看啥  ›  专栏  ›  生物信息学与机器学习

VarPaper遗传变异99.9%的预测准确率怎么来的?劲爆揭秘VarPaper底层的理念创新和技术创新

生物信息学与机器学习  · 公众号  ·  · 2020-01-13 18:11
 导论: 让我们先看下VML模型的惊人效果:简单科普下,ROC是灵敏度和特异度的综合指标,能够适应正负样本不平衡的场景;PR是灵敏度和精准率的综合指标,更关注阳性识别率的问题。由上图可见,ROC和PR都在99.9%以上,可怕的准确率啊! VarPaper的VML模型独特的理念创新在于:在遗传变异的解读上采取了“三合一”的思想,以ACMG Sherloc指南判定为致病、可能致病、良性、可能良性的变异为金标准数据,以文献注释结论、多个重要变异数据库收录的判断结论为基础构建了致病变异个数P_count和良性变异个数B_count两个特征,再结合其他重要的特征(人群频率,当前领先的功能预测软件CADD、ClinPred,以及变异所在的功能区域分类Consequence),构建机器学习模型。 VML模型的技 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照