中国科学院微生物研究所冯婕研究组等针对肺炎链球菌β-内酰胺耐药这一主要临床问题,采取机器学习的方法挖掘耐药干系数据的规律,建立了基因型和表型之间的联系,使得基因检测不再是一个赞助手段,而有望成为一种紧张的耐药快速检测技能。
肺炎链球菌β-内酰胺耐药的紧张机制是三种青霉素结合蛋白(PBP1a,PBP2b和PBP2x)的转肽酶构造域(TPD)的改变。由于不同临床肺炎链球菌分离株PBPs的高度变异性,以及链球菌间重组导致的嵌合构造,使得PBPs极具多样化,导致了很难将PBPs的突变与临床耐药性联系起来。冯婕组研究职员首先将NCBI数据库已公布的PBPs序列通过种别方差法打算,得到了139个与耐药高度干系的HVLs (highly variant amino acid)。再以4300株肺炎链球菌的转肽酶构造域(TPD)序列以及对应头孢呋辛、阿莫西林的耐药表型作为数据库,将个中80%的数据作为演习集,20%的数据作为考验集,用HVLs去预测头孢呋辛和阿莫西林的耐药水平,结果创造与用PBPs蛋白的TPD序列预测效果一样好。进一步剖析创造,HVLs与PBPs的某些区域的序列有很强的干系性。因此,分别利用来自pbp2x (2253 bp)的750 bp片段和来自pbp2b (2058 bp)的750 bp片段可以很好地预测头孢呋辛和阿莫西林的耐药性。这种长度只须要一个Sanger测序反应即可,不仅使检测操作更加大略,也降落了本钱。此外,通过对人工构建的突变体和来自更多临床分离的菌株的耐药表型的检测,进一步确认了机器学习法能精确预测耐药表型。运用该预测方法,研究职员剖析了NCBI数据库中已测序的8138株肺炎链球菌,进而建立了耐药表型、血清型以及ST型之间的关联,促进了对肺炎链球菌的盛行病学的认识。

该研究成果在线揭橥于Briefings in Bioinformatics杂志,冯婕与南方科技大学教授杨亮为共同通讯作者。该研究得到国家自然科学基金和北京市科学技能委员会的帮助。

机器学习预测实验菌株的耐药水平
来源:中国科学院微生物研究所
温馨提示:近期,微信"大众年夜众号信息流改版。每个用户可以设置 常读订阅号,这些订阅号将以大卡片的形式展示。因此,如果不想错过“中科院之声”的文章,你一定要进行以下操作:进入“中科院之声”"大众号 → 点击右上角的 ··· 菜单 → 选择「设为星标」










