news center

新闻中心

  首页/ 新闻中心/ 学术成果
新闻中心 学术成果

金橡医学MSI算法-MSIFinder荣登BMC Bioinformatics

发布时间:2021/03/25

新颖

首创了测序环境自适应模块算法结合随机森林机器学习算法进行微卫星不稳定的检测

准确

相比同行算法有着更高的灵敏性和特异性的同时不受测序深度及测序panel大小影响

快速

在极短时间内即可给出准确病人微卫星状态,为病人的及时治疗争取宝贵的时间

 

导言

微卫星(microsatellite,MS)是指细胞基因组中以少数几个核苷酸(多为 1~6个)为单位串联重复 的 DNA序列,又称短串联重复(short tandem repeat, STR)。DNA错配修复(mismatch repair,MMR)功能出现异常时,微卫星出现的复制错误得不到纠正并不断累积,使得微卫星序列长度或碱基组成发生改变,称为微卫星不稳定性(Microsatellite instability, MSI)。MSI根据程度可以被分为3类:微卫星高度不稳定性(MSI High)、微卫星低度不稳定性(MSI Low)、微卫星稳定(MSS)。

临床上,微卫星不稳定是由错配修复 (MMR) 基因发生缺陷引起的,与肿瘤的发生密切相关。MSI现象在结直肠癌中被首次发现,并在不同癌种中发生率有较大变化,其中子宫内膜癌发生率为12%~15%、胃癌为15%~20%、结直肠癌为12%~15%【1-3】。MSI 是实体瘤预后和制定辅助治疗方案的重要分子标志物,因此MSI检测准确性对肿瘤治疗十分重要。

目前临床上检测MSI使用的方法多为MSI-PCR以及MMR-IHC,但由于检测位点或蛋白较少,且检测结果高度依赖主观经验判断,经常无法准确预测病人的MSI状态。目前NGS方法已经成为检测MSI的新工具,其最大优势是可以实现多位点高通量检测,通过NGS的方法检测MSI,并提高MSI检测的准确性是MSI检测的发展方向。

金橡医学深耕算法,自主研发了基于NGS检测肿瘤组织中MSI状态的算法MSIFinder,文章《MSIFinder - A python package for detecting MSI status using random forest classifier》发表在<BMC Bioinformatics >(IF:3.2)。<BMC Bioinformatics > 主要发表生物数据建模、生物数据的分析和统计方法的开发、测试以及新应用等方面的文章,在生物信息领域有较高影响力。MSIFinder算法不仅具有极高的准确性、灵敏性、特异性,还具有很好的普适性。

 

MSIFinder的优势

01.MSIFinder的灵敏性与特异性高

21个组织MSI-H样本和379个组织MSS样本用于测试MSIFinder对样本MSI状态的检测性能。通过预测MSI的状态与MSI-PCR确定的MSI状态的一致性来评估其性能。在测试样本中,MSIFinder的敏感性为100%,特异性为99.7%,准确度为99.8%,PPV为95.4%,AUC值为0.999 。【图1】

 

为了进一步验证MSIFinder的健壮性以及有效性,将MSIFinder应用于由140个样本组成的前瞻性队列。在MSI-PCR验证的140个肿瘤样本中,18个样本为MSI-H,其余122个样本为MSS。使用MSIFinder对这些样本的MSI状态进行预测,MSIFinder的敏感性(召回率)为100%,特异性为100%,AUC为1.0。【图2】

图1、图2

02.低深度下MSIFinder检测准确性高

 

为了检验MSIFinder在不同测序深度下的性能表现,对测试样本的测序深度进行了由高到低的梯度设置。结果发现当测序深度低至100X时,MSIFinder的检测一致性高达99.3% ,测序深度为200X时MSIFinder的检测一致性为99.1% 。随着深度的增加,检测准确率稳步提高,即使测序深度低至100X、200X,也能保持99%以上的检测准确率。【图3】

图3

03.MSIFinder检测准确性受panel影响小

 

为了检测MSIFinder对不同大小、不同区间的panel的适应性,通过随机取样的方法模拟了100个0.5M panel、100个1M panel和100个1.5M panel ,并对每个panel下的样本进行分析。结果发现0.5M、1M和1.5M panel的检测一致性分别为99%、99.8%和99.9% 。说明MSIFinder对不同大小、不同区间的panel具有很强的适应性,受panel的影响小。

图4

04.检测性能较其他软件好

 

我们比较了MSIFinder和另外两个常用的MSI检测软件包mSINGS和MSIsenstor。对敏感性、特异性、准确性等指标进行了评估。发现MSIFinder在所有指标上均优于这两款软件。

图5

参考文献 

1. Arzimanoglou, II, Gilbert F, Barber HR: Microsatellite instability in human solid tumors. Cancer 1998, 82:1808-1820.

2. Halford SE, Sawyer EJ, Lambros MB, et al. MSI-low, a real phenomenon which varies in frequency among cancer types. The Journal of pathology 2003, 201:389-394.

3. Cortes-Ciriano I, Lee S, Park WY, et al. A molecular portrait of microsatellite instability across multiple cancers. Nat Commun 2017, 8:15180.

 

推荐新闻

Recommending news