18101298214
发布日期:2023/8/21 16:20:00
肺癌是中国发病率和死亡率最高的恶性肿瘤,近年来,我国肺癌发病年龄呈现年轻化趋势,而发现时机晚是导致肺癌死亡率高的重要因素。为实现肺癌的早诊早治,提高肺癌患者的生存率,我国在各级医疗单位大力推行肺癌筛查。而低剂量螺旋CT(low-dose computed tomography, LDCT)具有高敏感度,低辐射剂量,安全、快速、无痛的特点,是目前肺癌筛查的最佳方法。随着 LDCT 筛查的普及,大量患者发现了不确定的肺结节(indeterminate pulmonary nodules,IPN),这些IPN往往需要LDCT进行连续监测或者手术切除,而其中大部分结节经病理活检证实都并非恶性。因此在短时间内能够帮助临床医生判断IPN是良性还是恶性将使患者免受不同程度的身体、心理及经济压力。
 
液体活检作为一种无创且相对快速的检查方式,在肺癌筛查中也受到了广泛应用。当前液体活检主要包括核酸、蛋白质或其他有机化合物等生物标志物的检测。表面增强拉曼光谱(Surface enhanced Raman spectroscopy,SERS)是拉曼光谱(Raman spectroscopy,RS)的一种,通过底物增强产生的拉曼信号,可以检测血清中的核酸和蛋白质等生物标志物,也可作为一种新的液体活检方式。基于血清的 SERS不仅可用于检测DNA、RNA和 miRNA等核酸物质,还可使用 PCA 提取癌性外泌体的独特峰,从而诊断非小细胞肺癌。目前已有研究将SERS与机器学习方法相结合用于肺癌诊断,但是SERS需要借助纳米粒子放大信号,相对来说成本更高,不适用于大范围的筛查。而从异质样品中收集多个光谱的自发RS,既可以表征多组分成分,也无需特殊底物,其成本较低且操作更容易可能适合IPN 筛选。
本研究于两个临床中心收集健康人群、肺良性结节人群、肺恶性结节人群共883例血清样本,并将所有血清样本利用一种基于自发RS的新型拉曼系统进行扫描检测,同时收集相应的光谱数据,再通过机器学习基于不同人群的光谱数据建立可区分肺良、恶性结节患者的模型——LungRaDoc。另外研究者根据LungRaDoc的预测值筛选出真阴性和真阳性的患者,通过蛋白组学发现36种差异蛋白可能引起RS光谱的独特峰,其中角蛋白可能与在血清拉曼光谱1030 cm-1波峰差异有关。
 
 
随着LDCT在肺癌筛查中的普及,发现的可疑性肺结节越来越多,这些肺结节难以区分良、恶性,部分良性结节患者接受了不必要的手术。某些研究利用机器学习发现肺癌及健康人群之间存在差异波峰,基于差异波峰的数据构建了机器诊断模型并取得了较好的诊断效率。血清差异波峰可能来源于血清中的各种小分子、大分子等化合物,而肺良性结节与恶性结节患者的血清中也可能存在不同的有机分子,可以在RS上反映为不同的波峰,因此RS具有区分可疑性肺结节的潜力。
 
本研究从两个中心收集了共883例血清样本,包括220名健康参与者,663名经LDCT初次发现的肺结节患者,经过穿刺活检或术后病理确诊为148名良性肺结节患者以及515名恶性肺结节患者。将所有血清样本利用一种基于自发RS的新型拉曼系统进行扫描检测。检测过程中每个血清样本扫描约15次,每次扫描累积3秒,每个样本总共耗时约1分钟。RS光谱数据采集后,所有的检测样本都留存于-80℃冰箱。所有样本完成检测后利用R进行数据处理及分析。首先通过ANOVA分析发现,在波长500-1800 cm−1范围中,恶性结节患者与良性结节患者在多个波段存在显著差异(图1A,B)。随后将纳入样本分为discover组及独立的validation组,通过机器学习的方式,利用discover组中的光谱差异数据构建SVM模型——LungRaDoc,并在独立validation组中验证诊断效率(图1C)。在discover组中,LungRaDoc区分良、恶性肺结节患者的AUC达到了 0.87 -0.95,且在validation组中的中位数AUC也达到了0.89。通过逻辑回归分析反映LungRaDoc不受年龄,性别、结节特征以及血清样本的保存时间影响(图1E)。将LungRaDoc与其他常见临床模型相比,在validation组中MC 模型的 AUC 值为 0.46(95% CI 0.33-0.59),VA 模型为 0.61(95% CI 0.48-0.73) BU 模型为 0.74(95% CI 0.62-0.85),均低于LungRaDoc0.89(95% CI 0.82-0.96)(图1D)。DCA曲线反映LungRaDoc 可以更好地预测恶性结节,与其他三种临床模型相比,为患者带来了更多的获益,NRI及IDI表明LungRaDoc区分恶性结节和良性结节的准确性高于其他三种临床模型。将LungRaDoc的cut-off值设为0.0773,与金标准病理检查相比,LungRaDoc 达到了80% 的灵敏度以及0.93 的高阳性预测值。
 

图1 (A)良性结节、恶性结节及健康人群组的光谱总平均值;(B)光谱方差分析检验的结果。方差分析检验中存在显著差异的光谱范围(p < 0.05)以黄色表示,而无显著性以蓝色表示;(C)LungRaDoc构建和验证的步骤;(D)LungRaDoc和三种用于区分肺结节良、恶性临床模型的ROC曲线,黑色、灰色、黄色和红色ROC曲线分别代表VA、MC、BU和LungRaDoc;(E)LungRaDoc 与年龄、性别、结节特征和样本保存时间的相关性热图;

为阐明导致拉曼信号变化的分子,该研究进一步从两个研究中心存储的实验标本中随机筛选出年龄和性别匹配的14个血清样本,样本分别来自7个LungRaDoc预测值超过cut-off值的真阳性恶性患者,以及7个LungRaDoc预测值低于cut-off值的真阴性良性人群。通过蛋白组测序分析发现了LungRaDoc预测的真阳性恶性患者和真阴性良性人群之间存在36种不同表达蛋白 (different expression proteins,DEP),其中35种蛋白质上调,1种蛋白质下调(图1F)。通过GO、KOG、KEGG、蛋白质结构域、亚细胞定位和信号肽分析,发现DEP 主要来自细胞骨架, 与细胞囊泡及粘着斑的形成有关,还与中间丝蛋白和角蛋白有关(图1G)。据报道角蛋白反映在血清拉曼光谱1030 cm-1波峰处,而本研究前部分的结果也显示良性肺结节人群和肺癌患者在1030 cm-1波峰附近存在显着差异,这说明良性肺结节人群和肺癌患者之间的光谱差异可能与角蛋白有关,但是这部分结论还需要进一步的研究证实。
 
图2(A)真阳性和阴性个体之间差异表达蛋白(DEPs)的热图;(B)DEPs的KOG 富集分析;(C)DEPs的亚细胞定位分析;(D)DEPs的结构域富集分析;(E)DEPs的GO富集分析。
 
文章结论与讨论,启发与展望

该研究中使用的RS系统每次测试只需要0.5毫升血清,测试时间仅需要1分钟,与检测核酸、蛋白等的液体活检方式相比,操作简单,检测速度快。而立式冻存管是唯一用到的实验耗材,与表面增强拉曼光谱等相比无需过多的实验耗材,成本更低,更具有广泛筛查的可应用性。此外,该研究基于883人的大样本,将样本分为discover组及独立的validation组,利用discover组构建模型并在独立validation组中验证诊断效率,使结果具有可靠性。尽管该研究尽量避免抽样误差,但由于样本量不平衡,良性样本远少于恶性样本,恶性样本的光谱结果随机分为 10 组以与良性组匹配,在交叉验证过程中,来自一个样本的光谱将同时出现在测试集和训练中。验证组中的样本是绝对独立的,可以避免一个样本的光谱既在测试集中又在验证集中进而避免良对验证组结果的影响。因此,对LungRaDoc大量的外部验证以及对引起光谱差异的DEPs的探索将继续在未来的工作中完成。同时该研究基于良性结节人群及恶性结节人群的光谱差异构建LungRaDoc,与其他基于恶性与健康人群差异构建的模型相比,在肺结节人群中会更具有可重复性。根据蛋白组测序结果显示,DEP尤其角蛋白可能是导致肺良、恶性结节患者拉曼光谱存在差异的因素,这也将成为后续的研究重点。

上一篇:通过meQTL定位揭示非洲美国人DNA甲基化的遗传决定因素 下一篇:揭示TET1s参与扰动流调控血管内皮功能紊乱的力学生物学机制
已经到最底了
服务支持
新闻资讯
关于我们
微信扫一扫