基于影像组学和机器学习的脑部胶质瘤分级模型研究
来源:用户上传
作者:王俊秀
文章编号:2096-1472(2022)-02-22-03
DOI:10.19644/j.cnki.issn2096-1472.2022.002.006
摘 要:本文将影像组学的方法和机器学习算法结合起来,对脑部胶质瘤进行分级预测。利用BraTS2019公开数据集,从多模态MRI图像中分别提取肿瘤的448 维影像组学特征:肿瘤形态学特征、一阶灰度特征、纹理特征等;然后通过最小绝对收缩和选择算子(Lasso)算法筛选出15 个最佳的影像组学特征;最后根据筛选出的最佳特征集,利用随机森林分类算法构建脑部胶质瘤的分级预测模型。基于机器学习建立的模型在训练组患者中预测胶质瘤级别的准确率达到95.6%,ROC曲线下面积(AUC)达到0.99;在验证组患者中预测胶质瘤级别的准确率达到89.3%,AUC达到0.96。可见,基于机器学习算法,利用影像组学的方法可以对脑部肿瘤的高低级别进行准确的预测和分类。
关键词:肿瘤分级;影像组学;机器学习;随机森林
中图分类号:TP39 文献标识码:A
Research on Grading Model for Brain Glioma based onRadiomics and Machine Learning
WANG Junxiu
(Taiyuan Institute of Technology, Taiyuan 030008, China)
wangjx@tit.edu.cn
Abstract: This paper proposes to combine radiomics and machine learning algorithm to classify and predict the brain glioma. Based on BraTS2019 public dataset, 448-dimensional radiomics features of tumors are extracted from multimodal MRI (Magnetic Resonance Imaging) images, including tumor morphological features, first-order grayscale features, and texture features, etc. Then 15 best radiomics features are screened through the least absolute shrinkage and selection operator (Lasso) algorithm. Finally, according to the best screened feature set, the random forest classification algorithm is used to construct the brain glioma grading prediction Model. The accuracy of machine learning-based model is 95.6% and the area under the ROC (AUC) is 0.99 in the training group, and 89.3% and 0.96 in the validation group, respectively. Application of machine learning algorithm and radiomics realizes accurate prediction and classification of brain glioma level.
Keywords: brain glioma grading; radiomics; machine learning; random forest
1 引言(Introduction)
X胶质瘤是大脑内部最常见的恶性肿瘤,按照世界卫生组织的认定标准,根据胶质瘤的严重和恶性程度可划分为低级别胶质瘤(Low Grade Glioma, LGG)和高级别胶质瘤(High Grade Glioma, HGG)。低级别胶质瘤为分化良好的胶质瘤,预后效果比较好。高级别胶质瘤为低分化胶质瘤,这类肿瘤为恶性肿瘤,患者预后效果不佳。胶质瘤的准确分级对患者的诊断、治疗方案的设计及预后非常重要。影像组学研究是一个计算机和医学交叉研究的技术信息领域,它是指从各种类型的医学图像如CT、MRI、PET中提取高通量的数据信息,然后进一步地挖掘、分析和预测,最终可以帮助医生做出最准确的诊断与治疗。影像组学包括获取图像、肿瘤区域分割、影像组学特征提取和分类预测模型构建等步骤。利用机器学习方法实现的影像组学已经很大程度上提高了医学诊断鉴别及预后预测的准确性。
本文主要采用影像组学的方法和机器学习算法来解决脑部胶质瘤分级预测的问题。本研究使用了BraTS2019数据集中胶质瘤患者的术前MRI影像,采用影像组学方法提取影像学特征;然后采用最小绝对收缩和选择算子(Least absolute shrinkage and selection operator, Lasso)对高维特征进行降维,筛选出最佳的影像学特征集;最后根据所选出的最佳特征集,通过随机森林(Random Forest, RF)算法建立胶质瘤高低级别分类模型。用受试者工作特征曲线(Receiver Operating Characteristic Curve, ROC曲线)来评价分类器模型的预测效果。
转载注明来源:https://www.xzbu.com/1/view-15425112.htm