基于大数据的影像分析模型的设计
来源:用户上传
作者:高西
摘要:关于皮肤领域的大数据可以从不同维度获取,如疾病维度、病人维度、数据维度等,根据皮肤影像分析所需要的大数据维度,进行关于皮肤影像分析模型的设计。采用深度学习方法,对皮肤影像进行分类,根据皮肤影像对各类皮肤病诊断的优势,为皮肤科医生提供量化的诊断依据,从而完成对皮损类别的预测,帮助皮肤科医生对病人病情进行准确分析和判断。
关键词:大数据;皮肤影像;模型;设计
中图分类号:R751;TP391 文献标识码:A 文章编号:1001-5922(2022)07-0170-05
Design of skin image analysis model based on big data
GAO Xi
(1.Dermatology, University-Town Hospital of Chongqing Medical University, Chongqing 401331, China;
2.Medical Data Science Academy of Chongqing Medical University,Chongqing 400010,China)
Abstract:Big data in the skin field can be obtained from different dimensions, such as disease dimensions, patient dimensions, data dimensions, etc. According to the big data dimensions required for skin image analysis, the design of the skin image analysis model is carried out. Using deep learning methods to classify skin images and according to the advantages of skin images in the diagnosis of various skin diseases, we could provide dermatologists with a quantitative diagnosis basis, thereby completing the prediction of skin lesions, and helping dermatologists to diagnose the patients condition with accurate analysis and judgment.
Key words:big data; skin image; model; design
基于医学经验的模型与基于数据驱动的模型同属于皮肤影像分析模型的策略。在皮肤影像分析模型中,对于疾病预测所使用的风险因素,需要由经验丰富的领域专家提供[1]。通过医生提供的关于皮肤病的风险因素,建立风险预测模型,从而预测皮肤病发病的概率。基于数据驱动的模型,使用现有的数据,通过机器学习的方式获取预测风险值,并对所有可能存在的风险因素建立数据驱动模型,从而实现对疾病的准确判断[2]。在本次研究的基于大数据的皮肤影像分析模型设计中,依靠近年来广受关注的人工智能技术,以数据驱动方法为核心,从大数据层面,概括关于皮肤影像分析所需要的研究内容,并将皮肤影像数据进行存储,为皮肤科医生的诊断提供数据支撑。
1基于大数据的皮肤影像分析
1.1以病人为中心
以病人为中心的数据组织方式分为以下几种类别:(1)病历:病人的就诊信息、过往病史、过敏史以及现在的病情史;(2)影像:皮肤超声、皮肤CT、皮肤病理;(3)连续数据:病人数据跟踪;(4)数据整合:同一病人不同时间段的数据;(5)数据检索:根据病人的个人情况进行数据检索[3]。
1.2以疾病为中心
表示针对特定的疾病研究而设定的一种数据组织形式,通过整理典型病例,按照亚型分布组织或者3间分布组织的形式展开对典型病理的研究[4]。
皮肤影像中,摄影和图片分辨率高,病理多;因此对于数据量的要求也非常高,医院在数据存储空间方面要以5T起步。从大数据的深度学习进行分析,ImageNet猫和狗的鉴别模型品种多达1 000多种,一般的医疗影像所使用的模型,如果要得到一个卷积神经网络,则需要的皮肤影像也高达106级;如果按照皮肤病种进行计算,病人的病历图片需要500张以上;如果按照手写体进行识别,其数据量也高达106级,可以获取较好的识别效果。因此,如果皮肤影像的数据量高达上百万,且数据均衡,则可以获得较好的分类识别效果[5]。
2皮肤影像分类
2.1数据集
在深度学习中,大量的样本学习十分重要,如果没有充足的训练数据基础,则卷积神经网络无法获取准确的样本特征,从而陷入困境中。因此,榱巳镁砘神经网络可以具备较好的泛化功能,需要为卷积神经网络提供足够多的训练样本[6]。通过构建皮肤影像数据库得到海量的图像,该数据库不仅空间大,而且各类的标签信息非常完整,疾病种类精细。在庞大的数据库中,精细的标签信息为卷积神经网络提供了强大的支撑力。在ISIC皮肤病的数据库中,或者是一些其他的皮肤病数据库中,数据都被进行精细分类。在数据的准备阶段,一种称为PA的自动递归算法得到了应用,将上千种的皮肤病按照特定的图像进行展示,如图1所示。每一个类型中所包含的数量值控制在1 000幅以内,在保证精细度的同时也会为其提供充足的数据基础,从而更加有利于深度学习。在图1的结构中,分为Ⅰ、Ⅱ 级两大类,每一等级都对应了具体的皮肤病[7]。
nlc202207251947
转载注明来源:https://www.xzbu.com/1/view-15436599.htm