基于层次聚类的失眠处方用药分析
来源:用户上传
作者:
摘 要: 为了探寻层次聚类在失眠处方用药分析上的应用情况,进而分析失眠处方的用药规律,收集并整理了《方剂大辞典》中主治失眠的处方。对单味药物的四气、五味、归经及功效等数据,根据单连接、全连接和平均连接这三种不同的相似性度量方法进行层次聚类分析并比较。结果显示,基于全连接的层次聚类分组最为合理,将性味归经和功效有极大相似度的药物聚为一类,其聚类结果符合一定的中医理论。层次聚类结果客觀地反映了失眠处方中药物间的关联关系,间接体现了失眠用药的药物组合规律,为临床用药提供新的研究方法和思路。
关键词: 失眠; 层次聚类; 全连接; 用药规律
中图分类号:TP3-05 文献标识码:A 文章编号:1006-8228(2020)03-28-04
Analyzing insomnia prescription drugs with hierarchical clustering
Wang Huimin, Gong Qingyue, Hu Kongfa, Zhou Zuojian, Yu Xingwen, Shao Rongqiang
(School of Information and Technology in Nanjing University of Chinese Traditional Medicine, Nanjing, Jiangsu 210023, China)
Abstract: In order to explore the application of hierarchical clustering in the analysis of insomnia prescription medication, and then analyze the medication rules of insomnia prescription, the prescriptions for insomnia in the “Dictionary of Prescriptions” were collected and compiled. The dataset of four natures, five flavors, meridian tropism and efficacy of single-drug was analyzed and compared by hierarchical clustering analysis according to three different similarity measures of single linkage, complete linkage and average linkage. Results show that, the classification by hierarchical clustering with the complete linkage is the most reasonable, the drugs with the great similarity of four natures, five flavors, meridian tropism and efficacy become a cluster, and the clustering results are consistent with certain TCM theory. Hierarchical clustering objectively reflects the relationship between drugs in insomnia prescriptions, indirectly reflects the drug combination rules of insomnia medication, and provides new research methods and ideas for clinical drug use.
Key words: insomnia; hierarchical clustering; complete linkage; medication rules
0 引言
失眠是指即使有合适的睡眠机会和睡眠环境,依然无法入睡或无法保持睡眠状态,进而影响日间活动的一种主观体验[1]。其症状特点有入睡困难、整夜觉醒数次、醒后意识混沌、日间困乏等。西医将失眠归为睡眠障碍范畴,而中医常以“不寐”、“不得卧”、“目不暝”等称之[2]。经临床研究证明,长期失眠不但会影响人们的日常生活,还会造成一系列的机体损害。临床上西医常使用镇定催眠类药物来治疗失眠,但这些药物通常副作用大,依赖性强,不能算作是治疗失眠的良方。而中医以其独特的诊疗方式和中药所具有的低毒副作用的特质受到广大患者的青睐。
中医对失眠的认识由来已久,最早出现在《黄帝内经》中,“卫行于阴二十五度,行于阳二十五度,分为昼夜,故气至阳而起,至阴而止”,这说明营卫失调会影响睡眠。《太平圣惠方》中提出:“夫胆虚不得睡者,是五脏虚邪之气干淫于心”。中医认为,心主神明,心阴不足、心血不足等是导致失眠的主要原因。引起失眠的机制非常复杂,从身体内部结构上看,失眠与五脏的非正常运转有着密不可分的关系;从外部环境来看,中医讲究阴阳调和。除此之外,情志也是影响睡眠的重要因素,如《杂病源流犀烛·不寐多寐源流》中记载“有心胆俱怯,触事易惊,梦多不祥,虚烦不寐者”。更有研究表明,女性常在更年期时因情绪失调而患有失眠[3]。
鉴于失眠人数的逐年增长,诊治失眠变得越来越重要。中医治疗失眠的方法主要包括改善睡眠的中药、针灸、音乐疗法等[4-6]。为寻找治疗失眠的良方,研究中医失眠处方中的用药规律显得尤为重要。不少学者采用关联规则、改进互信息法、复杂熵聚类等数据挖掘技术研究失眠处方中的常用药物、常用药对等[7-9]。但这些方法多基于对药物的频数分析,以药物使用的频次为核心做关联分析,并没有将每种药物的性味归经及功效这些因素考虑在内。而中药的这些特质相互影响,相辅相成,才能对相应的症状起到有效的治疗作用。 本文采用层次聚类算法对失眠处方进行用药分析。层次聚类是一种基于原型的聚类方法,通过将每一个初始数据都视为一个单独的簇,基于簇与簇之间的相似性而一层一层的聚在一起[10]。层次聚类克服了大多数聚类需要已知中心点和已知簇类数量要求的缺点。在中药研究的药物分析中,由于每一味药有其特性,很难将其中一种药或一种特征设定中心点。而层次聚类可以将每一味药的性味归经及功效都考虑在内,自发的根据内在的相似性聚在一起。
1 材料与方法
1.1 数据收集
本研究的数据来源于《方剂大辞典》,使用“不寐”、“心神不安”、“心神失养”、“失眠”、“心肾不交”、“不得卧”、“水火不济”、“卧不安”、“目不暝”等作为检索词,筛选出符合中医语言定义的失眠组方,所选方剂有明确的药物组成及其主治功能,治疗方法以中药治疗为主且治疗有效。将符合标准的药物名称、四气、五味、归经、功效输入至Excel中进行整理,如表1所示。
1.2 数据处理
清洗数据以规范药物名称,将多个异名的药物名称统一成一个正名,并修改不规范的药名。整理方中各药物的性、味、归经及其功效,以便统计分析。以数字化的形式对失眠高频药物的性、味、归经及功效进行赋值,以便进行药物的层次聚类分析[11]。对于药物的性味归经和功效这类字符型的数据,不便于进行层次聚类分析。所以本文将这些药物属性数据转化为布尔类型的数值,即用0和1组成的字符串来表示单味药的四气五味、归经和功效。根据中药药性理论,这四种属性对于单味药的影响占比应当不同。因此,本文为四种属性划分权重,以示各属性的重要程度。性味影响归经,所以将性、味、归经、功效的比例按3:3:2:2规定。设置总权重为1,则性、味、归经、功效的权重分别为0.3、0.3、0.2、0.2。
1.3 相似性度量
在层次聚类中,有多种判断簇间相似性的度量方式。本文采用单连接(single linkage)、全连接(complete linkage)和平均连接(averagelinkage)这三种方式计算簇间的相似性并比较出对于该数据解释性最好的方法。
簇间相似性通过计算簇间距离来衡量。在single-link中,只关注两个簇彼此最接近的区域,取两个簇中最近的两个数据点间的距离作为这两个簇的距离。也就是说,最近的两个点之间的距离越小,则这两个簇之间的相似度就越大。而complete-link恰恰相反,取两个簇中最远的两个数据点间的距离作为这两个簇的距离。顾名思义,average-link介于single-link和complete-link之间,即把两个簇中的点两两的距离全部放在一起求平均值,将平均距离作为这两个簇的距离。
簇与簇之间的距离采用欧氏距离计算。其定义如下:
该式表示N维空间下两点之间的距离,x1i表示第一个点的第i维坐标,x2i表示第二个点的第i维坐标。在欧式空间下,通过簇质心或簇内平均点来表示簇,簇之间的距离为质心之间的欧氏距离。
1.4 层次聚类分析
将单味药的四气、五味、归经及功效数据作为输入,使每味药都初始化为一个聚类。根据上述三种相似性度量方法计算每两个聚类间的相似度距离,分别生成三种不同的样本间距离矩阵,以寻找最相似的两个聚类。再将最相似的两个聚类化为一个聚类,即用两个聚类的均值点做为新聚类,替换原有的两个聚类。每一步的计算结果以树状图的形式展现出来,形成层次聚类树。
2 结果
对使用频次超过平均值的46味治疗失眠的中药经过三种相似性度量方法分别进行层次聚类分析,生成基于单连接的层次聚类树状图,如图1;基于全连接的层次聚类树状图,如图2;以及基于平均连接的层次聚类树状图,如图3。
上述三幅图中,横坐标皆表示每一味中药,纵坐标皆表示药物间的相对距离,每一组连线都代表着将距离最近的两种中药联系起来,而这一条连线的高度则表示两点间的距离。从树状图中可清晰的比较出这三种相似性度量方法下的聚类结果。
通过树形图可直观的显示每一步合并的过程,由图1~图3均可看出性味归经和功效有极大相似度的药物聚在一起。基于单连接的层次聚类产生的聚类结果质量低,要么多种药物聚在一起,而这些药物相互之间并不是都有很强的关联性;要么多种药物相互独立,无法聚合,不能很好的体现药物间的关系。基于平均连接的层次聚类比单连接的更好的体现了类的层次关系,没有出现多种药物相互独立的情况,仅包含个别稍微偏离中心的药物。由图2可知当药物聚为10类时较为合理,符合一定的中医诊治理论;基于全连接的层次聚类效果表现最佳,划分的聚类层次结构清晰,分布较前两种更均匀一些,能较好地解释失眠高频药物之间的关系,客观地反应失眠处方的用药规律。
由图3可看出,聚为10类时效果最佳。综合药物的性味归经及功效分析,如人参、甘草、茯苓、茯神、山药这一簇,性平味甘,主要归心、肺、脾、肾四经,大多为补虚药,这与中医通过补虚泻实,调节气血失调的方法治疗失眠相对应。酸枣仁、琥珀、柏子仁、龙骨这一簇,性平味甘,主归心经,基本为安神药,这与中医通过安神养血的方法治疗失眠相符合。远志、石菖蒲、枳实、紫菀这一簇中,远志与石菖蒲为治疗失眠的常用药对,两药相辅相成,有祛痰开窍,安神定志之功效[12]。
图1~图3中,无论基于哪一种相似性度量方式,某些药物最终都会聚为一类。如生地、天冬、知母這一类,都为甘寒药物,具有滋阴的功效,可用于治疗阴虚烦躁导致的失眠;人参、茯苓、甘草这一类,益心胆之气,可用于治疗心胆气虚导致的失眠;半夏、枳实、陈皮这一类具有健脾化痰、理气和胃之效,可用于治疗痰热扰心导致的失眠。
由此可见,层次聚类无需提前指定具体的聚类数目,也没有局部极小或是初始点选择的问题。而是关注簇之间的远近距离,即根据药物间的相似性,一步步聚合最终形成层次树状图,适合用于挖掘综合考虑性、味、归经、功效相似度的药对或药组。 3 结束语
脏腑功能紊乱、气血阴阳失调、神志不宁以及情志失调是发生失眠的基本病机。本研究结果显示,失眠用药多以调节阴阳、补虚泻实、养血安神、镇惊清心为治疗原则。本研究将治疗失眠药物的四气、五味、归经和功效按一定权重进行层次聚类分析,通过比较三种相似性度量方法下的层次聚类的效果发现,挖掘结果最好的是基于全连接的层次聚类,其聚类结果更能体现中医对证下药的诊治规律。聚类结果体现了药物之间四种属性的综合相关联性,而不是孤立的某个属性的相关联性,因而得到的药物组合对临床用药更具参考性。
层次聚类对样本的输入顺序不敏感,不需要事先设定类似K均值聚类的全局目标函数,而只根据样本间的相似度自发聚类。它将药物本身的特性综合考虑在内进行聚类,这也可以用于其他病症的用药规律研究,其在中医药物组合规律上的應用前景广阔。进一步的研究将考虑将层次聚类与其他算法相结合,分析药与症状之间的复杂关系。
参考文献(References):
[1] 陈贵海.失眠的研究进展[J].中国临床医生杂志,2017.8.
[2] 武润梅,王芝平,梁晶晶等.失眠综述及临证举例[J].光明中医,2017.32(7):939-941
[3] 徐萍萍,乔会秀,耿嘉玮.更年期失眠中西医治疗进展综述[J].中西医结合心血管病电子杂志,2019.7(1):48-49
[4] 廉治军,张有民,刘波.应用解郁养血安神汤治疗失眠临床研究[J].辽宁中医杂志,2017.1:102-105
[5] 张雯静,王国华,王翘楚.落花安神口服液治疗失眠症疗效的随机双盲安慰剂对照临床试验[J].中华中医药杂志,2017.6:2801-2804
[6] 洪秋阳,杨惠民,王世广等.贺氏三通法治疗亚急性失眠:随机对照研究[J].中国针灸,2018.38(12):34-38
[7] 褚岩珺,李运伦.基于文献的从脾胃论治失眠用药规律研究[J].中国中医药信息杂志,2016.23(7):51-53
[8] 田瑾.基于互信息的失眠用药关联性分析[J].中国中药杂志,2015.40(19):3873-3877
[9] 邹聪,郭蓉娟,袁清洁.基于关联规则和复杂系统熵聚类的郭蓉娟治疗失眠“昼夜两方”用药规律研究[J]. 中医临床研究,2016.8(13):33-36
[10] Gullo F, Ponti G, Tagarelli A, et al. An information-theoretic approach to hierarchical clustering of uncertain data[J].Information Sciences,2017.402:199-215
[11] 张博,张超伟.中药方剂数据挖掘中的数据预处理研究[J].电脑知识与技术,2011.7(17):4016-4017
[12] 覃甘梅,覃骊兰,蓝毓营.治疗失眠中药药对的应用原则[J].中医药导报,2018.
转载注明来源:https://www.xzbu.com/8/view-15150352.htm