您好, 访客   登录/注册

股票选择分析中数据挖掘技术的应用研究

来源:用户上传      作者:

  【摘要】受到人们生活水平的不断提升的影响,人们闲置资金的数量也是与日俱增,也就使得投资需求越发旺盛。股票市场因其自身的高风险、高回报特点,成为了人们投资的重要途径之一。但是,因为人们专业知识的不足以及股市信息的不对称性,导致人们在选择股票的时候存在着一定的盲目性,为此,如何利用股市中大量数据降低投资者的投资风险,就成为了一个极为现实的问题,而数据挖掘技术的诞生和发展正好满足了这个需求。本文基于数据挖掘技术在股票分析中的可行性,在分析其特点及过程的基础上,就数据挖掘技术在股票分析选择中的应用提出了意见,以期为今后数据挖掘技术在股票选择分析中的应用提供参考。
  【关键词】股票选择分析  数据挖掘技术  可行性  过程  特点
  证券行业发展至今已经逐渐趋向于饱和,券商的工作重心也从之前的新客户开发转变为现存客户的维护,通过为客户提供优质证券服务,以便进一步扩大交易量,这也就是投资顾问服务得以快速发展的原因所在。但是,其中却存在着海量数据分析过于简化的问题,导致其中隐藏的规律模型无法真正得以挖掘。数据挖掘技术的使用正好解决了这个问题,借助数据挖掘技术的帮助,可以从海量的数据中得出真正有价值的投资模型,并为客户提供真正有效的投资参考。
  一、数据挖掘概述
  近年来,我国的证券行业越来越来越开放,业内的竞争也与日俱增,市场上各种投资机会非常之多,这就对我们的决策效率和质量提出了较高的要求。同时,而发展较快的数据挖掘技术能够很好地满足这方面的需求,可以为我们提供更加方便、快捷的决策工具,通过数据挖掘技术的开发,可以有效地促进股票市场的发展。
  (一)数据挖掘概念
  数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、潜在有用的信息和知识的过程。从商业的层面来分析,我们可以从海量的有关企业的商业信息,从中提取对我们决策有用的信息,同时发现隐藏其中的商业规律,以便更好地掌握第一手商业信息资料。数据挖掘不是单独的学科,是一个多学科交织在一起的学科,其中包含了许多发展较早且丰富的计算机技术及其工具,分别是数据库技术、统计学、机器学习、模型识别、人工智能、建模技术、电子技术、信息技术等等。
  (二)数据挖掘过程
  数据挖掘的第一步是明确业务的内容,而后根据业务内容提出数据挖掘的目标。第二步是为数据挖掘做准备,包括:选择数据——在大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理——进行数据再加工,包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,刪除无效数据等。再次是数据挖掘:根据数据功能的类型和和数据的特点选择相应的算法,在净化和转换过的数据集上进行数据挖掘。进而是结果分析:对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识。最后是知识的运用:将分析所得到的知识集成到业务信息系统的组织结构中去。
  二、数据挖掘技术的特点分析
  数据挖掘技术尤其自身的特点,在各行各业的应用也非常广泛,不同的行业在运用数据挖掘技术时所展现的特征是不同的。而数据挖掘技术在股票市场上有很多优势性的特点,主要有探索性、方法多样性以及可靠性的特点,下面是从这三个角度去分析:
  (一)探索性
  在数据挖掘技术的使用过程中,可以借助数据统计工具开展大型且杂乱数据的探索工作,可以很轻易的探索出上面提及研究内容的结果。更有甚者,会在数据的探索过程中,发现出实现没有预估到的关系,在样本数据真实可靠的情况下,借助数据挖掘技术得到这个数据之间的新关系在真实性以及可靠性就会相当之高,也就是得到了一个比之前预估更为符合实际的认知,这正是数据挖掘技术的探索性所在。
  (二)方法多样性
  数据挖掘技术中年具备着极为多样化的技术手段及分析方式,在其中应用最为广泛的技术就是分类技术,分类技术解决的问题就是将数据进行归类处理,从样本数据出发,建立一个适当的预测模型,开展预测工作。除此之外,聚类分析的应用也较为频繁,其主要作用就是在建立一种分类方式的基础上,将样本数据按照一定的属性性质亲疏进行分类。除了这两种方式之外,回归分析、人工神经网络、关联规则挖掘等等方式也都在股票数据分析中发挥出了巨大的作用。这些方式可以从实际股票信息出发,做出适当的选择。
  (三)可靠性
  在股票市场上运用数据挖掘技术能够大大增加信息的可靠性。因为,在实际的抽样中,样本数据并不能完全真正地代表股票总体数据,由于数据中会存在着偶然性以及随机性误差,很容易在这些特点的影响下,出现数据过度拟合的问题,最终导致模型无效化,很有可能得出错误的结论,进而诱导投资者作出不恰当的投资策略。
  在数据挖掘技术中,为了更好的避免出现过度拟合的方式,基本使用的都是数据拆分方式,这种方式就是在自行设计比例及方式的前提下,将样本数据划分为训练、验证以及测试三大集合,并通过合理使用三大数据集合,就可以很好的避免出现过度拟合的问题,从而更好的保障模型自身的可靠性以及有效性,增加数据的可信度。
  三、数据挖掘技术在股票分析中的应用
  在证券市场上投资是存在一定的风险的,这其中有诸多因素,而对券商来说最重要的是数据的及时性、准确性以及有效性。因此,数据挖掘技术对于证券公司显得越来越重要,券商也非常注重对数据挖掘技术的应用。尤其是在股票市场上,股民们更信赖信息准确的券商,同时券商不仅是股票售卖机构而且也是市场上巨大的机头投资者。所以,对数据挖掘技术在股票分析的应用研究迫在眉睫,在此主要从证券应用领域的三个方面来说明。
  (1)在股市客户层面上:客户关系管理( Custom Relationship Management ,CRM )是指通过有效管理客户信息资源,提供客户满意的产品和服务,与客户建立起长期、稳定、相互信任的密切关系,为企业吸引新客户,锁定老客户,提供效益和竞争优势。从这个定义上说,CRM 也是企业信息管理发展的一个新的阶段。   我国证券业不断开放发展,有关证券市场的制度也在不断完善,使之与我国经济发展能够同步,同时证券市场主体与日俱增,竞争强度愈来愈大。虽然其不断地发展,但是仍然有些不足,有关证券业的市场制度应继续完善。其中最重要的就是客户管理方面,股民是股市的主体,客户关系应该放在证券市场管理的首要位置,借助数据挖掘技术为其提供良好的管理工具。
  创建“以客户为中心”核心思想的证券客户关系管理(CRM) 以及合作伙伴关系管理(PRM)系统,来适应日益激烈竞争的市场。其首要落实的基础是必须实现网络化的交易,并且在此条件下,与客户维持良好的关系同时建立稳定的客户管理网络系统,而后形成一个完整的信息处理体系,而这个体系是围绕客户而展开的,其宗旨是为客户决策提供更多的信息服务,优化其投资方案。
  证券CRM系统几乎可以浓缩现有证券业务的所有服务、技术和形象,但证券CRM系统不是传统证券服务的照搬。传统的证券机构系统是由外向内的转变,先完善机构的外部形象,进而渐渐地向服务客户的方向发展,其与传统的证券机构系统相比,证券CRM系统具备了更高的服务质量,其不是单纯地为客户提供传统的服务,而是通过数据挖掘技术为客户提供经过处理的股市信息,围绕客户价值需求而展开,真正地为客户提供了价值创造的深层次服务。
  在为客户服务的过程中,证券CRM系统首先是对数据系统中的交易信息作出预处理,然后为客户提供了专用的股票交易数据系统。在这个数据库中,保存了大量的历史数据,并且通过一定的聚类分析方法为客户提供分类的服务。它是通过每个客户的交易行为来为客户提供分类的交易信息,而且根据交易行为对其进行客户分群。如此一来,数据系统就会根据后台的客户交易信息自动识别出客户的群类,分析出客户的交易行为特征,通过为每个客户提供个性化的信息服务,不断提高客户的贡献度,这样可以不断地为股市的发展积累更多的资源。
  (2)在股市技术层面上:利用时间序列预测股票价格。数据挖掘顾名思义在海量的数据中提取有用的数据,并对其进行分析,其中可以按照时间序列的方式来处理数据信息,其时间序列模型可以直接为客户提供股票的价格信息。在巨大的数据库中,通过主成分分析的方法,去掉对与股市无关的信息,或者是诱导性的不正确信息,让数据变成可以直接使用的信息,帮助我们可以有效地对股市进行分析和预测。
  通过历史交易数据和时间序列方法的综合使用,可以做到各种类型或者是单体股票对于各种类型信息的的影响变动敏感度,并通过实际的数据分析,将其中可以最为精准预测股票价格走向的技术分析指标集合挖掘出来。同时,还可以通过历史时间段上的各个时间间隔的股票价格涨跌及交易量的具体变动信息,将大众总体上的投资心理和投资倾向进行分析,目前最為常用的的时间序列分析法就是建立ARIMA模型,可以实现对股价及综合指数的精准化预测,以此来帮助投资者在在众多项目中选择最有价值的项目,实现其资金效率最大化的目标。
  在上市公司中,财务报表可以很好地为公司提供财务信息,很好的反映上市公司的财务状况,而不同的股东对财务报表的需求是不一样的,一般情况下,大股东比较注重公司的利润,而一些国家控股的股东更关注公司的债务,普通股的股东比较在意公司的发展潜力,这些不同的财务报表使用者分别有不同的报表需求。从时间的维度来看,短期的投资者更加重投机的需求,其资金的投资者更关注利润的分配,或者非常注重股市中一些有炒作嫌疑的信息(包括资产重组、免税等信息),这些投资者希望股市的股价发生变动,通过股价提升来获取暴利。再者,一些长期的投资者更注重投资需求,他们更多关注所投资上市公司的运营前景以及行业发展潜力,不会因为股市上一时的利空信息而收回资金,他们认为股价的波动不足以成为其进行决策的决定性因素,更代表不了上市公司的经营前景。单纯的通过某些会计科目来判断公司的整体长期的发展,是不严谨的,公司的发展离不开宏观经济的发展。若想更精准地把握公司的发展,需要纵向结合历史时间序列数据,挖掘数据的深度,并且横向分析各行业的宏观发展情况,增加数据的广度,这样就可以扩大分析的数据,避免一些偶然性的数据所带来的错误性信息,使之最大限度的保障投资决策的客观性。所以,总体来讲,为了提高决策的准确性,第一是长期动态的数据信息,第二是面对不同用户的知识挖掘工具。如若处理各种类型、不同特征的数据信息,进行数据挖掘,那么就要组建一个高效的数据库,对挖掘的数据进行存放,并且可以自主分析处理。
  在组建数据库的同时,更要注重数据挖掘的方法原则,这对于数据挖掘有效性有很大的帮助。市盈率也可以称为价益比,在对上市公司进行财务分析时,是非常重要的一个要素,能够对市盈率水平做出精确判断,这无疑对股票市场的研究具有重大意义。除此之外,政府的相关金融部门通过掌握市盈率水平的信息,可以更深入地及时了解股市情况,对股市出现的问题可以最快的做出应对措施,避免股市的不良发展,保障国民经济的稳定增长。就广大的股民而言,整个股市市场的市盈率水平可以有效地识别市场风险;而分析个别板块、个别股票市盈率,有利于帮助搜寻投资潜力最大的股票,从中获取比较高的投资报酬。通常条件下,如果应得收益小于期望收益,也就是说均衡市盈率大于市盈率,投资者才有可能买入股票,如果情况相反,则股民有可能卖出股票。但是我们经常所提的市盈率,是不能与均衡市盈率直接进行对比的。每股收益需要采取预期每股收益,那么市场中的投资者可以根据二者来得出均衡价格。在股价小于均衡价格时,则可以投资该股票;在股价大于均衡价格时,则不能投资该种股票。就每股收益来说,能够展示公司的增长预测情况,这是股市投资者关注的最为重要的指标,不应单独直观去判断它,而应采取科学的分析工具,可以通过数据挖掘,建立系统完善的数据库来为投资者的决策所服务。
  (3)在宏观股市层面上:宏观经济信息、产业、地区和公司的基本信息和股票价格是有关系的。他们之间的关系是可以通过组建数据库来体现的,使用数据挖掘手段来凸显其中的规律,并且根据股票发行的特点和真实价格的规律,来辅助我们对其股票进行预测。如果能够大致预测其未来的股市趋势,而且在完全市场有效的条件下,股市的信息就是国民经济的晴雨表,就可以体现地区的经济状况,展现行业内的发展态势,较好地去把握国民经济的发展趋势。   在预测方面,可以通过运用决策树的知识。在财务管理方面,规定每一项资产的真实价值就等于投资者对该项资产所有期望收益流量所折现的现值,所以影响一项资产的价值,不仅包括该项资产給投资者带来的预期现金流量,而且与该项资产所使用的折现率息息相关。具体分析来看,不但需要预测折现率,并且还要预测预测该种股票的每股平均收益和派息率。如果股票的实际价值一旦被测量出来,那么就能够与该种股票的市场价格做对比,若实际价值大于股票市场价格,则股票价格被低估了,要买进;如果实际价值小于股票市场价格,则股票的市场价格被高估了,要卖出。如此一来,就可以通过这种数据挖掘技术工具对股票价格进行合理性的鉴定和识别。
  总之,宏观经济的发展与股市是密不可分的,而股市信息的精确性、及时性以及有效性又是必不可少的。传统的信息获取方式已经跟不上股市发展的步伐,而由于数据挖掘技术不断地发展,恰恰能够满足股市市场的需求。在股票分析的层面上,应大力推行数据挖掘技术的应用,满足不同客户的不同需求,方便客户的股票选择过程,进而建立起信息有效的股市市场,从而更好的服务于我国的宏观经济。
  四、总结
  随着证券市场饱和度的逐步提升,券商的工作重心也逐渐转变为了现存的客户,通过为客户提供对应的投资顾问服务,进一步提升交易量,但是,在这个过程中却涉及到了海量数据的分析,传统的定性分析方式完全无法胜任,为此,数据挖掘技术因为股票市场数据的海量性等特点,在股票选择分析中得以应用。通过模型进行海量数据的分析工作,在发现这些数据潜藏规律的前提下,为投资者确定投资目标、方向以及组合提供可靠的数据支撑,并且在未来,在股票分析选择中具备着广阔的应用前景。
  参考文献:
  [1]李艳斌.基于数据挖掘技术的股票选择分析研究[D].东北财经大学,2018.
  [2]朱小舟.数据挖掘方法在股票选择中的应用研究[D].对外经济贸易大学,2018.
  [3]黄悦.基于数据挖掘技术的股票选择分析[D].北京外国语大学,2017.
  [4]刘德政.基于错误发现率的案例分析[D].山东财经大学,2017.
  [5]李秋汶.数据挖掘技术和财务报表分析在股票投资中的应用[D].重庆大学,2017.
  [6]戴鹤忠.基于数据挖掘技术的证券投资决策研究[D].北京科技大学,2017.
  [7]张晓艳.股市数据挖掘中偏模型的检验和应用[D].西南财经大学,2017.
转载注明来源:https://www.xzbu.com/2/view-15161701.htm