您好, 访客   登录/注册

基于线性回归模型的铁路货运量预测

来源:用户上传      作者:

  摘 要:铁路货运量是铁路基础设施建设的重要依据,准确的铁路货运量预测对未来铁路建设发展有着重大意义。本文结合铁路货运量现状,分析影响铁路货运量的主要因子,在传统的回归预测模型基础上,利用最小二乘法进行参数标定,构建铁路货运量预测的五元线性回归模型,并对2020年铁路货运量进行预测。
  关键词:多元线性回归;铁路货运量;预测
  中图分类号:U491.13         文献标识码:A
  0引言
  预测方法可分为定性与定量两种。定性预测法包括经济调查法、特尔菲法等;定量预测法包括时间序列法、影响因素分析法等。为保证预测的准确度,应根据实际情况采用合适的方法。本文采用回归分析法进行预测。回归分析预测法,是在分析自变量和因变量之间的相关关系基础上,建立变量间回归方程,并将此作为预测模型。根据模型中自变量个数的多少,将回归模型分为一元回归模型和多元回归模型;根据模型是否呈线性,分为线性回归模型和非线性回归模型。
  1模型介绍
  1.1一元回归模型
  一元线性回归是分析只有一个自变量x与因变量y线性相關关系的方法。
  理论模型为:,其中y为因变量,x为自变量,;为回归常数,;为回归系数,;表示随机误差。用最小二乘法求解;,;的估计值,得:
  ,其中 ,
  1.2多元回归模型
  多元回归分析是研究因变量对两个或两个以上自变量的统计依赖关系。给定数据集,存在,使得,则:
  用最小二乘法求解;和b得:;令,得多元回归模型为:
  2建立铁路货运量预测模型
  2.1 影响因素
  通过国家统计局查询2010年-2019年铁路货运量,绘表如下(表1)。
  由数据可知,铁路货运量在2013年至2016年出现急剧下滑。除此之外,货运量基本呈现上升趋势。即货运量变化是一条折线,用一条直线或曲线描述不准确,因此需要考虑采用多变量预测模型。经研究分析,影响货运量并可以查询到的因子如表2。
  2.2 相关性分析
  根据表1与表2数据,绘制货运量随各个因素变化的散点图(如图1所示),明确货运量随自变量变化的大致趋势,选择相应的回归模型。由于2015-2016年受宏观经济影响,煤炭等大宗商品的需求量急剧下跌,导致这两年铁路货运量大幅度降低。除却这一特殊时期,各因子对铁路货运量的影响趋势基本呈现线性相关。因此,本文选择线性回归模型进行预测。
  2.3 因子选择
  采用多元逐步回归法对上述选取的14个因子进行筛选。利用matlab工具箱中stepwise命令实现此目的,因子筛选结果为:第二产业增加值x1,工业增加值x2,建筑业增加值x3,交通运输、仓储和邮政业增加值x4,民用航空货运量x5,管道货运量x6。
  2.4 模型建立
  对铁路货运量y与x1,x2,x3,x4,x5,x6这6个因子建立多元线性回归模型:
  其中,;利用最小二乘法解得:
  计算得模型回归系数为:
  综上,该预测模型函数表达式为(令为第t年铁路货运量预测值):
  2.5 模型检验
  2.5.1 多元线性回归模型检验
  采用Excel回归分析函数对模型进行检验,可知:模型R2=0.997672638,拟合效果很好。F=214.3355207,在;=0.05的条件下,F0.05(6,3 )=8.94,F>F0.05(6,3 ),线性关系显著,t检验值依次为2.190014726,4.886588204,4.644454095,4.399264312,19.48717078,3.484784469,5.940206129,P-value值分别为0.11625278,0.016389566,0.018816999,0.021772952,0.000295204,0.03991693,0.009537661,存在P-value=0.11625278>;,各变量显著性水平低。无法准确预测未来铁路货运量,模型需要改进。
  2.5.2 模型改进与检验
  建立铁路货运量y与x1,x2,x3,x4,x6这5个因子的多元线性回归模型:
  y=;+;1x1+;2x2+;3x3+;4x4+;6x6
  经计算,该预测模型函数表达式为:
  检验得:模型R2= 0.988251692,拟合效果很好。F=67.29491385,在;=0.05的条件下,F0.05(5,4 )=6.26,F>F0.05(5,4),线性关系显著且t检验值依次为7.378041251,4.962325579,4.839805253,4.492190675,10.17516225,4.299317272, P-value值分别为0.001798816,0.007693364,0.008401268,0.010887507,0.000525444,0.012652452,存在P-value<;,各变量显著性水平较高,能够用此模型预测未来铁路货运量。
  3铁路货运量预测
  预测未来铁路货运量,只需在模型中输入自变量的值,便可求得。通过数据分析可知,各因子随年份变化趋势满足一元线性相关,建立一元线性回归模型,对各因子进行预测。预测结果为:2020年第二产业增加值394676.2亿元,工业增加值323558.9亿元,建筑业增加值73027亿元,交通运输、仓储和邮政业增加值44789.8亿元,管道货运量95781.9万吨。将各因子的预测值代入货运量预测模型求得2020 年的货运量为391098.21万吨。
  4结论
  本文采用国家统计局近十年各指标数据,并结合多元线性回归预测模型,对铁路货运量进行预测,使预测结果平均误差在0.63%左右。此模型拟合度高,预测结果准确。本文不足之处在于各因子的预测值是采用一元线性回归模型进行预测,较多元线性回归模型来说,准确度相对较低,最终铁路货运量预测会产生一定的误差。
  作者简介:代玲虹(1998-)女,汉族,四川成都人,本科,研究方向:交通运输。
  参考文献
  [1]薛方,苏芮锋,杨升等.基于回归分析的公路货运量预测[J].汽车实用技术,2019(15):65-69.
  [2]孙风华.区域货运需求预测方法研究[D].西安:长安大学,2011:64-70.
  [3]宋光平.铁路货运量预测方法研究[D].北京:北京交通大学,2007:19-23.
  [4]张岄.铁路货运量预测及影响因素研究[D].北京:北京交通大学,2016:43-49.
  [5]展红亮.铁路货运量预测及开行方案优化设计[D].石家庄:石家庄铁道大学,2017.
  [6]高醒,李夏苗,彭鹏.铁路货运量预测过程中的关键技术分析[J].科技和产业,2018,18(05):1-6.
转载注明来源:https://www.xzbu.com/1/view-15288787.htm