基于稀疏神经网络的火锅销量影响因素分析
来源:用户上传
作者:郭萍
摘 要:神经网络被广泛应用于目标检测、优化组合等领域,但其往往容易过拟合。为解决过拟合问题,通常对神经网络稀疏化,这类技术目前较为成熟,如dropout。文章主要考虑在Lasso罚函数情形下,通过对神经网络连接的权重进行压缩,实现高维非线性情形下的变量选择,并使用蒙特卡洛模拟验证该稀疏神经网络的变量选择结果具有一致性。最后将该模型应用到重庆市火锅团购销量分析中,得到10个对火锅销量最具影响的因素。
关键词:神经网络;稀疏神经网络;变量选择
中图分类号:TP399 文献标识码:A文章编号:2096-4706(2022)06-0086-04
Analysis of Influencing Factors of Hot Pot Sales Based on Sparse Neural Network
GUO Ping
(School of Mathematics and Statistics, Guangxi Normal University, Guilin 541006, China)
Abstract: Neural network is widely used in the field such as target detection, optimization and combination and so on. but it is easy to overfit. In order to solve the overfitting problem, neural networks are usually thinned and such techniques are mature, such as dropout. This paper mainly considers the variable selection in the high-dimensional nonlinear case by squeezing the weight of the neural network connection under the Lasso penalty function case. Monte Carlo simulations are also used to verify the consistency of the variable selection results for this sparse neural network. Finally, the model is applied to the sales analysis of Chongqing hot pot group purchase, and 10 factors that have the most influence on the sales of hot pot are obtained.
Keywords: neural network; sparse neural network; variable selection
0 引 言
神网络(Neural Network)作为受控的、非线性的深度学习基础模型,因其大规模并行处理、分布式存储等特点,被应用于模式识别、优化组合等领域。但由于它往往容易过参数化,对数据产生过拟合,神经元和权值稀疏技术得到重视。例如考虑将神经网络稀疏化,即对神经网络的连接的权重增加惩罚函数,如Lasso,将权重系数压缩至0,从而实现变量选择。
周书豪使用添加了“dropout”正则技术的深度神经网络(Deep Neural Network)预测股票第二天涨跌情况[1]。Krizhevsky等考虑神经元稀疏技术“dropout”,训练深度卷积神经网络(Convolutional Neural Networks),将LSVRC-2010竞赛图像进行分类[2]。Faming Liang等提出贝叶斯神经网络(Bayesian Neural Networks),基于肿瘤数据,成功应用于抗癌药物敏感性相关基因的鉴定[3]。Girshick等提出R-CNN算法,该算法结合CNN应用于目标定位和对象分离,并且在标准PASCAL VOC数据集对象检测上表现良好[4]。Jean Feng等提出稀疏输入神经网络(Sparse-Input Neural Networks),对输入神经元的权值添加Group Lasso罚函数,并验证其优于非参数高维估计方法[5]。Yan Sun等提出贝叶斯稀疏神经网络(Bayesian Sparse Deep Neural Network)解决大规模压缩和高维非线性变量选择问题,并验证该模型的一致性[6]。周徐达提出软硬件结合,使用剪枝技术处理不规则稀疏神经网络,以有效实现神经网络压缩[7]。
综上所述,稀疏神经网络技术的应用成为主流趋势。随新冠肺炎疫情好转,中国餐饮市场规模跃迁,火锅因其广泛受众基础搜索热度持续霸榜[8,9]。2020年,火锅品类收入4 380亿元,占整体餐饮收入的11.08%,搜索量涨幅达到11.6%;同年火锅连锁化率达到18.3%,较2019年,同比增长3.2%[10]。重庆市是国内目前拥有火锅店最多的城市。据窄门餐眼收录的数据,截止至2021年10月06日,重庆市火锅品类占比10.96%,仅次于快餐简餐排名第二。在品类比拼大赛道,火锅作为“吸金王”,该如何保持“吸金”特质?本文将稀疏神经网络模型应用到重庆市火锅团购销量相关分析中,探索对火锅销量最具影响的因素。
本文其余部分安排如下,在第二部分介绍稀疏神经网络模型,在第三部分验证稀疏神经网络变量选择的一致性,在第四部分爬取某团购平台重庆市火锅团购相关数据,通过对火锅半年销量、店铺信息、团购基本信息及使用规则数据建立稀疏神经网络模型,分析获取对火锅团购的销量最具有影响力的因素,为商户对于如何设计团购套餐以吸引更多顾客消费提供依据。
nlc202207081759
转载注明来源:https://www.xzbu.com/1/view-15435782.htm