基于UCB算法的信道选择方案

> 中国论文网 >
科技论文 >
基于UCB算法的信道选择方案

基于UCB算法的信道选择方案

来源:用户上传作者:张孙烜

　　摘要：物联网在设备中的应用导致了更多的网络交通堵塞，本地服务器无法满足大数据传输的需要。很难做到在大数据下的中央处理模式云计算。边缘计算的出现，将数据卸载到多个边缘服务器进行处理。卸载到服务器的数据需要通过信道，以前的信道选择方法是基站的统一分配。如果终端设备可以通过自己的学习选择信道，可以提高效率、减轻基站的负担。文章对此开展分析。
　　关键词：边缘计算;自我学习;信道选择
　　1 网络云计算介绍
　　走进5G时代，随之而来的是数据量的巨大增长。物联网在设备中的应用将导致更多的网络交通堵塞。本地计算处于本地环境，其内部资源在本地服务器上部署，而本地服务器显然无法满足大数据传输的需要。为了解决物联网系统的数据密度和场资源约束问题，很容易将目标转向云计算。网络云计算是指在与本地服务器连接的第三方服务器的大规模网络上进行数据处理[1]。但是，大数据下的中央处理模式很难做到，而且上传至云端的大量数据也有很大概率会被丢失和泄露，海量数据的增长使得设备维护成本极高。为了解决安全性和成本问题，一种名为“边缘计算”的新模式应运而生，其旨在缩短物联网通信的响应时间，将计算转移到网络的边缘[2-3]。边缘计算使应用程序生成更快的网络服务响应，以满足实时业务、安全和隐私保护等基本需求。
　　当终端设备需要处理大量的任务或数据时，为了减轻负担、加快数据处理速度、提高可靠性，可将数据卸载到多个边缘服务器进行处理。数据的指数增长给边缘设备和云处理集群[4]之间的网络连接带来了压力。边缘数据处理具有减少网络压力和缩短服务响应时间的潜力。随着边缘设备[5]性能的不断提高，这种边缘处理在今天成为可能。
　　从边缘计算中卸载到服务器的数据需要通过信道。大多数的信道选择方法是基站的统一分配，但是随着终端设备和数据的指数增长，基站的分配效率下降、成本升高。如果终端设备可以通过自我学习选择信道，就可以大大提高效率，减轻基站的负担。
　　2 信道选择的UCB算法
　　2.1 多臂老虎机模型
　　多臂老虎机（Multi-armed Bandit，MAB）是带有多个摇杆的赌博机，每个摇杆可以获得不同的收益。MAB问题讨论了如何选择摇杆来使收益最大化（摇杆收益给定）。假设这个老虎机有5个摇杆，最愚蠢的方法是每个摇杆都试几次，比较收益最大的摇杆，然后将剩余的机会都用于这个摇杆。但是，这种方法是不可靠的，因为如果你摇10次，由于存在运气因素，一个低收益的摇杆可能会造成一个高收益的幻觉。
　　本研究的目的是解决单用户信道选择的问题，使用户选择信道传输速率最高的信道。可以将用户选择的信道抽象成一个老虎机的每一个摇杆，待选信道的传输速率相当于每个摇杆获得的收益，摇杆的选择可以看成用户选择信道。使用置信区间上界（Upper Confidence Bounds，UCB）算法解决用户信道选择问题，可使用MAB模型进行讨论和研究。
　　2.2 UCB算法
　　使用UCB算法，重点不仅是收益的返回值，还是每个摇杆的探索次数。在实现UCB算法时，人们不需要考虑其他的假设，只要满足一个条件：收益分布在0和1之间，1代表最大收益。如果所使用模型的最大返回结果超出此范围，则需要对结果进行规范化。UCB算法除了保留每个摇杆结果的置信度外，与之前的算法有以下两点不同：
　　（1）在UCB中完全不使用随机性。在每种情况下，可以通过数据计算出UCB所选择的摇杆。
　　（2）UCB算法没有任何需要配置的参数，意味着可以在任何情况下使用UCB算法，而不需要任何必要的先决条件。
　　2.3 多臂老虎机模型实现信道选择
　　将老虎机的K个臂作为要选择的K个信道。
　　（1）阶段1：初始化。
　　（2）选择次数：t;每个信道被选择的次数为Tj，t;信道平均回报：;摇杆数量K=5。摇的总次数N=800;每个摇杆的收益ωk;Wn表示每輪的收益
　　（3）Tj，t=1。
　　（4）阶段2：决定。
　　（5）选择。
　　（6）记录最佳摇杆的选择次数ωmax;记录每轮的收益Wn。
　　（7）阶段3：学习。
　　（8）更新被选择的信道：
　　（9）直到t>N。
　　3 仿真结果
　　在模拟中，设置用户数为1，可选信道数为5，传输时隙为500。为每一个信道预设传输数据量为[1.1，1.2，1.3，1.4，1.5]，单位为Mb。仿真结果如图1所示。
　　从图1中可以看出，随着迭代次数的增加，UCB算法在信道选择中得到的平均数据传输量要高于随机信道选择，约为0.15 Mb。这是因为当通过UCB算法选择信道时，由于之前记录的置信度，其总是倾向于选择平均收益最高的通道。当采用随机算法选择信道时，与随机信道选择是等价的。因此，得到的平均值约等于预设传输的平均值。
　　4 结语
　　文章研究了基于UCB算法的信道选择问题。通过实验数据分析，得出UCB算法的信道选择优于随机算法的结论。
　　[参考文献]
　　[1]SIMMON E.A vision of cyber-physical cloud computing for smart networked systems[J].NISTIR，2013（8）：61.
　　[2]GONG X，GUO L，SHEN G，et al.Virtual network embedding for collaborative edge computing in optical-wireless networks[J].Journal of Lightwave Technology，2017（18）：3980-3990. 　　[3]ORSINI G，BADE D，LAMERSDORF W.Computing at the mobile edge：designing elastic android applications for computation of?oading[J].IFIP Wireless and Mobile Networking Conference，2015（8）：112-119.
　　[4]SHI W，DUSTDAR S.The promise of edge computing[J].Computer，2016（5）：78-81.
　　[5]LOGHIN D，RAMAPANTULU L，TEO Y M.On understanding time， energy and cost performance of wimpy heterogeneous systems for edge computing[J].IEEE International Conference on Edge Computing，2017（7）：1-8.
　　Channel selection scheme based on UCB algorithm
　　Zhang Sunxuan
　　（School of Electrical and Electronic Engineering， North China Electric Power University， Beijing 102206， China）
　　Abstract：The use of the Internet of Things in devices leads to more network traffic jams. The local server cannot meet the needs of big data transmission. The central processing mode under big data is difficult to achieve cloud computing. The emergence of edge computing， offloading data to multiple edge servers for processing. Data unloaded to the server needs to go through channels. The previous channel selection method is the unified allocation of base stations. If the terminal device can choose the channel through its own learning， it can improve the efficiency and reduce the burden of the base station. This paper analyzes it.
　　Key words：edge of computing; self-learning; channel selection
转载注明来源:https://www.xzbu.com/8/view-15176194.htm

查看更多→

基于UCB算法的信道选择方案

相关文章