基于MATLAB的大数据分析
来源:用户上传
作者:
摘要:传统计算机模式与MATLAB软件技术相比较,传统软件运行起来较为复杂。以此基于MATLAB软件下的网络数据技术,它以高速化、关联化的优势成为人们眼中的焦点。本文针对传统网络软件模式中出现的问题,对基于MATLAB大数据技术进行探究。
关键词:MALAB软件;网络媒体;大数据;技术研究
中图分类号:TP332 文献标识码:A 文章编号:1007-9416(2019)12-0212-02
现今,利用数据的完整性、相关性、多样性实现对公共安全、社会管理等领域的大数据应用研究非常流行。大数据与云计算的出现,使很多的事成为可能。
1 MATLAB数据处理
数据聚类分析的形式,是网络媒体中大数据技术的重要表现之一。整个过程非常合理、井然有序。数据统计方法不仅有效,在地区空间中也可以重建网络媒体平台。面对非结构化和散射数据,MATLAB软件进入高速运行状态。
在媒體网络的大规模数据技术管理下,大规模信息的特征在matlab系统中被显示。在曲线变化的过程中,可以看清哪些值是典型的,它们经常有伴随波动非常大的图像。这正好说明了这些数据与其他数据具有较大的差异,同时还会影响决策者作出正确的判断。由于在MATLAB系统中可以使用奇偶校验和R乘指数的计算方法来获得标准值,然后将参数进行比较,因此能使人们更好地理解偏差。
2 数据降维与矩阵分解算法
次元缩小是许多领域中最重要的研究领域之一。有很多次元缩小的方法。根据三维缩小的不同方法,生成了基于kohonen自我组织化特征图(sofm)、主分量分析(p-ca)、多维缩放(md)等许多集群化法。此外,还有基于分形维缩小的特殊维缩小聚合法。
SOFM的缺点是不提供用于评估从高维到低维的变换的优点和缺点的特定标准。另外,相对于高维数据,神经网络学习过程的收敛性非常慢。主成分分析也是广泛使用的次元缩小法之一。对于含有n m维数据的数据集,pca法首先计算mxm次数的共分散矩阵,计算表示原始数据的主要特征矩阵的k支配固有向量。由此,能够将原始高维数据投影到由k固有向量表示的方向。投影后的数据具有相对低的维度,因此可以使用常规聚集算法进行聚集处理。
PCA提供了一些用于确定上述K值的方法,但由于不同的方法所确定的k值大不相同,因此很难找到正确的适当的k值。K如果值太小,原始数据的重要特征就会丢失。P-CA的另一个缺点是空间复杂度为0(M 2),其复杂度取决于固有值的数目,且其大于0(M 2)的值。为了将p c a成熟的想法应用到非线性维缩小领域,一些研究人员通过扩展线性p c a生成了内核p c a。
多维定标也是将高维数据映射到低维空间的方法。映射过程保持数据点之间的差异(或类似性)。即在点远离时,与原始数据集合中的每一者相近的点还接近。这种算法的基本出发点是数据点之间的类似性(或差异)描述。缩小三维的目的是搜索保持数据集合的关心特性的低维数据集合,通过分析低维数据来确定对应的高维数据特性,并获得数据的有效特征以便简化解析,并可视化数据。基于分形的次元缩小是近年来备受瞩目的一种方法。利用分形理论,首先能够准确估计数据的固有维度,并提供进一步缩小维度的指导。与估计固有值的其他方法不同,基于片假名的方法可以获得非整数值即片假名维度的固有值,如图1所示。
2.1 矩阵分解算法
矩阵分解,顾名思义,就是将矩阵分解为若干个矩阵组合的形式,这样的办法能够解决许多线性代数和计算数学问题。矩阵分解主要有两种形式,一个是将矩阵分解为若干个矩阵和的形式,另外是将矩阵分解为若干个矩阵积的形式。矩阵分解为和形式的中心思想是构造,定性构造出抽象的具体表达式。
定理1:任何一个n阶矩阵A,都能唯一的表示为一个对称矩阵和一个反对称矩阵之和。
证明:存在性证明。
设A为n阶矩阵,令B=(A+AT),C=(A-AT),则
BT=[(A+AT)]T=(AT+A)=(A+AT)=B,
CT=[(A-AT)]T=(AT-A)=-(A-AT)=-C,易知B为对称矩阵,C为反对称矩阵,且A=B+C。
唯一性证明。
若还有对称矩阵B1以及反对称矩阵C1,使A=B1+C1,则B1-B=C-C1,而B1-B为对称矩阵,C-C1为反对称矩阵,故B1-B=0=C-C1,即B1=B,C=C1则证明了唯一性。
2.2 矩阵中元素的操作
(1)矩阵A的行R:A(R:)、矩阵A的列R:A(:R)。(2)依次取出A的各列,将A伸展到A列。(3)取矩阵A的行i~i 2和列ji~j 2,形成新的矩阵。(4)通过逆矩阵提取矩阵A的行i到i 2,形成新的矩阵。(5)以逆矩阵提取矩阵A的j~j 2列,形成新的矩阵。(6)删除A的行i到i 2以创建新矩阵。(7)删除a的j-j列以形成新矩阵。(8)将标色矩阵A和B设置为新矩阵。
2.3 标量矩阵运算
矩阵运算:数组相加:A+B;矩阵乘法:A*B。
矩阵公式:det(a);矩阵的逆矩阵:inv(a)。
3 结语
通过数学与应用数学、信息计算相结合的方法可对大规模数据的生成、预处理、解析、可视化进行研究。通过MATLAB软件,使数据解析和信息计算理论相结合,以便对大规模数据的存储、解析、分类进行研究。使用矩阵分解可以实现数据主成分分析和数据预测。
参考文献
[1] Overschee P V,Moor B D.Subspace Identification for Linear Systems[M].Springer US,2016.
[2] 梅健强.基于线性子空间方法的人脸识别技术[D].天津大学,2017. [3] Ramage D,Hall D,Nallapati R,et al.Labeled LDA:A supervised topic model for credit attribution in multi-labeled corpora[J].Proc Emnlp,2018,1:248-256.
[4] 孫权森,曾生根,王平安,等.典型相关分析的理论及其在特征融合中的应用[J].计算机学报,2015,28(9):1524-1533.
[5] Li Y O,Adali T,Wang W,et al.Joint Blind Source Separation by Multiset Canonical Correlation Analysis[J].IEEE Transactions on Signal Processing,2019,57(10):3918-3929.
Big Data Analysis Based on MATLAB
WANG Mei
(School of Computer Science,Guangdong University of Technology,Guangzhou Guangdong 511495)
Abstract:Compared with MATLAB software technology, the traditional computer model runs more complex. Based on the network data technology of MATLAB software, it becomes the focus of people's eyes with the advantages of high speed and relevance. Aiming at the problems in the traditional network software mode, this paper explores the big data technology based on MATLAB.
Key words:MALAB software; network media; big data; technical research
转载注明来源:https://www.xzbu.com/8/view-15141072.htm