大数据背景下线性代数课程改革初探
来源:用户上传
作者:
摘 要:本文主要研究大数据背景下线性代数课程改革,根据大数据对线性代数的要求,在线性代数课程改革建议如下:适当放宽学生对知识点的运算能力要求,让学生借助MATLAB等计算软件运算出计算结果;在线性代数教学过程中增加矩阵分解等内容,以适应大数据对线性代数的要求。
关键词:大数据 课程改革 线性代数 矩阵分解
大数据就是指在一定时间范围内无法使用传统数据库工具对其进行捕捉、管理、计算、分析和处理的数据集合。大数据主要有以下四个特性:数据容量大(Volume)、数据类型多(Variety)、数据存取速度快(Velocity)以及数据应用价值高(Value)。
在“互联网+”大数据背景下,许多实际应用场景的分析對象我们都可以抽象的用矩阵来表达。大量Web页面之间关系、微博用户之间关系、文本与词汇的关系等等都可以用矩阵表达。例如Web页面之间关系用矩阵表达时,可以用矩阵元素0和1来代表页面A与页面B的关系,0表示A和B之间没有超链接,1表示A和B之间有超链接。
一、大数据对线性代数课程的影响与要求
“互联网+”时代,信息以指数级速度增长,大数据的出现,虽然这为推荐技术带来了新的机遇,但同时也带来了新问题,如:大数据稀疏性问题。虽然用户和商品的数量巨大(这里的商品包括,网页、文献、音乐等信息数据),但是两个用户之间的选择相重叠的部分却非常小。如果用用户和商品之间已有的选择关系占所有可能存在的选择关系的比例来表示稀疏度,[1]如淘宝网上有10亿件商品,平均一个用户浏览1000件商品,则稀疏度为百万分之一。数据非常稀疏就会影响绝大多数基于关联分析的算法效果。一般数据规模越大,则越稀疏,因此处理稀疏数据的算法就非常重要。
大数据的技术开发与线性代数的知识关系非常密切,例如在大数据分析和建模中是常用的技术手段有:矩阵、转置、分块矩、矩阵的秩、正交矩阵、向量、向量空间、特征值和特征向量等。
以矩阵为基础的各种运算,例如矩阵分解则是分析对象特征、提取信息的途径,因为矩阵可以代表某种映射或变换,因此分解后所得到的矩阵就代表分析对象在新空间中的一些新特征。所以,矩阵的特征值分解、奇异值分解(SVD分解)、主成分分析(PCA分解)、矩阵分解(MF分解)、非负矩阵分解(NMF分解)等等在大数据分析中的具有广泛的应用。
二、线性代数课程改革建议
线性代数课程主要是围绕着行列式、矩阵、线性方程组这三大知识块,展开分析和讨论。根据大数据对线性代数的要求,在线性代数课程改革建议如下:
(1)针对分块矩阵、线性方程组、线性方程组解的结构、方阵对角化等需要大量计算内容,适当放宽学生对这些知识点的运算能力要求。用一些计算量小的典型算例替换原有复杂的算例,通过简单的算例让学生掌握知识点的原理;对于复杂的算例,让学生借助MATLAB等计算软件运算出计算结果,并要求学生给出计算软件中的执行命令。
(2)增添矩阵分解内容。矩阵分解作用很多:矩阵填充(通过矩阵分解来填充原有矩阵)、清理异常值与离群点、降维、压缩、间接的特征组合(计算特征件相似度)等等。在线性代数教学过程中增加矩阵的特征值分解、奇异值分解(SVD分解)、主成分分析(PCA分解)、矩阵分解(MF分解)、非负矩阵分解(NMF分解)等内容。
三、推广价值
本文主要研究大数据背景下线性代数课程改革,根据大数据对线性代数的要求,在线性代数课程改革建议如下:适当放宽学生对知识点的运算能力要求,让学生借助MATLAB等计算软件运算出计算结果;在线性代数教学过程中增加矩阵分解等内容,以适应大数据对线性代数的要求。该研究具体丰富的理论和实践价值。
参考文献
[1]林子雨.大数据技术原理与应用[M].北京,人民邮电出版社,2017,1-20.
[2]陈明.大数据核心技术与实用算法[M].北京,北京师范大学出版社,2017,36-37.
转载注明来源:https://www.xzbu.com/1/view-15110276.htm