RFID数据挖掘开启智能新时代
来源:用户上传
作者:
【摘要】本文从物联网的发展角度,对RFID数据挖掘进行了研究和介绍。先介绍了RFID数据挖掘的基本概念和技术,又从未来发展上进行了阐述和展望。
【关键词】物联网;RFID技术;数据挖掘技术;智能化
进入到2011年,随着物联网概念的引入,以及RFID技术的推广和普及,一个新的理念悄然走入到社会经济大潮中,这就是基于RFID的海量数据挖掘技术。
什么是数据挖掘?数据挖掘(Data Mining),就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。用通俗的话说就是从存储下来的大量数据中通过具体的挖掘方法来建立模型,进而实现分类、估计、预测、聚类等目的。数据挖掘过程包括数据的抽取、数据的存储和管理、数据的处理和展现。这个过程就是将分散的没有规律的数据集合起来,通过具体处理最终展现给我们一个有规律的能够对未来进行预测的可视化的结果。在今天,数据挖掘技术已经有了很长的一段发展时间,传统数据挖掘技术已经很成熟,智能支持系统的功能也已经发展的很完善,而我们进入新时代就又要求我们要不断改进和发展新的数据挖掘技术来适应社会的发展。
那什么又是RFID?射频识别(Radio Frequency Identification,RFID)是基于电磁信号检测的无线传感技术,利用无线射频方式进行非接触的双向通信,已达到识别移动物体的目的。射频识别技术与传统识别技术相比。具有无接触、能穿透非金属介质、识别距离大、精度高以及信息收集处理快捷等优点。更重要的是EPC编码将基于RFID技术实现商品的全球统一编码,这就将商品在此时此地唯一的区分标识了,换句话说,就是对某一商品进行实时的跟踪,将其唯一的状态实时的发回反映出来,实现全球供应链的智能化统一管理。
RFID技术在全球供应链中的应用就带来一个巨大的问题,由于RFID返回的数据是针对某一商品的实时信息,这就必将使返回的数据带有数据量庞大和冗余量庞大的特点,虽然我们得到的数据很多,但是将大量的干扰数据排除,从中提取有用的信息就将是我们迫在眉睫,也是我们必须去做的事情,这就是未来数据挖掘的发展趋势―RFID数据挖掘。
我们知道在物联网环境中,EPC编码将基于RFID技术,实现全球商品的统一编码,以便更好的实现商品的管理,由此产生的RFID数据还是具有一定的特点的。首先海量:在商业领域中,货物流动非常频繁,每样货物附着的标签都将自己的信息传递给流通路径上遇到的所有阅读器,这样产生的数据量是非常惊人的。其次冗余:阅读器不间断的向周围发送射频信号,而不同阅读器的工作范围可能发生重叠,因此,RFID数据会出现两种冗余情况,时间冗余和空间冗余。时间冗余是指标签长期处于某一阅读器工作范围内时,会多次向阅读器发送自己的信息。空间冗余是指标签处于多个阅读器工作范围内时,会向每一个阅读器都发送自己的信息。由于阅读器的阅读周期相对于标签的停留时间非常短,而一个大型货物中转站安放的阅读器数量又很多,工作范围重叠不可避免,因此数据冗余造成的影响是巨大的。连续:阅读器的阅读周期固定,并且相对于标签的停留时间非常短,因此,RFID数据将按照时间序列保持连续性。这种连续性在数据挖掘中可能有一定的利用价值。分散:在现实世界中,货物的流通范围非常广。中国生产的衣服可以销往欧洲,南非出产的钻石可以卖到北美,因此,RFID数据在地理上是非常分散的。
这些RFID数据特点就给我们进行数据挖掘带来了新的困难和挑战。传统的数据挖掘方法对于RFID数据显得力不从心,而对于RFID数据挖掘又是我们今后不可绕开的课题,这就让我们不得不探索新的挖掘方法以便适应其发展。在这方面中外学者已经着手在探索,并且已经有了一些可喜的成果,总的说来是在数据清理,数据归纳,挖掘模型上进行了新的探索和改进,以便适应RFID数据的特点进行挖掘。第一数据清理:数据清理的主要目的是填补遗漏数据、清除噪音以及纠正数据间的不一致,由于RFID在数据量和数据冗余上都是巨大的,所以数据清理工作就显得尤为重要,而同时RFID数据的连续特点,单个错误数据所携带的信息并不十分重要。并且在后续的数据归约步骤中,数据将在较高层次抽象。因此,传统数据挖掘清理方法性能很差。对于RFID数据来说。忽略错误数据元组不失为一个高效且几乎无损的方法。第二数据归纳:数据归纳主要是要将数据进行方聚集、维归约和数据压缩,以便减少数据量降低挖掘规模,这点对于海量的RFID数据来说也是尤为重要。第三数据挖掘模型:传统的数据挖掘模型已经广为流传,但对于实时性和地域变化十分突出的RFID数据来说,传统模型并不太适合,所以学者们就在传统的挖掘模型上进行了改进,建立多维数据立方体来解决这个问题。
在今天,我们说一个技术光有理论是没有任何价值的,而RFID数据挖掘为什么能开启一个新的时代呢,我们来看它的应用。2009年“物联网”风暴夹杂着一团迷雾凶猛来袭。一时间,世界各地都为这个十年前才提出的概念疯狂着迷。2009年8月中国提出了“感知中国”概念,2009年11月物联网产业被列入国家五大新兴产业之一。美国总统奥巴马就职后不久.即在和工商领袖举行的圆桌会议上提出了“智慧的地球”的概念.对专家们建议的“美国要形成智慧型的基础设施”,奥巴马政府给予了积极的回应。目前,业内人士普遍认为,物联网将是继互联网之后.世界信息产业的第三次浪潮,是下一个万亿级的信息技术产业。那什么是物联网呢?简单来说,就是物的智能化带动物之间的智能联系。举个例子,如果我们从超市买了一个冰箱,在将来这台冰箱就将是物联的充分体现,它会自己根据主人的冷藏习惯来发现其内的缺货,从而实现智能的采购。再比如空调能够根据主人的生活习惯自动变频,或者在主人进门后自动打开等等。这些只是简单的例子,真正物联应用更多是在供应链上。在国外,智能超市、智能仓储可能已经走出了实验室得到了实际的应用。全球最大的零售商―沃尔玛在这个领域已经开始应用RFID技术实现了一部分的超市智能化,比如缺货的自动跟踪等等,将物联的概念已经得到了体现。而真正的智能超市在实验室中也已经成熟了。想象我们身处超市中,超市中没有营业员,我们只需要推着购物车,购物车面板就会提示我们如何到我们需要的商品跟前,而每到一个商品跟前,面板上就会清晰的出现商品的全部信息。而且对于我们的购物习惯进行分类挖掘后,我们再次来到超市时会给我们进行友情提示,直接告诉我们可能需要的商品的具体信息,而我们不在超市时可能会通过短信提示我们可能需要的商品的打折和更新等信息等等。在我们的国内,智能交通也已经走入了我们的生活,红绿灯的智能化我们已经可以做到了。红绿灯通过埋在地下的传感器返回的交通车辆数据,对这些数据进行分析挖掘后,得出各个方向上的交通状况,在根据交通车辆状况智能改变红绿灯长,实现红绿灯的智能变频。在未来的智能时代中,物与物之间的关联会越来越紧密,智能识别技术会越来越广泛的应用,可能我们身边每事每物都会智能化,而智能化的实现就是要基于数据挖掘--要从广泛的数据中分类找出规律关联从而得出我们所需要的信息,来实现智能化。新时代的又一次科技革命即将就是智能化的革命,与20世纪发明计算机一样,21世纪必将实现物的智能,物的智能将更好的体现人的智能,所以数据挖掘肯定是要更加受到人们的重视,从基于RFID射频识别技术获取的数据中挖掘出我们所需要的信息肯定是我们实现智能化的第一步,也是必将开启新时代的一把钥匙。
在现在,我们的身边通过挖掘实现的智能化可能还很少,对于真正的智能化我们还只能通过想象来认知,可是这就像中国这几十年的发展一样,速度可能没有人能够想到。也许在五年或者十年之后,物联网就会真正的进入我们生活的方方面面,智能化就会给我们带来不可想象的便利,到那时RFID数据挖掘才真正开启了一个新的智能时代。
参考文献:
[1]赵卫东.RFID数据挖掘的发展[J].石油石化物资采购,2010.
[2]林仲达,严欣结.面向RFID海量数据的数据挖掘研究[J].电脑知识与技术,2010,06(19).
[3]马骋超.数据挖掘:“勘探”智慧的方法[J].上海信息化,2010(4).
作者简介:王鑫旭(1986―),男,北京人,硕士,现就读于首都经济贸易大学,研究方向:电子商务与网络安全。
转载注明来源:https://www.xzbu.com/2/view-531063.htm