您好, 访客   登录/注册

基于Python的训练集数据标注修改方法研究

来源:用户上传      作者:田红梅 周皎  袁志杰  曲桢

  摘   要:现如今我们的计算机技术得到了显著的发展,在大数据以及人工智能技术的应用下,计算机已经能够对视觉识别的方法进行有效而又深度的学习。面对海量的数据处理人工处理的方式费时费力,而计算机处理却往往能够做到事半功倍。然而现如今即使有了大数据以及人工智能技术的应用,但当面临巨大的信息数据时,计算机的深度学习功能也很难发挥其效用。计算机在对信息进行深度学习的识别过程中,难免会因为程序的偏差而导致数据识别的错误,从而让计算机所作出的处理结果与实际结果产生偏差。在这种情况下,基于Python的训练集数据标注修改方法能够发挥很大的效用,通过Python语言进行标注能够高效、稳定的识别出数据,其具有广阔的应用前景。本文便浅析基于Python的训练集数据标注修改方法研究。
  关键词:标注修改  Python  深度学习
  中图分类号:TP311                                 文献标识码:A                        文章编号:1674-098X(2020)02(a)-0208-02
  随着时代的不断发展,现如今计算机技术已经覆盖了我们生活的方方面面。在大数据以及人工智能的应用下,计算机已经能够进行深入学习,并且具备了一定的数据处理能力。但是当面临海量信息的处理时,现有的计算机技术还有一个学习提高的过程。建立完善训练集数据是为了帮助计算能够更好的识别事物,引导计算机能够更加精确的识别事物的手段。通过训练集数据能够让计算机在反复识别汇总,提升识别的效率精度,做到更加有效的标注。而在计算机识别的过程当中在深度学习的起步阶段,容易造成数据识别的错误,利用标注软件进行编写能够纠正计算机的这种错误。基于Python的训练集数据标注修改方法是一种稳定的语言标注软件编写方法,能够给计算机深度学习带来准确的标注数据。
  1  Python概述
  Python是一种跨平台的语言程序,现如今被广泛应用在人工智能、软件开发、游戏开发和互联网开发当中。随着近些年,Python版本的优化升级,已经有越来越多的用户选择使用Python。相较于其他语言而言Python语言更加简洁,语言学习周期短,其能具备更拓展性。在Python设计之初,设计者就秉持着“优雅”、“明确”、“简单”的设计理念。Python语言具有众多的有点,其拥有同C++语言一样的可移植性能,但是逻辑构成上要比C++语言简单,这就造成其学习周期要明显快于C++语言。简单易学是Python的主要特征,作为使用者阅读Python程序十分简单,容易上手。而python另一大特性就是开源,由于开放的源代码,致使使用者可以随心所欲的阅读复制,让这种资源能够得到共享,这种免费开源的方式为期吸引了一批忠实的用户,为Python的壮大发展奠定了基础。此外,Python运行速度快,因为其底层语言是通过C语言所编写,因此其兼顾了C语言运行速度快的特性。
  2  各种标注软件的标注修改方法及其特点
  现如今标注修改软件主要是基于C++与Java进行编写。C++语言由于语言构成复杂,造成虽然利用C++语言编写程序能够具备很高的逻辑性,且语言表达能力较强,但是语言学习周期长,开发时间久。利用C++语言进行宏操作,代码的可读性较差。虽然目前在语言的使用上C++语言的使用较为普遍,但是在具体在计算机识别的标注修改方面C++语言所编写的程序可读性差,不利于对计算机的识别修改的操控。而另一种较为普遍的语言便是Java,Java是在C++的基礎上发展而来,其保留了C++的许多内容,在语言逻辑上也有部分内容类似于C++。但是在句法构成当中,Java的句法更加简练清晰,在语言学习当中Java更加容易学习。Java有Swing、SWT和AWT三种工具集。Swing与SWT这种两种工具集能够识别图片与非图片文件,但是在实际编写过程当中代码编写效率低,且可移植性较差。而AWT工具集因为占用的内存较少,能够在移动或者嵌入式设备当中发挥加大的优势。但是在具体的计算机识别的标注修改方面AWT工具集模式不能够支持图片,无法为图片进行修改标注,这就造成了标注识别中的识别问题。最后便是Python语言,它是一种跨平台的计算机程序设计语言,近些年来随着Python语言的不断优化更新,如今的这种语言的使用人数已经呈现出爆发式的增长。将其使用在计算机标注修改中能够提升计算机深度学习的识别程度,提升识别标注的效率。就其语言自身而言,Python编写更加方便阅读、修改与扩展,且具备不亚于C++语言的可移植性能,代码能够实现开源。总而言之,基于Python的训练集数据标注修改方法能够实现语言编写的简单便捷,为计算机的标注修改提供保障。
  3  基于Python的训练集数据标注修改方法
  基于Python的训练集数据标注修改能够实现计算机深度学习的识别率,保证计算机识别标注的顺利运行。在Python的训集数据中主要分为初始化、建立主窗口、关节点显示、按键操作与保存图像几个步骤。
  3.1 初始化
  在Python中想要做到初始化,需要使用其中的init函数来进行操作,该函数能够包含各种关键变量。使用者需要通过在清除画布时将这个函数关节点参数全部清零的方式来设置初始化。
  3.2 建立主窗口
  主窗口是进行Python语言操作的基础,因此在使用Python需要先搭建好相应的主窗口,其实Python的默认图形界面。一般而言,在主窗口的搭建上,通常会采用tkinter模块来进行搭建。Tkinter库能够为搭建主窗口提供更加多样性的选择,丰富设计人员的设计需求。   3.3 关节点显示
  关节点的格式在计算机中显示为json。在关节点中显示上,图片可以利用PIL与tkinter模块来进行表达,这两个模块能够提供更为方便的图形处理。然而图片在计算机中表达为bmp,这种格式在tkinter模块中没有办法显示,因此需要通过Pil模块加以转换,在此之后方能够正常显示。关节点的显示是一种非常复杂的工作,需要通过逐步确定json格式的坐标并融入相应算法得以实现。通过json模块来实现相应数据的读取,并实现对关节点的模拟,最终通过tkinter模块对关节点进行绘制。
  3.4 按键操作
  在Python应用中按键操作总共分为四个部分,即录入、返回、清除和撤销。当标注内容跟我们要求相同时我们直接执行保存录入操作。如果在操作中,因为设计步骤失误需要返回上一步,则可以单击返回。如果在设计过程中,编辑文件整体不符合要求则可以单击清楚按钮。如果关节点出现错误,需要重新开始操作则可以选择撤销。
  3.5 保存图像
  当设计进入关键步骤或者设计完毕时,可以使用os模块的save来进行保存。在关节点信息的储存中,可以通过使用os模块的open方法,运用W+为其写入新的json数据。
  4  结语
  综上所述,Python的标注方法相较于其他语言编辑来说具有一定的优势。近些年来Python使用率呈现出了爆发式的增长,而在实际标注工作中,通过对Python被曝光桂云增加标注的识别度与准确人。基于Python的标注方法,实现了更加直观的训练集数据重新标注,让计算机深度学习的目的得以实现。本文分析了各種标注修改语言之间的特点,并着重介绍了Python在训练集数据标注中优势,其能够简化编写的步骤,降低编写难度低,且在编写当中扩展性较强,加之开源的模式更加具备开放性与兼容性。通过Python的标注方式让计算机更加智能,能够真正实现计算机深度学习的效果。笔者相信,在不久的将来,随着Python技术的更加成熟,其在训练集数据标注修改的应用一定会更加优化,未来一定会有更加广阔的应用价值。
  参考文献
  [1] 张文帅.基于Python的农副产品销售数据分析应用[D].浙江海洋大学,2019.
  [2] 刘承林.计算思维培养视角下高中Python课程教学模式研究[D].山东师范大学,2019.
  [3] 李建飞.基于Python的代理模型优化平台设计及应用[D].大连理工大学,2019.
转载注明来源:https://www.xzbu.com/1/view-15215461.htm