您好, 访客   登录/注册

Python的计算机软件应用技术探讨

来源:用户上传      作者:张珩

  摘要:Python语言作为一种比较常用的计算机开发语言,已经广泛应用于实际编程工作中,从整体看,Python最为突出的特点就是简洁、类库,将其应用到平台开发中可以突显出极大的优势。本次研究主要以Python语言为主,分析了数据挖掘中的多种语言比较、Python下的数据爬取操作、基于Python的计算机软件应用技术以及基于Python的软件测试自动化平台的设计方案,希望可以为相关研究提供参考。
  关键词:Python;计算机软件;应用技术
  中图分类号:TP393      文献标识码:A
  文章编号:1009-3044(2020)32-0096-02
  随着我国科学技术的不断发展,尤其是在互联网普及的今天,计算机编程语言也在逐步增多。而Python作为一种高级脚本语言,其融合了解释性、编译性、互动性等语言,受到了人工智能领域的广泛应用,同时Python具备开源性、门槛低、可移植性强、资源库丰富等特点,在计算机领域已经成为非常常用的编程语言之一,其中也涉及了Web开发在内的多方面领域,Python语言都有着深入的应用。由此可见,本文对Python的计算机软件应用技术探讨,有着十分重要的意义。
  1数据挖掘中的多种语言比较
  从目前情况看,在计算机编程中会使用很多语言,较为常见的有PHP、Python、C++、Java等[1],这些语言都可以应用到数据挖掘中,但体现的优势有所不同,下面对此进行了简单比较。
  1.1 PHP语言
  PHP语言具有其独特的优势,主要体现在开发时间较少,并且需要的辅助资源不多,在支持性方面体现出了较大的优越性,但如果在网络爬虫程序编写时应用PHP语言,也会出现一些不足之处,比如采用PHP所编写的网络爬虫程序,在运行速度方面要较为缓慢,此种情况会降低用户使用时间,给用户体验造成不良影响。
  1.2 Java语言
  在数据挖掘中,通常会以网络爬虫的方式开展,其中部分技术人员就会采用Java语言编写网络爬虫,运用此种语言与Python语言相比较,在实际编写的网络爬虫过程中,Java会使用更多的程序语言,并且需要较大量的代码。可以说采用Java语言编写网络爬虫相对要复杂些,这种复杂性也会对后续使用造成严重影响[2],例如,如果客户需求发生变化,需要修改程序时,由于涉及的程序内容会出现较多的变动,对重写造成了严重影响。
  1.3 C++语言
  C++语言使用范围非常广泛,可以说,C++语言是C语言的延伸,在功能方面突显出了较强大性,但也存在一定的不足之处,正是由于其强大的语言功能,所以学习难度非常大,这就会导致由于难度过大所以需要花费较多的时间学习C++语言,同样的,将C++语言用于网络爬虫的开发,需要较长的编写时间,难以提高编写效率,所以在进行数据挖掘过程中,不建议采用使用C++语言编写网络爬虫。
  1.4 Python语言
  将Python语言应用到数据挖掘中,突显出了非常大的优势,使用Python来编写网络爬虫程序,在其程序上就非常简洁,并且代码量少,使得编写思路更加清晰,此外,可以在较为简短的代码中完成较多的操作,所以,在开发网络爬虫程序过程中,建议使用Python语言完成。
  2 Python下的数据爬取操作
  2.1工具配置
  通过浏览器插件Switchy0mega,将设置的代理打开,而后127.0.0.1:8888此端口,便可以作为用户使用的这台计算机的代理,所以通过127.0.0.1:8888这个端口操作的软件,都可以通过Fiddler实施拦截[3]。
  2.2 爬取TT桔子网的流程
  首先要打开Options对话框,而后在对话框中查找HTITPS,并对其勾选;接着找到右侧的Actions,并对其进行点击,选择对应的信任证书。最后点击Connections,并将Fiddller进行重启。找到浏览器,并在其中打开TT桔子网软件,而后通过使用代理对TT桔子网实施访问,此时会看到出现302错误的提示,这时则需要进一步了解右侧的HTTP协议,分析、总结,最终找到访问失败的原因。
  3基于Python的计算机软件应用技术
  Python语言突显出了极大的优势,将其利用到计算软件应用技术中,具体过程分析如下。
  3.1创建对应的文件
  在建立相应的文件夹时,可以根据scrapy-redis进行建设,在其中创建的文件夹可以分为三种,第一,主要是用来存储所设置的爬取规则;第二,將需要爬取的内容存放到文件夹中;第三,主要用于存储所爬取的内容。
  3.2 信息爬取过程分析
  综合分析信息爬取过程,具体表现为以下几个环节。
  3.2.1获取软件
  在获取软件中,可以先通过网络爬虫对数据URL实施搜索,而后将搜索到的数据与目标数据进行比较,从而进一步明确其中有效的URL,并将这些后有效的URL放入资源库中进行列队等候,而后取出URL,利用该地址搜索相应的网站以及网址,获取到其中的有关数据信息,并储存到本地资源中,在获取工作结束后,需要将使用之后的URL放入已使用的资源库中[4]。
  3.2.2存储所获得的信息
  在URL作用下,对于搜索到的网站,应当全面分析页面信息,并挑选出有价值的信息进行存储。计算机在正常使用过程中,对应的电脑内存都有限的,因此需要合理利用,秉持节约的原则,不能肆意占有内存,所以,非常有必要对获取到的信息实施全面筛选,不然会下载很多没有价值的信息,从而增加用户空间使用量,造成不必要的资源浪费。因此,应当检测获取到的信息,在最大范围内获取有用信息。此外,需要注意一点,如果在检索信息过程中,当大部分页面出现大面积的雷同、抄袭等情况,完全可以略过该页面。   3.2.3预处理过程
  通常情况下,预处理指的就是对所获取的信息进行初步处理,通过初步的处理单独提取出信息中的文字内容,剔除掉页面中的广告、无用的信息,能够完成对信息初期的简单处理。
  3.2.4分页检索能力
  在实际操作过程中,如果用户有request请求,那么能够实现对所获取的信息的排序、去重等操作,最终达到用户实际使用需求。
  4基于Python的软件测试自动化平台的设计方案
  通过上文对数据挖掘中的多种语言比较、数据爬取操作以及基于Python的计算机软件应用技术的分析,不难发现,Python语言在计算机软件实际应用中突显出了极大的优势,下文主要以软件测试自动化平台为例,具体分析了基于Python的软件测试自动化平台的设计方案。
  4.1软件测试
  所谓软件测试,指的就是对一个已经完成的软件系统实施功能测试,通过有效的测试,可以进一步检验软件的实际运行质量,也可以进一步提升其有效性。根据检测方法,分为手动和自动两种测试,其中的自动测试主要利用相应的测试程序对软件实施深入检测;而手动检测采用的是鼠标测试软件运行效果。无论是手动还是自动都在软件检测工作中发挥了重要作用,但相比于自动测试,手动测工作在技术方面还存在很多问题,再加上需要检测大量的内容,所以难免会出现问题和漏洞,此种方法对新人较为实用,但不利于提升员工责任心。但手动测试也具有一定的优势,其主要检测的软件业务逻辑,相比之下,自动测试则是检测软件的架构,在实际检测中需两者同时进行。
  4.2对于C#模块的设计
  在软件测试自动化平台构建过程中,涉及了对C#模块的设计,首先要知道C#模块包含了文件、执行、脚本编辑、实时信息共四个部分。其中的文件模块主要引用了using System.10,从而实现了可以创建并读取多种类型的文件,同时以更加方便地显示界面为用户提供服务,有利于用户保存。但需要注意的是,在控件使用过程中应当对“.Fi1ter”格式进行更改,调整成为“.txt”格式,以此种方式促使文件可以具备一定的通用性,同时还能够实现快速选择。当打开文件后,采用逐行读取数据模式对文件中的字符进行添加,通过此种方法的运用,可以在很大程度上减低字符串连接时的损耗。
  而执行模块的主要作用就是控制系统的运行,与此同时,能够满足将空间使用后生成的文件转化为“.txt”格式。对于脚本编辑模块,也涉及了3个空间。信息显示模块则涉及了2个控件,其一为TabContro,其二是TextBox,其中TabContro主要是在第2個分页发挥作用,TextBox则属于复合型控件,可以通过逻辑判断显示数据的输出情况。
  4.3 Python入口文件
  TestSuiteExecutor.py文件就是Pythone入口文件,其不执行工作指令,但可以为工作流当单引擎,简单说,可以理解为该入口文件只能初始化接收到数据参数,而后经过一定程序实施具体的工作。而Python的入口文件的主要任务是建立临时目录,同时进一步解析命令行的逻辑问题,还有就是清除临时路径以及执行工作流。其中临时目录主要指的是.py文件,而清除临时路径主要涉及了临时目录、子文件、文件夹等。
  4.4 工作流的具体设计分析
  基于Python的软件测试自动化平台,其工作流主要包含编译工作流、重启工作流、结果工作流、执行工作流、输出工作流五种。
  4.4.1重启工作流
  其主要流程为:先进入到临时文件中;而后将临时文件进行重新启动,在重启操作中会体现出相应选择,如果选择“否”,那么此工作流会立即结束,若选择“是”则工作流会继续执行操作;读取现场文件;读取后删除;工作流完成结束,在重启工作流中主要是对os.path包中的现场文件进行测试。
  4.4.2 编译工作流
  在编译工作流中,其执行流程为:接受参数和赋值的变化,查看每一个用例文件并对其中的Case实施测试,而后将测试后的Case储存到模板中,并以.py格式文件格式输出。
  4.4.3 执行工作流
  首先要接收参数和赋值的变化,而后发送cmd命令并控制编译器,对.py文件格式进行有效识别,并通过测试查看其异常情况,最后要输出运行结果文件。在发送cmd命令时需要利用os.system.进行调用。
  4.4.4结果工作流
  在结果工作流中,主要就是读取结果文件、以.xml格式对文件信息进行编译,而后添加.xm1节点到操作失败的字符中,最终以.xm1格式输出文件。
  4.4.5输出工作流
  读取.xm1文件并输出相应的数据,同时显示出没有成功输出的数据详细情况,而后显示每个用例的分析时间,最终输出各数据在实时信息显示模块。
  5结束语
  总之,通过本文的分析,可以更加清晰地分辨出多种语言在数据挖掘方面的优势于劣势。总的来说,在计算机实际应用中如果需要开展数据挖掘,一般情况会以网络爬虫的方法来进行,通过对Python语言在编写网络爬虫程序优势分析,不难发现其突显出的巨大优势,所以,大多情况都会将Python作为编写网络爬虫的首要语言。
  参考文献:
  [1] 胡正雨,刘文锐.Python的计算机软件应用技术研究[J].计算机产品与流通,2020,12(7):139-140,142.
  [2] 傅骏,傅馨竹,王欢,等.Python在应用型本科《传输原理》教学中应用实例[J].科学技术创新,2019(17):48-49.
  [3] 王学庆.基于Python的计算机软件应用技术研究[J].信息系统工程,2019(4):149-152,153.
  [4] 秦军.关于新时期计算机软件系统开发与应用技术的探讨[J].电脑迷,2017(12):117.
  【通联编辑:光文玲】
转载注明来源:https://www.xzbu.com/8/view-15377952.htm