Python的计算机软件应用技术探讨

> 中国论文网 >
科技论文 >
Python的计算机软件应用技术探讨

Python的计算机软件应用技术探讨

来源:用户上传作者:张珩

　　摘要：Python语言作为一种比较常用的计算机开发语言，已经广泛应用于实际编程工作中，从整体看，Python最为突出的特点就是简洁、类库，将其应用到平台开发中可以突显出极大的优势。本次研究主要以Python语言为主，分析了数据挖掘中的多种语言比较、Python下的数据爬取操作、基于Python的计算机软件应用技术以及基于Python的软件测试自动化平台的设计方案，希望可以为相关研究提供参考。
　　关键词：Python;计算机软件;应用技术
　　中图分类号：TP393 文献标识码：A
　　文章编号：1009-3044（2020）32-0096-02
　　随着我国科学技术的不断发展，尤其是在互联网普及的今天，计算机编程语言也在逐步增多。而Python作为一种高级脚本语言，其融合了解释性、编译性、互动性等语言，受到了人工智能领域的广泛应用，同时Python具备开源性、门槛低、可移植性强、资源库丰富等特点，在计算机领域已经成为非常常用的编程语言之一，其中也涉及了Web开发在内的多方面领域，Python语言都有着深入的应用。由此可见，本文对Python的计算机软件应用技术探讨，有着十分重要的意义。
　　1数据挖掘中的多种语言比较
　　从目前情况看，在计算机编程中会使用很多语言，较为常见的有PHP、Python、C++、Java等[1]，这些语言都可以应用到数据挖掘中，但体现的优势有所不同，下面对此进行了简单比较。
　　1.1 PHP语言
　　PHP语言具有其独特的优势，主要体现在开发时间较少，并且需要的辅助资源不多，在支持性方面体现出了较大的优越性，但如果在网络爬虫程序编写时应用PHP语言，也会出现一些不足之处，比如采用PHP所编写的网络爬虫程序，在运行速度方面要较为缓慢，此种情况会降低用户使用时间，给用户体验造成不良影响。
　　1.2 Java语言
　　在数据挖掘中，通常会以网络爬虫的方式开展，其中部分技术人员就会采用Java语言编写网络爬虫，运用此种语言与Python语言相比较，在实际编写的网络爬虫过程中，Java会使用更多的程序语言，并且需要较大量的代码。可以说采用Java语言编写网络爬虫相对要复杂些，这种复杂性也会对后续使用造成严重影响[2]，例如，如果客户需求发生变化，需要修改程序时，由于涉及的程序内容会出现较多的变动，对重写造成了严重影响。
　　1.3 C++语言
　　C++语言使用范围非常广泛，可以说，C++语言是C语言的延伸，在功能方面突显出了较强大性，但也存在一定的不足之处，正是由于其强大的语言功能，所以学习难度非常大，这就会导致由于难度过大所以需要花费较多的时间学习C++语言，同样的，将C++语言用于网络爬虫的开发，需要较长的编写时间，难以提高编写效率，所以在进行数据挖掘过程中，不建议采用使用C++语言编写网络爬虫。
　　1.4 Python语言
　　将Python语言应用到数据挖掘中，突显出了非常大的优势，使用Python来编写网络爬虫程序，在其程序上就非常简洁，并且代码量少，使得编写思路更加清晰，此外，可以在较为简短的代码中完成较多的操作，所以，在开发网络爬虫程序过程中，建议使用Python语言完成。
　　2 Python下的数据爬取操作
　　2.1工具配置
　　通过浏览器插件Switchy0mega，将设置的代理打开，而后127.0.0.1：8888此端口，便可以作为用户使用的这台计算机的代理，所以通过127.0.0.1：8888这个端口操作的软件，都可以通过Fiddler实施拦截[3]。
　　2.2 爬取TT桔子网的流程
　　首先要打开Options对话框，而后在对话框中查找HTITPS，并对其勾选;接着找到右侧的Actions，并对其进行点击，选择对应的信任证书。最后点击Connections，并将Fiddller进行重启。找到浏览器，并在其中打开TT桔子网软件，而后通过使用代理对TT桔子网实施访问，此时会看到出现302错误的提示，这时则需要进一步了解右侧的HTTP协议，分析、总结，最终找到访问失败的原因。
　　3基于Python的计算机软件应用技术
　　Python语言突显出了极大的优势，将其利用到计算软件应用技术中，具体过程分析如下。
　　3.1创建对应的文件
　　在建立相应的文件夹时，可以根据scrapy-redis进行建设，在其中创建的文件夹可以分为三种，第一，主要是用来存储所设置的爬取规则;第二，將需要爬取的内容存放到文件夹中;第三，主要用于存储所爬取的内容。
　　3.2 信息爬取过程分析
　　综合分析信息爬取过程，具体表现为以下几个环节。
　　3.2.1获取软件
　　在获取软件中，可以先通过网络爬虫对数据URL实施搜索，而后将搜索到的数据与目标数据进行比较，从而进一步明确其中有效的URL，并将这些后有效的URL放入资源库中进行列队等候，而后取出URL，利用该地址搜索相应的网站以及网址，获取到其中的有关数据信息，并储存到本地资源中，在获取工作结束后，需要将使用之后的URL放入已使用的资源库中[4]。
　　3.2.2存储所获得的信息
　　在URL作用下，对于搜索到的网站，应当全面分析页面信息，并挑选出有价值的信息进行存储。计算机在正常使用过程中，对应的电脑内存都有限的，因此需要合理利用，秉持节约的原则，不能肆意占有内存，所以，非常有必要对获取到的信息实施全面筛选，不然会下载很多没有价值的信息，从而增加用户空间使用量，造成不必要的资源浪费。因此，应当检测获取到的信息，在最大范围内获取有用信息。此外，需要注意一点，如果在检索信息过程中，当大部分页面出现大面积的雷同、抄袭等情况，完全可以略过该页面。　　3.2.3预处理过程
　　通常情况下，预处理指的就是对所获取的信息进行初步处理，通过初步的处理单独提取出信息中的文字内容，剔除掉页面中的广告、无用的信息，能够完成对信息初期的简单处理。
　　3.2.4分页检索能力
　　在实际操作过程中，如果用户有request请求，那么能够实现对所获取的信息的排序、去重等操作，最终达到用户实际使用需求。
　　4基于Python的软件测试自动化平台的设计方案
　　通过上文对数据挖掘中的多种语言比较、数据爬取操作以及基于Python的计算机软件应用技术的分析，不难发现，Python语言在计算机软件实际应用中突显出了极大的优势，下文主要以软件测试自动化平台为例，具体分析了基于Python的软件测试自动化平台的设计方案。
　　4.1软件测试
　　所谓软件测试，指的就是对一个已经完成的软件系统实施功能测试，通过有效的测试，可以进一步检验软件的实际运行质量，也可以进一步提升其有效性。根据检测方法，分为手动和自动两种测试，其中的自动测试主要利用相应的测试程序对软件实施深入检测;而手动检测采用的是鼠标测试软件运行效果。无论是手动还是自动都在软件检测工作中发挥了重要作用，但相比于自动测试，手动测工作在技术方面还存在很多问题，再加上需要检测大量的内容，所以难免会出现问题和漏洞，此种方法对新人较为实用，但不利于提升员工责任心。但手动测试也具有一定的优势，其主要检测的软件业务逻辑，相比之下，自动测试则是检测软件的架构，在实际检测中需两者同时进行。
　　4.2对于C#模块的设计
　　在软件测试自动化平台构建过程中，涉及了对C#模块的设计，首先要知道C#模块包含了文件、执行、脚本编辑、实时信息共四个部分。其中的文件模块主要引用了using System.10，从而实现了可以创建并读取多种类型的文件，同时以更加方便地显示界面为用户提供服务，有利于用户保存。但需要注意的是，在控件使用过程中应当对“.Fi1ter”格式进行更改，调整成为“.txt”格式，以此种方式促使文件可以具备一定的通用性，同时还能够实现快速选择。当打开文件后，采用逐行读取数据模式对文件中的字符进行添加，通过此种方法的运用，可以在很大程度上减低字符串连接时的损耗。
　　而执行模块的主要作用就是控制系统的运行，与此同时，能够满足将空间使用后生成的文件转化为“.txt”格式。对于脚本编辑模块，也涉及了3个空间。信息显示模块则涉及了2个控件，其一为TabContro，其二是TextBox，其中TabContro主要是在第2個分页发挥作用，TextBox则属于复合型控件，可以通过逻辑判断显示数据的输出情况。
　　4.3 Python入口文件
　　TestSuiteExecutor.py文件就是Pythone入口文件，其不执行工作指令，但可以为工作流当单引擎，简单说，可以理解为该入口文件只能初始化接收到数据参数，而后经过一定程序实施具体的工作。而Python的入口文件的主要任务是建立临时目录，同时进一步解析命令行的逻辑问题，还有就是清除临时路径以及执行工作流。其中临时目录主要指的是.py文件，而清除临时路径主要涉及了临时目录、子文件、文件夹等。
　　4.4 工作流的具体设计分析
　　基于Python的软件测试自动化平台，其工作流主要包含编译工作流、重启工作流、结果工作流、执行工作流、输出工作流五种。
　　4.4.1重启工作流
　　其主要流程为：先进入到临时文件中;而后将临时文件进行重新启动，在重启操作中会体现出相应选择，如果选择“否”，那么此工作流会立即结束，若选择“是”则工作流会继续执行操作;读取现场文件;读取后删除;工作流完成结束，在重启工作流中主要是对os.path包中的现场文件进行测试。
　　4.4.2 编译工作流
　　在编译工作流中，其执行流程为：接受参数和赋值的变化，查看每一个用例文件并对其中的Case实施测试，而后将测试后的Case储存到模板中，并以.py格式文件格式输出。
　　4.4.3 执行工作流
　　首先要接收参数和赋值的变化，而后发送cmd命令并控制编译器，对.py文件格式进行有效识别，并通过测试查看其异常情况，最后要输出运行结果文件。在发送cmd命令时需要利用os.system.进行调用。
　　4.4.4结果工作流
　　在结果工作流中，主要就是读取结果文件、以.xml格式对文件信息进行编译，而后添加.xm1节点到操作失败的字符中，最终以.xm1格式输出文件。
　　4.4.5输出工作流
　　读取.xm1文件并输出相应的数据，同时显示出没有成功输出的数据详细情况，而后显示每个用例的分析时间，最终输出各数据在实时信息显示模块。
　　5结束语
　　总之，通过本文的分析，可以更加清晰地分辨出多种语言在数据挖掘方面的优势于劣势。总的来说，在计算机实际应用中如果需要开展数据挖掘，一般情况会以网络爬虫的方法来进行，通过对Python语言在编写网络爬虫程序优势分析，不难发现其突显出的巨大优势，所以，大多情况都会将Python作为编写网络爬虫的首要语言。
　　参考文献：
　　[1] 胡正雨，刘文锐.Python的计算机软件应用技术研究[J].计算机产品与流通，2020，12（7）：139-140，142.
　　[2] 傅骏，傅馨竹，王欢，等.Python在应用型本科《传输原理》教学中应用实例[J].科学技术创新，2019（17）：48-49.
　　[3] 王学庆.基于Python的计算机软件应用技术研究[J].信息系统工程，2019（4）：149-152，153.
　　[4] 秦军.关于新时期计算机软件系统开发与应用技术的探讨[J].电脑迷，2017（12）：117.
　　【通联编辑：光文玲】
转载注明来源:https://www.xzbu.com/8/view-15377952.htm

查看更多→

Python的计算机软件应用技术探讨

相关文章