您好, 访客   登录/注册

浅谈基于人工智能的语音输入

来源:用户上传      作者:朱天健

  摘  要:人工智能的快速发展,与此同时带来了语音输入的发展,随着两者的互相推动下,人工智能出现了增长缓慢的态势。同时,近年来,中国的人工智能和语音输入快速发展,已处在了世界领先的地位。但是,随之而来的是大量的不得不面对的困境。为此,我选择了通过分析国内人工智能和语音输入领导者,科大讯飞。以寻找解决问题的可行方案,以及未来的发展方向。
  关键词:人工智能  语音输入  科大讯飞
  中图分类号:TP183    文献标识码:A 文章编号:1672-3791(2019)09(b)-0016-02
  随着时代的发展,人工智能已经进入了我们的生活。在不知不觉中,人们的生活方式开始发生了转变,QQ、微信、支付宝等已经成为了我们生活中不可或缺的一部分。然而,在使用种种软件时,我们都不可避免的会用到输入法。但是又一个问题随之到来,我国有超过五千万的老人在使用这些软件,他们可能不会拼音,甚至不识字,那怎样才能帮助老年人输入自己所想的信息呢?语音输入,成为了必不可少的软件。由此可见,语音交互在未来必然与人们的生活息息相关。
  1  语音输入的到来
  当人工智能发展的如火如荼之时,相较之下,语音输入更加显得默默无闻。甚至可以说是,极少出现在人们的视野中。就目前来说,哪怕是最火爆,受众面最广的输入软件,其语音输入的使用率甚至不足一半。但是,不用打字,不需要会拼音,也不需要会五笔,在如此优越的条件下,使用语音输入的人依旧是寥寥无几。作为一个新事物,想发展就必须要找出自身的不足之处,并将其弥补。那么,语音输入想要拥有更高的使用率就必须去探寻原因。对此,我做出了自己的以下几点假设。
  首先,当我们使用语音录入的时候,我们需要周边环境的安静,但即使在这样的条件下依然很难保证输入内容的准确性。
  其次,我们利用语音输入的内容在出现明显错误时,你很难中途停下来对其进行改正。
  最后,也是我个人认为最重要的一点,就是语音输入的私密性难以保证。当你在人群之中时,你的输入内容就会被大众所知,难以保证个人的隐私。
  2  优势——以科大讯飞为例
  在面对种种困难时,让我们来看看行业的领军者——科大讯飞又是如何去做的呢?在国内,以科大讯飞为首的语音公司投入大量的人力,物力,来寻找解决问题的方法。比如说科大讯飞就是国内目前为止,也是唯一一家投入的科研资金超过总收入的25%的公司。面对着行业内外的重重危机,科大讯飞既没有像谷歌一样大肆收购或并购顶尖公司,以此保证自身走在行业的领军水平;也没有像百度等其他的大公司一样与国外的科研机构展开合作,成立各式各样的实验室、研究所。相反,科大讯飞始终坚信自己的力量,成立了独属于自己的科大讯飞实验室。同时,科大讯飞集中所有力量,研发构建讯飞超脑,希望让机器可以从能听会说,逐步转变为能理解会思考,以此来研发基于神经网络的认知智能系统。科大讯飞也同样注重中国文化,组织大量的专家将各地的方言纳入了语音输入的范围之内。这样,不仅更好的保存了中国传统文化,推动其不断发展的同时,也大大加强了语音输入的受众面,为期开拓了更为广阔的市场。
  同样,精益求精也是开拓新兴领域的一个必不可少的品质。举个例子,在科大讯飞中一直都流传着这么一个段子。如果一个人在交流群里说,今天我拿下了一个亿的订单。下面可能是无人问津。但如果有一个人说,我今天将语音输入的准确度提高了1%,这个群可能会立即火热了起来,展开激烈的讨论。虽然这只是一个段子,但从中不难发现,他反映了科大讯飞中有着极为良好的科研氛围。
  从上面两个例子中,我们不难看出正是因为在科大讯飞拥有着精益求精的良好品质,以及众人一心,专注于科研的良好氛围,才有了今日科大讯飞破千亿市值,与BAT三大巨头平起平坐的不朽神话。
  但是,科大讯飞的前景并非一片光明,同样存在着大量的缺陷等待改进。首先,在人工智能领域,为了推动其的快速发展,人工智能的算法始终处于开源状态,同时还有着为数不少的芯片公司专门推出了适合算法运行的计算机芯片。这意味着,企业只需要招募少量的人才,利用算法或者使用芯片,就可以直接对本行业的数据进行应用。而讯飞在耗费巨资研发的技术,也随着算法的开源,开始贬值。
  在种情况下,科大讯飞所处的语音输入的赛道上,越来越多的强有力的对手加入了进来,目前百度的语音市场份额已经上升到了第二位。同时,腾讯、搜狗、阿里先后与2010年开始通过成立自主的研发团队或者收购其他公司的方式进入了语音输入的团队。但是在此之前,他们都曾经是科大讯飞的客户。人工智能越来越热,钱却反而难赚。
  面对着重重阻碍,语音输入的收入也一度降至最低点。多领域投入成为了解决问题的必然选择。如今,科大讯飞已经在教育、医疗、司法等多个行业开始布局。
  同时,AI建模的有效性需要有着大量的实验数据来支持,那么如果以某一系统作为了底层而搭建起的操作系统,在未来就很有可能成为行业的标准。那么开放自身的核心数据,构建起自身的生态圈,竞争成为行业的标准也是势在必行。
  最后,把握住自身区别于BAT的最大优势,就是科大讯飞作为人工智能领域最受关注的公司,可以依靠人工智能的风向,在多个领域上获得政府的支持,使其在多个领域中掌握先机。
  3  自然语言理解行之将至
  就像人工智能会被分为弱人工智能,强人工智能,超人工智能一样,语音输入也被分为了语音合成、语音识别、自然语言理解的三大层次。不过,相较于人工智能,语音输入的层次感反而没有那么强了,尤其是,当我们的语音输入正在一步一步走向巅峰的时候,与之息息相关的人工智能反而成为了其的桎梏。同时,人工智能的深度学习需要大量的数据训练模型,也导致了其发展遇到瓶颈。或许有的人会疑惑如今的人工智能,已经可以轻轻松松击败围棋界顶尖高手,尤其是现在最新的人工智能,Alphago更是击败了最强高手李世石。如此水平,又怎会出现智力问题呢?然而科研人员给出的目标是,希望人工智能尽快达到六龄儿童的水平。举个例子,“爸爸没法举起他的儿子,因为他很重。”那么请问“谁重?”答:“儿子”
  “爸爸没法举起他的儿子,因为他很虚弱。”那么请问“谁虚弱?”答:“爸爸”对于这两句话中对“他”的理解就相当于六龄儿童的认知水平,也是我们目前的研究目标。可以想见,只有当人工智能对语音的理解水平,即语音识别的准确度,得到了提高,语音输入才能得到新的突破。
  4  結语
  人工智能或许比我们想象中的要来的更快。当我们还懵懵懂懂之时,语音输入已经进入了我们的生活,打字即将成为过去时了。那么,在未来,更加便利便捷的语音输入方式,更为广阔的应用环境,随心所欲的输入语种,一切的一切都将成为可能。
  参考文献
  [1] 钱丽娜,游丛瑞.刘庆峰的焦虑:科大讯飞危局[J].商学院,2018(12):13-20.
  [2] 卫萌,淦凌云.科大讯飞的人工智能之路[J].互联网经济,2016(Z2):56-61.
  [3] 钱丽娜.探秘科大讯飞:人工智能比你想象的来得更快[J].商学院,2017(7):89-90.
  [4] 胡郁.人工智能与语音识别技术[J].电子产品世界,2016,23(4):23-25,27.
  [5] 梅新蕾,李伟.科大讯飞:探寻人工智能的实现路径[J].清华管理评论,2018(12):11-19.
  [6] 陈平.科大讯飞:“让世界聆听中国的声音”[J].中国商界,2018(Z1):86-91.
  [7] 卜文娟.科大讯飞 要有坐好十年冷板凳的韧性[J].中国战略新兴产业,2018(5):88-89.
转载注明来源:https://www.xzbu.com/8/view-15054285.htm