Android语音助手的设计和研究
作者 :  王上 邵华杰

  摘 要: 近几年随着智能手机的迅速发展,移动终端已经成为新技术发展的新平台,不久前苹果公司的Siri第一次将语音识别技术引入到移动终端的人机交互中去,引发语音识别技术的发展热潮。本软件基于Google语音识别云技术,设计出一个个人助手,昵称为Anny,着眼于帮助用户管理日程,改变传统的人机交互方式,采用更为直接的方式来帮助人们改善生活方式和习惯,让每个人都能拥有一个能对话,能交流的个人助手。
  关键词: Android;语音识别;个人助手
  项目背景
  2010年8月13日谷歌展示了运行Android系统移动设备的语音识别技术,可通过语音指令发送电子邮件、短信、拨打电话和获得驾驶导航信息。一段时间以来,谷歌一直在自己谈论其Android手机操作系统。
  本项目基于谷歌的语音识别技术来开发基于ANDROID的手机智能管家Anny。我们不仅要实现语音识别的使用手机的功能,还增添了智能化,情绪化的体验。让我们的“Anny”带给用户更好的人机体验。
  2 国内外现状分析
  语音识别技术作为新兴的人机交互方式已经受到了人们的广泛关注。国内外在这些方面已经有很多研究成果。微软的Bill Gates 在97年世界计算机博览会主题演讲会上,率先指出:下一代操作系统和应用程序的用户界面将是语音识别。可想而知这将是一场席卷全球的热潮。同时潜心研究语音识别技术迄今已达30年之久IBM也有动作,公司已经在95年成立了中国研究中心,中文语音信息处理正是该中心三大研究领域之一。而Intel也提出了“做语音技术的提倡者”的口号,Intel除了举办首届语音技术国际论坛之外,还在国内各地区宣传语音识别技术。要说现在最火的还是Google的Android系统,谷歌已经发布了一个基于Android的最新语音控制应用“Voice Action”,它可以让用户通过语音控制自己的手机。本论文中Anny就是基于Google给出的语音识别技术的开放API来设计的。
  3 创新点
  3.1 真实的虚拟人交互
  苹果公司的Siri是目前最为流行的语音助手,但Siri的交互界面却略显单调,虽然Siri能和用户进行语言交流,但交互界面只有一个按钮和单一的背景,显然没有充分利用触摸屏幕所能提供的全新的人机交互方式,从会说话的汤姆猫的风靡我们不难看出一个出彩的交互界面对一款软件的成败的重要性,试想,如果会说话的汤姆猫采用了Siri的单背景加单按钮的界面,恐怕很难再吸引这么多的用户了。所以,我们小组决定为Anny设计一个友好的交互界面,用户可以看到Anny的可爱形象,并且当用户触碰Anny的不同身体部位时Anny还能做出不同的反应,这样一套界面可以让我们的虚拟个人助手变的更为亲切和真实。
  3.2 情感系统
  我们认为,Anny不应该是一款只能机械地执行用户指令的程序,我们希望Anny是一位真实的,有情感的个人助手,正如一个常人一样,Anny会产生快乐,忧愁,伤心,愤怒等多种情绪,这种情绪也会随着和用户之间的交流进行变化,比如用户如果对Anny没有正确得完成用户的指令进行指责,Anny就会内疚,如果此时用户对其进行安慰,Anny马上会返回快乐的状态;但用户如果继续指责,Anny就会产生厌恶情绪。Anny在不同的情绪下会对用户的指令产生不同的响应,显然,Anny在厌恶的情绪下是不会理会用户的指令的,除非用户对其道歉和安慰。 通过情感系统的引入,Anny会变得更加真实,更加接近一个有血有肉的,情感丰富的个人助手。
  同时,Anny也会通过检测用户的指令中的用词揣摩用户的个人情绪,并且在屏幕上以一定的方式呈现出来,比如用户心情很好,多次出现“哈哈”“呵呵”等语气词,Anny就会把界面变为红色,黄色,等积极,活泼的颜色来衬托用户的愉悦情绪,反之,如果用户多次出现“唉”等语气词,Anny就会呈现蓝色,紫色等忧郁的颜色,并适时地关心和安慰用户。
  3.3 思维系统
  Anny可以记忆用户的生日,喜好,等信息,并且更具这些个人信息来产生不同的响应,比如用户喜欢户外活动,如足球,篮球,那么Anny就会提醒你 “这个周末天气晴,湿度适宜,气温为16~20度,非常适合户外活动,一起去做运动吧!”
  我们希望Anny不仅仅能执行用户的指令,而更希望Anny能成为我们用户的一个朋友,你让Anny了解你更多,Anny就能更好地为你服务。
  4 功能模块介绍
  1)人物3D动画。我们给Anny设计了一个3D的动画造型,并设计了很多动画动作,在不同的用户场景下Anny会执行不同的动画指令,让用户与Anny的交互更为友好互动。
  2)人物触摸互动。像会说话的汤姆猫一样,Anny在用户点击她的时候会响应出不同的动画操作。

文秘写作 期刊发表