您好, 访客   登录/注册

信息交互的“湿艺术”

来源:用户上传      作者:

  摘 要:脑在计算机术语中被称为“湿件”,是相对于“硬件”——即无机计算系统而言的“有机计算中枢”。二者都是电荷的承载基质:一个基于数字电信号,一个基于生物电信号。人工智能时代的到来,使硬件智慧大幅提升;为平衡差距,脑机接口(BCI)的研究突然加速。侵入式与非侵入式脑机接口的较量在2019年进入白热化,其进路分化与目的性分层渐趋明朗。美国能否抓住BCI的战略机遇,在信息“湿件”领域追赶5G“硬件”,实现弯道超车。
   关键词:脑机接口;BCI;“湿件”;人机界面;交互
  中图分类号:TP3
  文献标识码:A
  文章编号:1672-8122(2020)05-0004-04
  脑机接口(Brain-Computer Interface,BCI)也被称作“脑机融合感知”,指在生命体脑部器官与电子硬件设备之间建立有线或无线通路,以进行信息传递甚至信息交换的科学概念。近年来,脑机接口已从科幻作品中无边际的幻想逐渐落为技术现实。本文所指的脑机接口是一个科学议题,这里的“脑”指生命体内部构成思维的“神经元”及其脑波,而非“意念”;“机”指非生命形态(特别是电子电路及芯片)所构成的硬件系统。脑在计算机术语中被称为“湿件”,是相对于“无机计算系统”而言的“有机计算中枢”。二者的相似之处在于:它们都是电荷的承载基质,一个基于数字电信号,一个基于生物电信号。它们都在电荷运动与转换过程中完成信息的编码、过滤、整合,最终实现运算结果或思维判断的指令输出。以“比特”为单位的数字电信号和以“神经元突触”为传导的生物电信号都是计算与思维系统中反映消息的物理量。由于具有共通性,长久以来人们总希望有机构成的“湿件”能够与无机构成的“硬件”及“软件”相互贯通,以提升各自性能。
  一、应对人工智能的隐忧
   最近几年,人们对“实现贯通”的希望日益迫切。原因在于人工智能(AI)的发展热度急剧提升。计算机硬件的“智慧能力”被愈加强化,一时间,机器思维超越人类的声音不绝于耳,引起社会忧虑。以科技探索的先锋式人物埃隆·马斯克(Elon Musk)为代表的一部分人开始呼吁:关注人工智能给人类带来的潜在威胁。他说:“通过人工智能,我们正在召唤恶魔”“并非所有的AI期货都是良性的”“我们有一天会发现自己生活在专制控制下,独裁者正是我们创造的机器人霸主”[1]。2017年7月15日,在美国由各州联邦组成的“国家执政者协会”(National Governors Association)例会上,马斯克透过演讲不断重申他对人工智能的长远忧虑[2]。这说明对人工智能担忧的探讨已经上升到国家政治的层面。
   “人工智能必将对其他物种构成威胁。如果AI变成了这样一个最高智能物种,而它又不属于人类,它具有自我意识,那人类就被归入‘其他物种’的类别了。”也就是在那个时候,马斯克为应对挑战创立了“Neuralink”,一个以脑机接口为对象的科研企业。在他看来,“AI的崛起只是时间问题,在那一天到来之前,人类务必要避免自己落入‘其他物种’的境地。在AI与其他所有物种共存的未来,人类只有一个选择,就是成为AI”[3]。 至此一晃,两年已过。2019年夏末,马斯克高调宣布他的公司已经找到贯通脑机的连接方法,即通过机器人实施脑神经手术,在头部执行无痛、微创的导线穿刺,在颅脑中植入芯片并透过芯片接口与外界的电子设备相连,以读取脑部信息。在这一名为“脑后插管”的新方法中,蕴含着以下几项技术突破。
   其一,是发展出用于执行“插管”手术的机器人,其技術可用激光对脑部表皮及皮下组织(包括头骨)实施穿刺钻孔,继而将导线、电极快速植入。植入速度为每分钟6根线。这样无需开颅、创面极小的神经外科机器人手术可将手术时间控制在45分钟左右,并可以避开脑部血管,以减少术后炎症的反应率。
   其二,是研发特殊材料的导线。这种导线的直径只有4~6微米,比人类发丝要细很多,其中含有两层导体和三层绝缘体。它的作用,一方面,是确保脑机接口内外的信息连通;另一方面,是承载与脑神经相接触的“电极”,或被称为“超细薄膜材料制造的、具备生物相容性的微神经探针”[4]。手术最多可植入3 072个电极(在老鼠身上试验时),它们分布在96根导线上(每根线上有32个独立电极)。与1998年(1998年)布朗大学的约翰·多诺霍(John Donoghue)教授实施的早期脑机结合试验(BrainGate)相比,现在的电极分布效率是极高的。布朗时期的探头通道最多只有128个电极,电极越多意味着可以收集更周全的脑部数据。导线的材料也有了飞跃,新型导线具有灵活的韧性而不像布朗时期所使用的硬针。线材的柔性可延长导线寿命、跟随脑部移动。
   其三,是开发专用的集成电路(电子芯片),由处理器、连接电极的聚合物导线、负责供电和数据传输的USB-C接口及外壳组成。处理器的作用是放大信号,将模拟生物电信号转换为数字电信号并抑制噪声。在微功耗、微尺寸的极端环境下对微弱的神经信号进行采样和加工,并实施高密度、多通路信息记录,还要防止芯片被体液侵蚀或引起身体不适,这些都对芯片的制造提出严苛要求。
   当然,如集成芯片的固定、电源的匹配、脑机接口的工作时长、信号输出的有线与无线方案等,尚未明确。这说明项目还处于初步的方法验证阶段。但从发布的视频看,植入这项技术的动物(鼠或猴子)已经可以用脑神经控制自己,在计算机模拟的三维空间进行方向移动。这种用意念控制自身状态的交互方式,远比触控交互来得自然。目前,虚拟现实(VR)技术遇到发展瓶颈,原因之一便是主体性感观沉浸与非自然的它者化触控之间所形成的界面感知矛盾。脑机接口透过脑神经实施意念操控,可以大大克服交互体验中非自然界面所带来的障碍。脑机接口在交互动画、三维游戏或帮助瘫痪病人重获操控力方面都有巨大潜力。
  二、脑机接口的进路分化    当然,脑机接口(BCI)的探索并不是Neuralink一家独大。2017年,几乎与Neuralink同时步入脑机融合领域的还有Facebook。后者于2017年4月首次宣布其BCI研发计划。2019年夏,在马斯克携Neuralink发布技术突破后仅两周,Facebook也迫不及待地公布了自己的BCI研究成果。激烈的研发竞争已经开始。
   Neuralink与Facebook的竞争,代表着BCI技术的两个截然不同的发展路径。前者青睐于“侵入式”BCI技术,即通过外科手术使电极与神经元产生实际的物理连接;后者则力主“非侵入式”可穿戴方案,即透过佩带脑电图或其他脑波感应装置实现脑信息交互。这两种技术路径在很早前就已确立,美国各大学实验室也早已分成两派、各自探索;但真正吸引顶级资金、顶级科研团队展开公开的研发较量,始于2019年夏季。两种BCI进路的区别在于以下几点。
   首先,二者感知的脑部意念层次不同。侵入式BCI主要对脑部神经元的综合意念进行感知和分析,所以它的意念感知域比较广(包括思维、肌肉运动等多个侧面);非侵入式BCI研究的核心是语言功能区,目前其大部分精力是针对语言意念层面的脑电感知(类似于“意念打字”)。后者在研究范畴上有所缩小,但利于深耕。与Facebook合作的加州大学旧金山分校BCI团队最近已证明:使用非侵入式设备在“人们说话时记录的大脑皮质活动,可以用来完成实时解码,并将文字呈现于电脑屏幕上”。甚至宣称:“再过不久,我们仅靠意念就可以打字聊天、向计算机发出指令了”[5]。
   其次,二者在探测精度与安全性方面陷入悖论。普遍认为,植入式触点(电极)的探测精准度要比非植入式的头皮贴片(或头带)高得多,能够识别更加复杂的神经指令;但手术植入的安全性大打折扣,消费心理的畏惧感陡然增大。目前面向消费市场的产品都是非侵入式BCI。
   再次,实验路径不同。由于侵入式BCI对生命体有显性破坏效果(开颅),手术实验多在鼠类或猴子身上实施,技术稳定后才能在人体上进一步验证。而非侵入式BCI对身体的看见损伤几乎为零,一开始便应用于人体,已积累大量的人脑采样数据;并已同步应用在医学、教育、新媒体、艺术等各个领域,可以边研究、边应用,进展速度较快。
   最后,就地缘文化差异来看,对语言更为依赖的非侵入式BCI,在短时间内给非英语交流国家的用户可能带来消费阻力,继而产生新的“知沟”。
   对语言差异的担忧为时尚早。目前非侵入式BCI的技术目标只是分辨1 000个单词,分辨速度每分钟100字,错误率低于17%。事实上现有的技术与这些指标还有一定差距。真正的未知数,在于侵入式BCI于2020年进入人体试验阶段时,能带来多大的惊喜。
  三、目的性分层
   从研究目的与目标看,对脑机接口的期待,在时间线上有明显的层次递进,我们称为目的性分层。
   就“短期”目的看,生存是科研得以继续的保证。因此,巩固BCI技术的实用价值、提升读取性能、使人们看到未来的潜力——即所谓鼓舞士气(包括投资人、用户和科研伙伴)尤为重要。接着就是推动科研与量产并行发展,马斯克尤其强调Neuralink要为医疗的急迫需求生产设备。只有更早地进入应用领域,才可以获得更多的科研数据和用户支持。标准化,也是短期目标的一部分,如手术机器人、电极导线产业标准等。这是为了积累技术、提高竞争门槛,也为大规模量产和应用打下基础。
   再长远一点看, BCI的“近期”研究目的趋向于将技术看作是体内计算机(异物植入),通过硬件的帮助来实现脑信息单向输出、准确识别、意念施控,以提升人机交互界面的自然属性。
   “中期”目的则基于生物电信號与数字电信号的双向信息连通与融合,将人类“湿件”与电子“软硬件”合二为一,看作是有机生命的一个整体,着力提升有机整体的环境交互能力与生活质量。即修复机体的操控缺陷、改善大脑运行效率、增强思维算力和记忆力、沟通脑机实现互动。到那时,日趋成熟的BCI技术将与各种视觉、听觉、触觉等可穿戴设备相结合,全面改善人体感观和各方面信息通路。
   而BCI的“远期”目的会把拓展人的思维能力、智慧水平看作重要方向。思维能力的延展,体现在记忆精度、计算能力及领悟力方面,更重要的是打通“人机”与“人际”之间的界限,即在人与人、人与机器之间形成“思维共在”。毕竟,与机器共同成长,才能确保人工智能为我所用。当然,以今天的智慧水准看,打通思维界限意味着暴露个人隐私,会陷入伦理焦虑与恐慌。但那是非常遥远的事,那时的社会状况、人际关系和心智水平都会大大超越今天,大可不必杞人忧天。
  四、机遇与展望
   新的技术,亦带来重要的战略机遇。这对于站在民族复兴与技术赶超之路上的中国尤为关键。Neuralink与Facebook都是脑机接口的重要科研主体,其目的性相似,而研究路径与实验方法各异。从美国宏观的技术战略意义上看,实现了双管齐下的多层次研究布局,为新技术的引领占据了有利地形。从实力上看,不论欧洲、东亚还是中东(以色列)都没有实力在BCI领域与美国进行角逐。就中国来看,BCI研究正日益受到重视,清华大学的生物医学工程团队长期在脑机结合与脑电磁探索方面积累经验。其团队和解放军总医院合作的微创脑机接口研究,已经进入实际临床植入阶段。胥红来、黄肖山等人创建的神经科技企业(博睿康)已获得多轮投资。其研发的多通道脑电磁分析系统(EEG/ERP)已广泛应用于国内外科研、医疗领域。孵化于哈佛大学的华人BCI企业BrainCo已落地深圳并实现非侵入式BCI设备的研发和量产。
   可以说,中国在BCI领域的参与是积极而活跃的。但一方面,我们还处于技术跟随状态,并没有做到领先;另一方面,国内市场对BCI的基础研发投入也大大落后于欧美。一点开花,尚难以形成呼应。大部分国人对脑机融合的认识还停留在科幻的印象里,没能够上升到国家战略的高度来关注BCI。当然,面对美国的技术优势,亦不能妄自菲薄。不论国外研究多么领先,其探索仍停留在解决“神经界面”的初步阶段;BCI真正爆发的基础是“神经解码”,这个领域的科学竞争尚未开始。    现在提国家战略,是因为有前车之鉴。20世纪80年代美国曾与日本因消费级影视硬件产业展开技术战。那时日本凭借录像机与录像带产业优势,霸占全球家庭影像市场。他们沿着线性逻辑,在模拟电视领域搞超精细显像技术,精度达到头发丝的十分之一。松下、日立、索尼等厂商将大笔资金投入高清录像机、高清显像管的研发中,却在光存储(可视光碟)领域陷入与欧洲的竞争,随后被美国的数字影像格式与互联网传输格式彻底击败。当自己建立的技术发展逻辑与标准被他人超越时,美国的思想往往是以创新“弯道超车”。这说明,走单一的技术路线是不行的。今天中国把5G视为国家战略,沿着2G跟随、3G突破、4G同步、5G引领、未来6G创造辉煌的线性逻辑大步挺进。我们在做好通讯硬件产业布局的同时,也要有技术前瞻性,做好相关的技术储备、实时跟进。
   就BCI来说,侵入式与非侵入式之争尚无分晓。但未来一旦语言层面的脑机输入占据了上风,就又会掀起一次单一语言在技术层面上对文化单一化的全球洗礼。20世纪80年代早期,苹果电脑风靡全球时,汉字经历过一次电脑输入、显示与排版的数字化危机。面对字母键盘,象形文字在电子化方面一筹莫展。教育部被迫设立紧急预案,几乎要从小学一年级普及英语教育、适应西方键盘。以后的转折大家都清楚:王选发明中文激光照排系统,其后一大批中文字库與输入法涌现。中国在互联网来临的前夜赶上了数字化发展的快车,克服了那次危机。如果有一天,英语世界进入了脑机交互的新时代,中国又将何去何从?我们拭目以待。
  
  参考文献:
  [1] Clifton Leaf,“Elon Musk Fears A.I. He Isn’t the Only Genius to Worry Tech Will Destroy Us.”Fortune,2017-08-30.
  [2] 要了解人们对人工智能的忧虑,请参阅马斯克与他人创建的非营利组织“OpenAI”,该组织希望找寻“通往安全的人工智能道路”.
  [3] Tim Urban,“Neuralink and the Brain’s Magical Future” Waitbutwhy, 2017-08-20.
  [4] Elon Musk, Neurolink, “An integrated brain-machine interface platform with thousands of channels” BioRxiv[EB/OL]. https://www.biorxiv.org/content/10.1101/703801v1, 2019-07-17.
  [5] David A. Moses, Matthew K. Leonard, Joseph G. Makin & Edward F. Chang, “Real-time decoding of question-and-answer speech dialogue using human cortical activity”.Nature Communications,2019-07-30.
  [责任编辑:杨楚珺]
转载注明来源:https://www.xzbu.com/7/view-15238635.htm