虽然脑机接口存在很多道德伦理问题,但也不必因噎废食。脑机接口如果能成熟应用,能让瘫痪患者重新活动,盲人也能再度「看见」这个世界,即便对正常人也有望开拓很多新的应用场景。
除了 Neuralink,其实脑机接口这几年也在不断发展,并取得了一些成绩,甚至开始改变一些人的生活。
我们前段时间就报道过,脑干中风而导致严重瘫痪的 Ann Johnson ,瘫痪这 18 年后,在脑机接口和 AI 技术的帮助下,首次重新和丈夫「对话」。
这是加州大学团队的一项脑机接口研究,研究团队在 Ann 大脑表面植入了装有 253 个电极的硅片,跟信用卡差不多大。
这些电极会截取那些原本将用于控制 Ann 的嘴唇、舌头、下巴、喉咙以及脸部肌肉的脑信号,并传回到计算机里。接下来,计算机会通过 AI 算法分析这些信号背后对应的文字内容。
接下来的好几周时间里,Ann 和研究团队开始对语言模型进行训练 —— 一次又一次地重复「说」 1024 个单词,直至算法能够识别出相关大脑信号。
值得指出的是,研究团队这次让 AI 识别的,并不是单词完整发音的信号,而是去识别更小的语音单位 —— 音素。
譬如,单词「Hello」里就有四个音素:「HH」「AH」 「L」和「OW」。
研究团队表示,以音素为识别单位后,算法只需要学习 39 个音素就可以解析出所有英语单词,并且能提升系统分析的准确率和速度。
有趣的是,就在加州大学团队发论文的同一天,斯坦福大学的研究团队也在《自然》上发布了类似的研究报告。
斯坦福大学项目的参与者是今年 68 岁的 Pat Bennett,她在 2012 年被诊断出渐冻症,目前已经无法用言语清晰地沟通。
Pat 对系统的训练花了将近半年的时间,该算法同样是针对音素来识别,每分钟输出约为 62 个单词。
至于准确率,当总单词数为 50 时,准确率可达到 90%,但当词汇扩大至 1.25 万单词后,准确率则为 76%。
虽然 Ann 采用的技术拥有更高的输出率,但当其词汇量扩展至 1024 个单词时,其准确率的中位数也是约为 76%。
《自然》杂志评论称,这两个研究的参与者能控制其面部肌肉以及在不同程度上发声,因此,不确定这些技术对于完全无法没有剩余肌肉控制能力的患者身上是否可用。
其次,两个项目的设备系统「对于照料者在家使用来说,仍然过于复杂,不能避免大量的训练和维护」。
参与了 Pat 项目的 Jaimie Henderson 博士也认为,在接下来的好些年里,「可植入的,需要通过手术放置的技术」仍会存在,但他认为这是一个可以让患有 ALS 人重新获得沟通能力的重要方式。
虽然 Ann 和 Pat「意念说话」的内容都是呈现于一个屏幕上,但 Ann 的内容却多了一个能「出声」的数字化身。
这个数字化身,会根据 Ann 尝试说话时产生的脑信号来实时移动五官,呈现表情。
数字化身的合成声音,则是用 Ann 在十多年前婚礼上发言的视频素材来训练的。
这一切,都是为了让整个沟通过程更加自然。对于未来想成为咨询师的 Ann 来说,这对于未来的咨询对象,也是一种舒服的沟通表达方式。 当 Ann 第一次使用这个系统来说和移动数字化身的脸部,我就知道我们做了一些将带来真正改变的东西。
项目中的研究员 Kaylo Littlejohn 说道。
在介绍视频中,Ann 通过这个系统和丈夫 Bill 进行了时隔 18 年来的首次对话,一来一回地闲聊起家常。
在 Ann 看来,时隔多年,再次听到「自己」的声音,也是一个很奇妙的体验,「 就像听到了一位老朋友」的声音。
测试当天,Ann 已经迫不及待想让自己的女儿听一下这个声音。
当她患病时,女儿才 6 个月大。她印象中的妈妈,一直都是一款落后输入设备中生成的带英式口音的机器女声。
除了能让日常交流更自然外,参与这个项目还让 Ann 重新感受到使命感和意义: 之前在康复医院时,语言治疗师都拿我没辙。 成为这项研究一分子后,我觉得自己是在为社会做贡献。 我觉得自己就像再次拥有了工作。 我能活那么久也是奇迹;这个项目则让我能在活着的时候真正地生活!
好消息是,接下来团队还计划将研究向前推进,把系统做成无线版本,这样的话 Ann 就不用依靠线缆来连接脑机接口系统了: 如果可以让 Ann 这样的患者用这个技术去自由地控制电脑和手机,这将大大提升她们的独立程度和社交互动能力。
的确,无论是用脑机接口来恢复沟通能力还是行动能力,这些技术的最终目的还是去重新建立患者的独立和自主性。
脑机接口可以是改变人生的「开关」,在和快速发展 AIGC 技术结合后,之前人们畅想的元宇宙世界或许并非只是一个遥不可及的蓝图。
但当这个开关掌握在科技公司,也不由得让人警惕,因为它所带来的影响,要比我们投入近在互联网上「让渡」隐私要大得多。
目前 AI 领域关于监管的讨论,很快也会在脑机接口上出现,对新技术的探索和约束,会同时上演。