失语近20年后，她在AI帮助下再次说话
+ 查看更多

人类首次将从大脑信号中捕捉的语言用虚拟形象表达出来。

Erin Prater

■一位瘫痪的女士凭借一小块植入大脑的电极片和由美国加利福尼亚州的科学家开发的数字虚拟形象，能够再次开口说话。

这是人类第一次将从大脑信号中捕捉的语言和表情用虚拟形象表达出来，而且虚拟形象可以用患者自己的声音说话。

这是美国加州大学旧金山分校（University of California San Francisco）的爱德华·F·张博士实验室（Dr. Edward F. Chang Lab）的第四年博士生凯罗·利特尔约翰的观点。他还是8月23日在《自然》杂志（Nature）发表的详细介绍该项目的论文的主要作者。

这位47岁的女性患者名为安，18年前的一次脑干卒中令她失去了说话能力。安同意通过外科手术在她的大脑皮层植入一块像纸一样薄、信用卡大小的电极片，共有253个电极。这些电极能够获取这个区域的信号，并传达到舌头、下颚、喉咙和面部，这些部位在正常情况下会形成语言和面部表情。一条线缆插入头颅上的一个端口，把这些电极连接到几台安装了人工智能驱动系统的电脑。

安与利特尔约翰的团队共同用几周时间，训练人工智能系统，使其可以识别她的电脑发出的独特信号，并转换成语音。这需要她在大脑中重复会话词汇表里的1,024个单词组成的短语。

利特尔约翰说：“安非常投入，也很努力。她愿意根据需要进行长时间录制，而且她很清楚她的努力将创造一种语言神经假体，会让有这方面残疾的许多人受益。”

在完成系统训练后，安的思想被转换成口头信息，由一个虚拟形象表达出来，这个虚拟形象使用根据几年前拍摄的婚礼视频重构的安自己的声音。

利特尔约翰见证了安首次使用这个系统。一台计算机化辅助与替代通信（AAC）设备让她能够通过颈部肌肉移动，缓慢费力地进行有限的沟通。除此之外，这是她近20年来首次可以出声说话。

利特尔约翰对《财富》杂志表示：“对我和她而言，这是一个非常暖心的时刻，令我们备受鼓舞。”

他补充道，对安来说，“能够听到自己的声音是一次激动人心的经历。”

因为系统经过训练可以识别39个音素，即单词的子单位，而不是完整的单词，因此它将解读安的思想的速度提高了三倍，把大脑信号转换成文本的速度约为每分钟80个单词。

协助开发解码器的生物工程学研究生肖恩·梅茨格在有关该项目的新闻稿中称：“准确性、速度和词汇是关键。这些因素保证用户几乎能够像正常人一样快速沟通，可以进行更自然、更正常的对话。”

加州大学旧金山分校的神经外科系任爱德华·F·张希望该系统能够很快供类似患者连续使用。由于该设备目前仍然在临床试验阶段，因此安无法在研究以外的场合使用。张领导的团队之前曾经帮助一位脑干卒中的男性，通过将大脑信号转换成文本进行沟通。

他在新闻稿里说：“我们的目标是恢复充分的、具象化的沟通，让用户可以用最自然的方式与他人对话。这些技术的进步令我们向真正解决患者的需求迈出了一大步。”

利特尔约翰表示，不同于现有版本，这款产品要在安和其他类似患者的日常生活中应用，必须采用无线设计，并且体积更小巧，以便于携带。他希望在最多十年内就能够开发出更完善的版本，并且可以获得美国食品与药品管理局（U.S. Food and Drug Administration）的批准。

另外一项脑机接口研究

安试验的系统是一种脑机接口。这类技术能够用于瘫痪患者表达自己的思想，例如已故的史蒂夫·霍金，只是这个系统的语音不像机器人一样呆板，而且只要根据用户的思考就可以转换成语音。

美国加州大学伯克利分校（University of California Berkeley）的研究人员在今年8月的早些时候公布了一项相关研究成果，并在《PLoS生物学》杂志（PLoS Biology）上发表了论文。

外科医生在位于纽约的奥尔巴尼医疗中心（Albany Medical Center）在29位癫痫病患者的大脑内植入电极，当时手术室里播放的是平克·弗洛伊德乐队（Pink Floyd）的歌曲《迷墙中的另一块砖（第一部分）》（Another Brick in the Wall, Part 1）。通过人工智能，研究人员能够根据每一位患者大脑中的电子活动重现这首歌曲。

心理学和神经学教授罗伯特·奈特博士最近告诉《财富》，这项成果将被用于开发更完善的脑机接口，用于帮助瘫痪患者、肌萎缩侧索硬化症（ALS）患者和失语症等语言障碍患者。失语症是指患者无法做出讲话的必要动作。

随着技术日益完善，最终它或许可以通过头皮电极来表达用户的想法。加州大学伯克利分校的人类认知神经学博士后研究员、论文的主要作者卢多维克·贝利耶对《财富》杂志表示，这类电极目前能够用于表达一个人从一串字母里做出的选择，但识别每个字母的时间至少需要20秒，因此将这种技术用于沟通非常不便。

如果该技术经过简化，最终就可以协助非残疾人士，比如脑力工作者，与计算机同步传达他们大脑中的文本。

贝利耶指出：“关键是减少阻滞，使人们能够用心中所想完成行动。”例如：“你可以在大脑中想：‘叫辆Uber网约车’，然后在你还没有完成手头的事情的时候，就会有网约车来接你。”

有人对这项研究的未来应用感到不安，对此，奈特和贝利耶强调，目前这种操作必须通过外科手术才能够完成。他们表示，把大脑信号转换成语音的人工智能“只是类似于为大脑提供了一个键盘”。

关于可能出现的隐私问题，贝利耶称，他更担心大型科技公司目前通过监控和跟踪在线活动，对我们的了解程度。

此外，他认为隐私问题可以解决。在完成患者的无线脑电图扫描后，信号将被加密。

贝利耶说：“许多事情尚处在开端，比如神经科学和计算机工程的融合，而且在许多方面，这些技术前途无限。”

奈特补充道：“我认为我即将揭开整个故事的谜团。”■