杏鑫注册登录_Siri和Alexa背后的女科学家逝世,是她让AI有了女声

  萧箫发自凹非寺

  量子位报道公众号 QbitAI

  “嘿 Siri,你能帮我做点什么?”

  “……”

  Siri 的“甜美女声”,现在已经司空见惯了。

  但如果没有女科学家 Ann Syrdal 的努力,这种“合成女声”可能还需要更长的时间。

  遗憾的是,7 月 24 日,74 岁的 Ann Syrdal 去世了。

  这位被网友谐音为“Answer doll”(问答娃娃)的语音合成专家,曾经是美国电话电报公司(AT&T,拥有贝尔实验室)的首席技术研究员。

  在美国电话电报公司研究期间,她开发出了“第一个真正高质量的女性合成声音”,这才有了后来的 Siri 和 Alexa(亚马逊的语音助手)。

  于是《纽约时报》评价说:她是 Siri 和 Alexa 背后的那个人。

  事实上,虽然语音合成技术早已有之,1939 年,AT&T的贝尔实验室就已经开发出了首批合成语音。

  但,这些语音合成技术(TTS)基本只能合成男性的声音。

  往后的 40 年间,计算机技术突飞猛进,合成女性语音的技术却一直停滞不前。

  Siri 的开发者 Tom Gruber 曾经表示:“那些声音听起来就像机器人说话一样。”

  而 Ann Syrdal 的到来,才让合成女性声音有了质地的飞跃。

  让机器发出“自然的”女声

  自 20 世纪 80 年代中期,Syrdal 开始研发女性语音合成系统。

  Syrdal 的同事、语言研究员h.s.Gopal 曾表示:“那时候,所有人都认为女声只是男声的高频版本,但这种想法根本不起作用。”

  事实上,由于女性声音的特点,例如更高的音调和更多的气音,会导致在电话和计算机里,女性的声音比男声更加难听懂。

  据研究发现,即使是真人对讲,女性声音被听错的概率要比男性平均高出 33%。

  举个例子,当你在做英语听力时,有没有感觉到,男声听力题往往会比女声更容易听懂?

  这也是为什么,电话行业中大多数计算机合成的声音听起来像男性。

  然而,语音合成领域不可能只有男声。

  事实上,部分有发声障碍的女性,一直更希望能以女性的合成声音与外界沟通;此外,也有人对女声更加敏感。

  就在 1990 年,Syrdal 开发了一种可以合成女声的系统,通过优化数据库中的声音,将女性合成声音听错的几率从 67% 降到了 40%。

  这其中,一个名为 Julia 的女性合成声音,就是 Syrdal 开发出来的。

  无论是发音还是流畅程度,都已经达到了非常不错的水平,当然,语调还有一点奇怪,不过已经非常逼真了。

  与直接创作语音相比,Syrdal 选择将真人女性的语音片段组成一个大型数据库,在准确标记、确保语音质量的前提下,将它们拼凑起来,找到组合的规律,便于组成新词和新的句子。

  此外,她还建立并测试了人类计算机模型,试图理解人类是如何识别各种语音的。

  而她一直以来研究的目标,是将这个错误率降到 33% 以下,甚至比真人女性声音被听错的概率还要低。

  1998 年,Syrdal 研发出的「自然之声」系统(Natural Voices),在国际语音合成器竞赛中获得了第一名,这是这项竞赛的一个拐点——因为它使用了女性的声音。

  现如今,采用这项技术的 Siri 和 Alexa,已经同时提供了女性和男性的声音。

  而在美国与日本,Siri 的女性声音已经成为了“标配”,几乎所有 iPhone 手机采用的都是 Siri 的女声。

  2008 年,Syrdal 被任命为美国声学学会的研究员,以表彰她对女性语音合成领域所做出的贡献。

  「自然之声」项目的负责人 Juergen Schoeter 表示:“就像是有什么力量一直驱动着她,促使她去优化女性声音的质量。”

  合成女性语音之母

  Ann Syrdal 于 1945 年 12 月 13 日生于明尼阿波利斯(Minneapolis),她的父母于霍尼韦尔认识,这是一家二战前就存在的科技巨头公司。

  她的父亲是一名开发真空管与电子技术的物理学家与工程师,在她 2 岁的时候就离世了,母亲将她抚养长大。

  事实上,Ann Syrdal 考上明尼苏达大学时,并没有考虑过从事科学工作,直到一位心理学教授请她帮忙做一个有老鼠参与的实验,她才意识到自己热爱实验室工作。

  随后,她在明尼苏达大学获得本科与博士学位,此后在麻省理工学院从事博士后的研究。

  也是在麻省理工学院和皇家理工学院,她开始研究人类语言的机制,此后一钻研就是大半辈子,一直到 2015 年,仍然在坚持不懈地发表论文。

  事实上,Ann Syrdal 发表的论文数量不多,在 Researchgate 上显示的一共有 55 篇,这些论文一共被引用了 1100 余次。

  然而,她在语音合成领域上做出的贡献却有目共睹。

  对于 Ann Syrdal 本人来说,选择科研的动力,来自于她在 MIT 工作的那段时间。

  “无论在哪个领域,似乎都能在这里找到那个领域的世界专家,这种激励的感觉几乎让人难以夜寐。”

  Ann Syrdal 的女儿表示,因为癌症的原因,她于 7 月 24 日在加利福尼亚圣何塞的家中离世。

共有 0 条评论

Top