亚马逊申请方言翻译工具专利

下一篇文章

调查显示:女性和男性对创业的看法完全不同

亚马逊申请方言翻译工具专利

亚马逊已申请一种音频系统专利,能检测说话者的方言,并将其转换为收听者使用的方言。这或许有助于解决许多场景与行业中的沟通障碍。专利的申请并不意味着亚马逊最终会开发实际产品或者准备推广这项技术。不过从技术因素上来说,这也不是什么不可能的事情。

Patent Yogi 最先注意到 这项专利申请。专利申请描述了“方言翻译技术”。尽管专利申请中使用了专门的术语,但具体实现方法很明确。在我对这些描述进行简单解读之后,大概情况如下:

在两方的对话中,收到的音频被分析,判断是否与预存的某种方言匹配。如果是,那么各方的输入音频将会被输出为对方使用的方言。

这看起来很简单,尤其考虑到目前在自然语言处理方面所取得的成果。方言可能很难理解,尤其是如果你之前没有和对方有过交流,同时也无法面对面对话,利用表情和肢体语言来辅助判断的情况下。

方言翻译工具最显而易见的应用场景是客服。在这种场景下,数百万通电话可能来自遥远的国家。客服人员的工作就是与客户进行清晰的沟通,避免由于语言障碍给用户造成更大的不安。方言管理是这些行业的重要一部分。客服人员常常被要求通过语言和方言测试,才能在工作的组织中得到晋升。

基于计算机的方言解决方案不仅可以帮助他们的工作,也能提高他们的效率。目前,有阿拉伯口音的人在讲英语时可以与其他人正常交流,而不必担心对方是否有奥地利、俄罗斯或韩国口音。只要讲的都是英语,那么就不会有问题。

当然,在其他一些场景下,这种技术也能带来帮助。例如在旅行时,或是开展国际业务时。可以肯定,所有人都能想出一些方言转换工具能发挥作用的情况。

关于这个系统的实际执行,仍然还有很多未知数。不过,亚马逊有大量资金和工程资源投入至自然语言处理,在我看来这个系统没什么是无法实现的,也不存在技术障碍。

当然,这将会是个机器学习模型,或者说一套机器学习模型。每个机器学习模型都使用特定方言的语音进行几小时的训练。对亚马逊来说,优势在于 Alexa 语音助手已经在全球普及。通过 Echo 音箱和其他设备,亚马逊能获得大量语音样本,因此许多方言可能已经存在于亚马逊的语音库里。基于这些素材,亚马逊所要做的就是从数据集中找到相应的语音。

这个方向的研究已基本成熟,但亚马逊似乎想要开发特定的系统,在具体产品中利用这些技术,从而领先于其他人。

值得注意的是,专利允许对系统进行欺骗:它不需要抢最初几秒钟的时间来识别你的方言,而是可以通过设备所在位置、电话号码,以及以往遇到过的方言来判断,而用户也可以直接输入自己使用的方言。当然,也会有些特殊情况,例如巴基斯坦的某些方言。不过只要有足够数据,系统就可以探测并支持这些方言。

就像所有专利一样,目前不能确保亚马逊会推出相应的产品。这可能只是一项研究,或者“防御性专利”,目的是防止竞争对手开发同类系统。不过就这个专利而言,我很有信心,实际产品会在一年左右的时间里面市。

翻译:维金

Amazon patents a real-time accent translator