谷歌承诺改进语音讯息转录功能,要把错误率降低 49%

下一篇文章

Firefox OS 将于 11 月发布 2.5 版本

“嗨,我的名字是梅丽莎,我代表非常会议处在城市娱乐前沿的一家科技公司致电。我想跟进一下,以确保你看到爱听关于他们新 H T M R html 5的公告。”

上面这段不知所云的话是 Google Voice 对我最近一段语音讯息的文字转录。考虑到谷歌整体的语音识别算法已经变得非常好,Google Voice(即现在的 Google Fi)的转录功能似乎一直很糟糕。然而,该公司现在承诺,要把转录错误率降低 49%。

谷歌表示,它正在使用 “长短期记忆深度递归神经网络”(long short-term memory deep recurrent neural networks)来减少这些错误。当然,谷歌的图像识别算法也使用了深度神经网络这种技术,其他应用场景还包括垃圾邮件过滤器等等。谷歌表示,它正使用 Voice 用户的反馈来训练新算法。

大概某个地方会有技术大牛能够解释一下这种解决方案中 “长短期记忆” 是什么(你可以在评论中留言),但重要的是,转录功能现在将变得更加常用。

Google Voice 改进转录功能将成为很多人的福音,尤其是那些有很多来电但通常不接通的人。眼下,转录文字几乎没什么用,你还是得听原始的语音讯息。如果谷歌现在能够创造出一份实用的转录文字,那么它将成为向前迈进的一大步。

图片来源:MATTHIAS RIPP/FLICKR,按照 CC BY 2.0 协议授权

翻译:王灿均(@何无鱼

Google Promises Improved Voicemail Transcriptions, Cuts Error Rate By 49%