苹果收购 Lattice,Siri 未来会变得强大

下一篇文章

丝科创投成立 5 亿美元新基金,用中国资金投资欧美“规模化公司”

苹果收购 Lattice,Siri 未来会变得强大

苹果以往曾凭借智能助手 Siri 取得过领先,然而在短短几年时间里,亚马逊、微软和谷歌已经抢走了苹果的风头。

在苹果对未来的设想中,Siri 是关键一环。因此,上周末有消息称,苹果 斥资 2 亿美元收购了 Lattice Data。这家创业公司的目标是改变企业处理文本和其他非结构化信息的方式。这些工程师已准备好协助苹果开发下一代的内部知识图谱,为 Siri 和未来的智能产品和服务提供帮助。

简单而言,苹果收购 Lattice 是为了获得人才。苹果为该公司的 20 名工程师支付了约 1000 万美元。这样的市场价格是合理的。谷歌 2014 年斥资 5 亿美元收购了 DeepMind。当时,该公司约有 75 名员工,其中包括相当一部分机器学习开发者。经过计算后可以看到,苹果的收购出价与当时相差不大。不过深入来看,这笔收购表明,苹果愿意投入巨资去加强 Siri。

苹果和其他科技巨头正试图让会话助手学会关于世界的基本知识。苹果目前依靠雅虎等多家合作伙伴,向 Siri 提供用于回答问题的信息。苹果的主要竞争对手谷歌则掌握着强大的知识图谱。毫无疑问,苹果有意加强自主知识图谱的规模和质量,减小对合作伙伴的依赖。

在未来以人工智能为优先的世界中,Lattice 经验丰富的工程师对苹果的产品设计尤为重要。类似微软、Facebook 和谷歌的公司都已宣布,将开发基础设施,以支持机器学习技术在尽可能多产品和服务中的应用。2016 年 10 月,苹果招聘了鲁斯·萨拉库蒂诺夫(Rus Salakuhdinov)负责这方面的研究工作,并收购了 Turi 和 RealFace 等创业公司。不过,如果希望在人工智能领域保持长期竞争力,苹果还有很多工作要做。

DL4J 深度学习库的创建者、Skymind CEO 克里斯·尼克尔森(Chris Nicholson)表示:“谷歌内部已经将机器学习和深度学习技术应用至约 2500 个场景。苹果应当也采取同样的做法。”

在苹果内部,Lattice 团队最初将帮助苹果加速知识图谱的发展。对于苹果将 Siri 嵌入所有产品的计划,这样的基础设施是重要一部分。这是个很好的起点。一方面,这可以帮助苹果优化当前产品,例如 Apple TV 平台的 Siri 搜索,另一方面也将帮苹果未来的产品,例如传闻中亚马逊 Echo 智能音箱的竞品,打下基础。

知识图谱代表了关于世界的已知信息。知识图谱中的信息要么来自数据库中的结构化数据,要么来自文件或互联网上的非结构化数据。

当你在 iTunes 中使用 Siri 去搜索时,结果必然来自某处。知识图谱帮助这样的搜索产品提取不同条目之间的复杂关系。目前,Apple TV 平台的 Siri 支持复杂的自然语言搜索,例如“为孩子们查找电视剧”,以及“只搜索喜剧”。如果希望响应这样的请求,那么就需要大量的信息。部分这些信息隐藏在电视节目概要中,或是分散在互联网上。

“通过提供更多数据,机器学习算法将带来更好的结果。”尼克尔森表示,“因此,如果你可以找到某种方式,从非结构化数据中提取价值,那么就可以利用世界上最庞大的数据集,从而产生最好的结果。”

从非结构化数据源中提取数据的问题在于,很难验证所提取数据的准确性。创业公司 Semantic Machines 正在开发自主的会话人工智能。该公司首席科学家丹·克莱恩(Dan Klein)博士表示,企业通常使用粗浅的自然语言模型,从文本源中提取数据和事实。最初这是概率性过程,也就是说哪些文本将被标记为重要数据取决于信心值或可能性。然而,一旦数据提取出之后,这就成为了肯定性的事件。

克莱恩表示:“如果你持续追踪信心值,那么在提取非结构化数据时就可以取得更好的效果。”

这就是斯坦福大学教授克里斯托弗·莱(Christopher Re)关于 DeepDive 项目的想法,而该项目的商业化成果就是 Lattice。经典数据库假定,所有信息都是准确的,因此未来的任何搜索都有可能在不经意间返回错误信息。通过追踪信息的准确程度,你可以更好地考虑这种危险的不确定性。克莱恩表示,采取统一的方法将可以提高准确性,明确哪些信息已知、未知,或是存在不确定。

如果你对提取到的信息有更强烈的信心,那么就可以建设规模更大、互联程度更高的知识图谱,支持更复杂的搜索。这将给基于数据的机器智能服务带来帮助。Siri 将可以回答更广泛的问题。

翻译:维金

Apple is shoring up Siri for its next generation of intelligent devices

blog comments powered by Disqus