Neurence 的云计算平台给可穿戴设备带来视觉和听觉

下一篇文章

船大难掉头的雅虎

英国创业公司 Neurence 此前发布了两款概念应用,展示了名为 TaggarTagMe 的现实增强技术。目前,该公司启动了长期平台战略,发布了一款能实现对象识别的机器学习云计算平台。Neurence 希望,随着可穿戴计算设备和物联网的兴起,计算设备在我们的现实世界中越来越普及,该公司能满足下一代的搜索需求。

Neurence 将这一平台称作 Sense,而感兴趣的开发者可以通过软件开发包(SDK)免费访问这一平台,该公司希望通过这种方式提高平台的普及率和用户数量。Sense 平台需要用户,因为平台的发展本身就包含了众包的元素。Neurence 鼓励个人用户向 Sense 数据库添加对象,帮助数据库的发展,使其更有用、相关性更好。

在推出之初,这一数据库包含了“数十万个”已识别的对象。不过,根据 Neurence 投资人 迈克·林奇(Mike Lynch)博士 的说法,Sense 系统能够识别多达 500 万种对象。林奇通过个人的 Invoke Capital 技术投资基金对该公司进行了投资。某些类型的对象,例如图书,可以通过挖掘在线数据集批量添加。不过,为了实现该公司希望中的普及率,这一平台还需要人工为其添加大量数据。

维基百科通过众包的方式打造了在线百科全书,而 Neurence 希望,有足够多的用户帮助该公司标记并增强数百万种现实世界的对象。通过这种方式,在未来 5 年左右的时间里,该公司可以在物联网世界里提供与环境相关的信息。

“在这里,重要的一点在于,现实世界中的设备,包括可穿戴计算设备,能获得完整的信息。因为通过 Sense,这些设备将具备视觉和听觉。”林奇在接受 TechCrunch 采访时表示,“任何人都可以向这一系统输入新信息。我们需要去做的并不是编程,而是在看到某一物体时,以类似维基百科的方式将该物体及其属性的描述上传至云计算平台。随后,这些信息就会向所有人开放。”

“你可以创作,也可以使用。这些信息面向系统中的所有人开放。”他指出。

由于对不同人物、不同团体、不同社区和不同文化,某些对象可以有着非常不同的含义,因此 Neurence 开发一款平台,让用户去描述某一对象的信息是非常合理的。用户可以 通过 Sense 网站 向平台上传图片、音频文件和算法,将数字信息赋予在现实世界中遇到的对象。

Sense 平台可以分析,一台互联设备通过摄像头和麦克风能看到什么、听到什么(这一平台也可以仅仅利用摄像头或麦克风之一的输入信息),随后将感知的数据转化为林奇所说的“概率矢量”,并将这些数据发送给云计算平台进行处理。因此,这一工具并不会将真实的视觉和听觉数据传送给云计算平台(因为这样做速度缓慢,同时令人感觉毛骨悚然)。

如果在数据库中找到匹配的模式,那么这一平台即可辨认出现实世界的对象。这一识别将是准实时的(取决于使用的硬件)。Sense 可以识别的对象包括标志、图书和绘画等。

不过,这仅仅只是 Sense 最初的用途。在识别对象之后,Sense 会启动随后的操作。这类似于桌面搜索服务在返回的结果中邀请用户参与一个爬虫网络,以提供额外的信息。通过 Sense,设备使用者可以快速访问附近对象的额外信息和内容。这些内容可以是系统或开发者已经关联至特定对象的信息,也可以是其他用户在看到某一对象后添加的订制信息。

关于不同的服务和用户如何部署及订制 Sense,以符合他们的世界观,林奇表示:“对于曾经开发过与对象有关的应用,或是编写过类似代码的人,他们会说‘我希望这能够被识别,如果你们提供来自这些来源的定义,那么他们会给予更高的优先级’。”

“你可能期望的一点是,不同的亚文化将拥有对对象的不同定义。”他指出。

探寻下一代搜索

该公司联合创始人夏洛蒂·格伦斯基(CharlotteGolunski)表示,如果这些听起来与主流应用有所差距,那么 Sense 希望解决的核心问题很简单。“我们将这些视为下一代搜索。”她表示,“我们使用搜索引擎也是基于同样的原因。”

“关于对象,我们希望找到更多信息。我们希望了解我们可能会喜欢的类似对象,以及关于某些对象的背景。我走在街头时经常会好奇:‘那栋大楼是什么?有着什么样的历史?’而当我身在国外时,我希望了解,我所看到的外国文字究竟是什么意思。随着智能可穿戴设备的发展,这些问题都将得到解决。”

“我常常会对所看到对象的更多信息感到好奇,这是一种获取信息,以及进一步发现其他信息的快捷方式。我不需要拿出手机进行搜索,浏览由一系列链接构成的列表,而是可以立即以对用户友好的方式获得这些信息,这就像是我询问与我一同散步的好友。这就是我们希望解决的问题。”

sense

Sense 的技术可以支持面部识别,不过 Neurence 目前更多地瞄准物体对象,而不是人物。自动化的实时面部识别技术将不可避免地引发严重的隐私保护争议。(以下谈到了 Sense 的隐私保护问题。)

在通过 Sense 成功识别对象之后,用户可以启动一系列可配置的操作,例如通过电商网站购买同样的物品,或是播放一段关联的视频,以及使用电影海报触发可立即观看的电影预告片。这是 Neurence 计划中 Sense 平台未来的商业化模式,例如通过关联链接或推广链接。(不过,在目前的起步阶段,商业化还不是 Sense 考虑的一个问题。)

正如以上所述,这些操作可以由用户订制,从而满足他们不同的需求和嗜好。其中一个例子是,当可穿戴计算设备感知用户来到一个汽车站或火车站时,将实时拉取交通信息,使用户不必再手动打开应用并检查。

开发者也可以自行决定,如何将 Sense 集成至自己的应用和设备,随之而来的应用也将有所不同。格伦斯基表示,开发者最初的兴趣在于购物和房地产等使用场景,例如将房屋照片变为动态旅程。

Neurence 已经开始与谷歌合作,利用 Sense 技术开发一款谷歌眼镜应用。该公司也在与三星合作,在其 GalaxyGear 2 智能手表之上进行开发(这款智能手表配备了摄像头)。这两款应用都还没有发布,但该公司向 TechCrunch 进行了展示。目前,该公司总共与 6 家设备商进行了合作,并表示渴望与更多设备商结为合作关系。

通过 Galaxy Gear 2 上的 Sense 应用,用户可以将设备的摄像头指向某一对象,例如一本书。一旦系统识别出这一对象,那么一个红点将出现在屏幕上方的角上。点击这一红点,你就可以看到这一对象的更多信息,而随后的一系列操作可以帮助用户进一步了解这一对象,或是进行购买。

以下这段视频演示了谷歌眼镜上的 Sense 应用。当用户看向某一物体时,这款应用帮助用户获取该物体的相关信息。随后,他们可以使用额外的语音命令,通过谷歌眼镜与 Sense 互动,并访问关联至这一被识别物体的数字内容。

Neurence 创立于去年,不过该公司使用的算法和底层的机器学习技术出现时间稍早。该公司联合创始人詹姆斯·洛克萨姆(James Loxam)博士曾在剑桥大学学习,并创立了一家公司,尝试将其博士研究期间开发的机器学习技术商业化。这家创业公司获得了林奇的 Invoke Capital 的 400 万美元投资(林奇的博士研究也是关于计算机视觉技术)。Neurence 的另一名联合创始人格伦斯基则是 Autonomy 的前员工。

林奇表示,计算机视觉和机器学习技术的开发意味着计算机可以识别现实世界中的对象,而这一领域近年来有了明显的进展。支持用户选择方向并对准感兴趣目标的摄像头,例如 Sense 的使用场景,也使得识别工作变得更简单。在这一技术发展的同时,移动硬件也实现了长足的进步,获得了更强大的处理能力,以及质量更高、配备自动对焦和防抖技术的摄像头。

从需求方面来看,考虑到可穿戴计算技术仍然很年轻,而文字输入仍是移动数字活动的关注重点,因此很明显我们还有很多工作要做,才能吸引更多用户使用对象识别搜索平台。

不过,Neurence 的着眼点在于,互联网、可穿戴计算设备,以及互联设备的发展意味着,将有更多用户需要一种界面,去搜索周围的现实世界。这种界面应当无需再使用手动输入,而这正是 Sense 智能性的体现。(其他一些创业公司也在研究计算机与现实世界的互动,例如 Magic Leap。)

“这是一个长期项目。”林奇表示,“你可以想象,各类对象都将有这样的智能性。它们可以使用这些智能性,并相互交换信息。这是下一代互联网基础的一部分,因此我们需要投入一些赌注。我们打赌,永远在线的网络连接将会到来。我们需要这样的技术,这毫无疑问。我认为,就我们关注的时间范围来看,这是一次相对安全的打赌。”

“(在 Sense 的演示中),你所看到的与人们在 40 年代首次看到电视机画面类似。不过我认为,与照相机类似,可以肯定,分辨率等性能将会越来越好。”他同时指出。

林奇设想,最早一批基于 Sense 的应用将会很有目标性,例如专注于购物功能的智能手表应用。而随着更美观、用途更广的第二代智能眼镜的发展,这些应用将会得到更广泛的接受。除此之外,他预计,在未来 5 年时间内,随着互联设备推动物联网的发展,以及智能界面变得越来越必要,需求将会出现大爆发。

林奇表示:“你将会有许多智能设备,而这些设备都需要面对这样的问题,并在彼此之间交换信息,这就是这一理念形成的开始。”他认为,对于下一代智能系统,Sense 是一种“令人不可思议的”使能工具。

“如果你想要一种系统,可以知道你的奶奶是否在家中摔倒,那么设备需要很智能。而如果你希望一种系统去降低自动驾驶汽车的事故发生率,那么你也需要这样的智能性。”他表示。

“小兄弟”的窥探之眼

这里还有另一个重要问题需要考虑:随着应用的广泛传播,以及自适应实时识别技术的发展,人们是否会习惯于随之而来的隐私保护困境。

公众对谷歌眼镜最初的反应表明,许多人实际上完全不习惯于具备可视监控功能的可穿戴计算设备。在可穿戴计算设备发展的过程中,这样的不习惯是否会继续存在,这仍然值得关注。

Sense 可以帮助互联设备实时理解周围环境发生了什么。因此,如果这类技术逐渐流行,尤其是当面部识别技术被激活时(目前这一功能被关闭),那么将带来明确而严重的隐私保护问题。

林奇表示,如果将这样的技术置于许多人的手中,那么这时的情况并不是“老大哥在看着你”,而是“小兄弟在看着你”。这样的“小兄弟”将无所不在。

当我抛出关于隐私保护的问题时,林奇表示:“在这样的一个世界里,作为一名用户你有能力随时查找信息。例如,无需花费太多精力,你了解周围信息和周围人的能力就会有大幅提升。这带来了一些有趣的问题。这与城市中心闭路摄像头带来的问题没有太大不同,但只要没有人能查看这些信息,没有人能够分析及关注,那么这样的问题并不会很严重。”

“不过,当你开始看到这些能够理解摄像头前方所发生事件的机器学习技术,而某人走到下一个摄像头时发现了这一点,那么是的,社会需要去关注某些问题,以及希望如何处理这样的问题。”

林奇承认,规模更大的社会大讨论即将到来。不过他同时认为,联网技术已经无情地占据了一定位置,因此目前的问题仅仅是,我们将如何使用这样的技术。无论怎样,传感技术都在到来,即使 Sense 本身未能成为一个热门的平台。

“关于隐私保护,人们没有真正理解的一点在于,我们正在进入这样一个世界:理解能力即将工业化。因此这将带来问题,我们需要进行思考,以及这应当如何完成。”他表示,“我们需要研究,我们希望强大的技术如何被应用在这一领域。”

“魔鬼已经从瓶中被放出。事情已经发生。每天都会有新的应用诞生,这些应用越来越智能,能够更好地理解围绕它们发生了什么。人们忽视的一点在于,这并不仅仅是单个应用或单个手机的力量,而是在于,当你通过社交媒体联网,而你在城市中有 3000 个节点时,你将会获得数据融合效应,这将非常强大。”

“我在这里的立场并不是做出价值评判。我并不是说,哪一种更好,哪一种更坏。你可以站在两种立场之一,但这是不可避免的。”他表示。

翻译:维金(@LiWei

Neurence’s Cloud Platform Gives Wearables Eyes That Can See And Ears That Can Hear

blog comments powered by Disqus