人工智能已渐渐成为 Facebook 网络审查员的主流

下一篇文章

留存率堪忧:近四分之一用户的第三方应用打开一次就删

人工智能已渐渐成为 Facebook 网络审查员的主流

据悉,Facebook 的人工智能系统的骚扰图片报告效率已经高于人工审核,这标志着 Facebook 在对抗社交网络骚扰方面已经取得了重大的成果。人工智能可以在恶意内容对真人造成伤害之前将其隔离。

广告收入丰厚的 Facebook 拥有充足的资金可以投入到人工智能和机器视觉的研究之中,这些技术能够帮助它更好的拦截骚扰内容。如果要让用户愿意在自己的平台上发表个人内容,Facebook 必须营造一个没有骚扰的文明交流空间。

Twitter 在阻止和应对骚扰问题方面一直 广受批评 ,它的前任首席执行官迪克·科斯托罗(Dick Costolo)在去年也 承认 “我们不擅长处理骚扰。”由于 Twitter 仍未实现盈利,因此它可以投入到人工智能研究的资源肯定不如 Facebook。尽管如此,但 Twitter 还是一直有在这方面努力。

在技术基础准备方面,Twitter 分别收购了视觉智能创业公司 Madbits 和 AI 神经网络创业公司 Whetlab。根据《连线》(Wired)的报道,它们的人工智能技术可以识别出骚扰图片,而且这个系统在过去一年的有害图片误判率仅为 7%。对于识别骚扰图片这项令人不快的工作来说,人工智能系统可以降低人手操作的需求,不过 Twitter 在封禁恶意用户之前仍然需要由进行人工审核。

一项难以忍受的工作

当恶意用户上传骚扰内容到社交网络时,通常这些内容至少会被一位用户或工作人员看到并报告为骚扰信息。违反 Facebook 或 Twitter 服务协议 的骚扰内容可包括仇恨言论、人身威胁、色情、煽动暴力、裸露图片或无端暴力。

比如恐吓者、被抛弃的旧情人、跟踪狂、恐怖分子或者煽动者可以在他人的个人主页、群组或动态消息发布骚扰图片。他们可能会上传一些报复性的不雅照片、血腥图片,以及涉及性别或种族歧视的言论。当有人看到这些内容并将其标记为骚扰信息时,它们就已经对真人造成了一定程度的伤害。

过去 Twitter 和 Facebook 非常依赖于外包合同工来完成这些工作,这些工作人员一般来自 CrowdFlower 这样的创业公司或者一些菲律宾公司。根据《连线》的报道,截至 2014 年,人工内容审查员的数量估计在 10 万人左右,其中大部分人都只能赚取大约 500 美元的微薄月薪。

 

这其实是一项需要承受巨大心理压力的工作,审查员要鉴别从儿童色情到斩首图片的各种敏感内容。他们的精神很快就会不堪重负,许多审查员都反映自己出现了类似于创伤后应激障碍的症状,现在也有一些像 Workplace Wellbeing 这样的整体健康咨询机构在为饱受心理折磨的审查员提供协助。

facebook-ai-candela

Facebook 的华金·坎德拉(Joaquin Candela)正在《麻省理工科技评论》举办的 EmTech Digital 大会上讲述人工智能技术。

如今,Facebook 的人工智能技术可以避免让真人去完成这项难以忍受的工作。AI 可以代替合同工成为骚扰内容过滤的第一道防线,每一张上传的图片在其他人看到之前都会先经过电脑的扫描,从而实现批量内容审查。

在《麻省理工科技评论》最近在旧金山举办的 EmTech Digital 大会 上,我采访了 Facebook 的应用机器学习工程总监华金·坎德拉,他是这场大会的其中一位演讲嘉宾。

他在采访中谈到了 Facebook 对 AI 的实际应用,他们有 25%的工程师会经常使用内部的 AI 平台来开发功能和运营业务。拥有 40 petaflops(每秒千万亿次浮点运算) 计算能力的 Facebook 可以同时分析数万亿的数据样本和数十亿的参数。这个 AI 系统可以用于编排动态消息的帖子,为视力障碍人士 朗读照片的内容 ,以及自动为视频广告 加入隐藏字幕 ,最后一项功能延长了 12%的广告观看时间。

Facebook的华金·坎德拉(Joaquin Candela)正在《麻省理工科技评论》举办的EmTech Digital大会上讲述人工智能技术。

Facebook 的华金·坎德拉正在演示 AI 视频人脸标记技术的研究原型

坎德拉透露 Facebook 目前正在研究如何利用 AI 自动标记在视频中出现的人脸,以及将视频即时快进至特定人脸出现的位置。Facebook 还开发出了一个能够根据主题分类视频的系统。坎德拉在讲台上演示了一个可以将视频分为猫、食物和烟火等类别的工具。

不过人工智能还有一项充满前景的应用,就是将人们从可怕的内容审查工作中解放出来。坎德拉告诉我,“值得一提的是,现在我们的 AI 算法报告的骚扰图片数量已经高于人工审查。如果这项工作可以 100%由 AI 完成的话,人们将不需要亲自鉴别这些骚扰图片。”

Facebook、Twitter 和其他平台都需要确保自己的自动审查系统不会成为极权的思想警察。如果设定了过于保守的规则,AI 系统可能会将一些具有价值的争议性艺术和自由表达排除在外。另外,跟大多数的人工智能形式一样,AI 内容审查系统也需要一定程度的人工协调。

技术成果共享

保护 Facebook 免受骚扰内容的侵袭是一项极其艰巨的工作。在近日举行的旧金山 AppliedAI 大会 上,我采访了 Facebook 的核心机器学习总监侯赛因·迈哈纳(Hussein Mehanna),并向他了解了 Facebook 的人工智能平台 Facebook Learner 的情况。

迈哈纳告诉我,Facebook 每分钟会产生 40 万条新帖子,而名人和品牌的公开帖子每分钟会新增 1.8 亿条评论。因此迈哈纳表示,除了图像以外,Facebook 的 AI 也在尝试理解文本的含义。

AI 最终将能帮助 Facebook 应对仇恨言论问题。今天,Facebook 连同 Twitter、YouTube 和微软达成了一份 新的仇恨言论规则 。以后 针对违反这份规则 的仇恨言论,这几家平台将会在 24 小时之内删除这些内容。利用计算机的能力似乎能够更好地保证这个时间限制。

Facebook的华金·坎德拉正在演示AI视频人脸标记技术的研究原型

Facebook 的侯赛因·迈哈纳正在 Applied AI 大会上演说

同样的 AI 平台不仅能够用于保护 Facebook,它能拦截的也不只是内容不当的图像。

“Instagram 是完全建立在这个平台之上的。我听说他们非常喜欢它。”迈哈纳告诉我,“WhatsApp 和 Oculus 也用到了这个平台的一部分。”

Instagram 对 AI 内容审查的应用是显而易见的,不过用户在 WhatsApp 上分享的图片数量也非常庞大。未来我们在 Oculus 上的虚拟现实体验也会得到 AI 内容审查的保护,届时我们就无需担忧自己身处的虚拟环境会出现骚扰内容。

不过 Facebook 正在联合其他公司共同对抗社交网络上的骚扰内容,同时解救那些精神饱受折磨的审查员。

“我们会公开分享自己的研究成果。”迈哈纳讲述了 Facebook 是如何分享和 开源自家的 AI 技术的 。“我们没有把 AI 看成是打倒其他公司的秘密武器。”

其实 Facebook 从一年前就开始邀请来自 Netflix、谷歌、Uber、Twitter 和其他技术巨头的团队共同讨论 AI 应用。迈哈纳表示 Facebook 已经进行了四、五次定期的技术交流会,“我们确实向他们分享了我们的 AI 系统的设计细节,”同时也会向这些同行技术团队吸取反馈意见。

在2016年的F8大会上,马克·扎克伯格将AI视觉和语言列入了Facebook未来10年的发展路线之中

在 2016 年的 F8 大会上,马克·扎克伯格将 AI 视觉和语言列入了 Facebook 未来 10 年的发展路线之中

“我们想向整个社区和全世界推广 AI 技术,因为它将会影响到更多人的生活。”迈哈纳重申道。乍看之下,这似乎是一个不当的策略,Facebook 为什么要把自己花费大量时间和资金换来的研发成功拱手让给其他竞争对手呢?

对于开源,迈哈纳跟坎德拉和 Facebook 的其他成员有着同样的看法。“我个人认为这不是一个成王败寇的局面,我们其实可以实现互利共赢。如果我们为全世界带来最先进的 AI 技术,我们最终肯定能从中获益。”

如果 Facebook 不共享自己的技术,它当然可以在人工内容审查方面拥有一定的成本优势。然而,Facebook 对外分享自身基础技术的举措让我们可以将这些脏活交给计算机来完成。

翻译:关嘉伟(@consideRay

Facebook spares humans by fighting offensive photos with AI

blog comments powered by Disqus