AutoML 取得最新进展 深兰科技推助复杂场景下智能化应用

下一篇文章

FCC 否决中国移动参与美国电信系统

2019 年亚太知识发现和数据挖掘会议(PAKDD)在澳门落下帷幕,会议上公布了 PAKDD 2019 AutoML3+ 挑战赛最终获奖名次和团队:深兰科技 DeepBlueAI 团队斩获第一名,由微软亚洲研究院、北航组成的 ML Intelligence 团队位居二名,由清华大学组成的 Meta_Learners 团队获得第三名。

作为数据挖掘和知识发现领域历史最悠久,领先的国际会议之一,PAKDD 2019 也是一次全球范围内专注 AutoML 的比赛。据官方公布的资料显示,此次挑战赛共吸引了来自加拿大、美国、澳大利亚、印度、中国等 46 个国家(地区)的 130 支团队参与,而来自中国的企业、高校组成的队伍包揽比赛前三名。

Feedback phase 排行榜

从排行榜来看,本次比赛在五个不同任务数据集上以 AUC 作为评分指标,五个任务的 Rank(在所有队伍中的排名)值进行平均作为最后的排名依据。位居榜首的深兰科技 DeepBlueAI 团队在 Feedback phase 的 5 项测试任务中斩获了 4 项第一、1 项第二的成绩,微软亚洲研究院、北航组成的 MLintelligence 获得一个单项第一。

谈及为何取得在 4 项任务上平均领先第二名 1.97% 显著的领先优势(通常竞赛 TOP 队伍只能拉开千分位、万分位的差距),冠军团队表示,深兰科技是国内较早实现人工智能商业化落地的企业,不仅专注算法研究,也关注日常人工智能场景的落地化应用,为此积累了大量具有稀疏特征列和大量可能特征值的数据集,“数据分布会随着时间的推移而缓慢变化,我们要做的是如何让算法更好地去适应不同的环境。”
实验结果提高预测精准度

此次的 PAKDD 比赛中,AutoML 将自动化机器学习扩展到了多种数据类型,引入了不同类型的特征预处理以及多角度的特征工程组合,在不需要专家的干预和指导下將 AutoML 运用到更多的场景。

深兰科技 DeepBlueAI 团队表示,比赛成绩是团队长期从事数据科学、深度学习算法研发的一次有效体现,也验证了在实际应用领域的领先优势。与此同时,在近三个月的比赛过程中,各参赛团队迸发出许多有用的想法,并依此建立了有效的模型,间接的推动了 AutoML 领域的发展。

据介绍,深兰科技团队设计的终身机器学习框架通过融合不同时期的数据以及结合 DNN 和 LightGBM 的训练来自适应概念漂移,并引入了自适应采样来缓解类别不平衡,同时在一定时间间隔上让模型重复训练去适应概念漂移,实现终身机器学习。这种终身机器学习方法可以提高人工智能产品商业应用落地时对环境的自适应能力,可以真正实现人工智能算法的自我学习功能。

“根据模型学习出的好的分类器,可以用于疾病预测中,数据集和精准度比过往提高数倍。” 据获奖团队介绍,原先需要 2-3 年深度学习实现的数据集和精准度,应用了 AutoML 之后,可能只需要半个月。目前 AutoML 已经广泛应用在精准营销、金融风控、自动驾驶、疾病预测等业务场景中,做出了接近甚至超过数据科学家的模型效果,决策精准度超过人类专家规则数倍。

AutoML 难点不断被突破 深兰科技提出系统方案

继谷歌公布 AutoML vision 进入公开测试后,微软也宣布打造 AutoML 开源工具包,就在本月初,AI 公司旷视科技发布 AutoML 最新成果……如何应用 AutoML 提高人工智能的落地成为各科技大厂和人工智能企业的探索重点。

在 AutoML 的难点不断被攻克,越来越多企业视之为主流的同时,长期专注基础研究和应用开发的深兰科技提出,将把 AutoML 作为开发工具,在公司搭建的世界级核心算法平台上推出系统性的解决方案,赋能 AI 交通、AI 医疗、AI 工业、AI 社区等领域。

深兰科技的人工智能产品横跨九大领域,使用场景复杂。终身机器学习方法可以在定期收集的数据基础上,做到算法的自我更新和自我适应,从而达到人工智能产品真正的智能化和个性化,而非单一场景的智能化。与此同时,深兰科技表示会不断加大对 AutoML 的技术投入,搭建有效的模型加速 AI 技术的落地,并且通过平台助力,低成本,快速,可靠的衍生出适合企业的场景化应用,给更多的中小企业提供定制化的解决方案。