素有“数据世界杯“之誉的KDD Cup日前正式公布了KDD Cup 2019三项重大赛事

电子说

1.3w人已加入

描述

作为数据挖掘研究领域最具影响力的国际顶级赛事,素有“数据世界杯“之誉的KDD Cup日前正式公布了KDD Cup 2019三项重大赛事,包括Auto-ML Track、Regular ML Track及Humanity RL Track三场比赛,其中开赛22年以来首次引入的AutoML Competition挑战赛受到不少学术及工业界专业人士的关注。

数据挖掘

AutoML(Automated/Automatic Machine Learning,自动机器学习)旨在研究在没有专业知识的情况下、使用的低门槛甚至零门槛的机器学习算法,在AI人才紧缺的情况下,AutoML可以降低AI落地过程中对科学家的依赖,是2014年以来机器学习领域最炙手可热的研究对象之一。2018年1月,谷歌高调推出自动机器学习产品Cloud AutoML,再次将这项技术推向更多人的视野中,目前AutoML已成为国内外科技巨头关注的焦点。

由于日益受到学术界、工业界的广泛关注,NeurIPS、IJCAI等学术顶会从去年开始将AutoML视为重点。

本次KDD Cup选择将其纳入比赛内容,并为此打破历来数据挖掘方向赛事的传统,也是基于对AutoML技术发展趋势和落地价值的认可。对此,KDD Cup主席Taposh Dutta-Roy表示,AutoML是今年KDD关注的重点,也是一项AI落地的关键技术。

据了解,本次KDD Cup AutoML挑战赛由第四范式主办,微软、AutoML领域最权威的学术组织ChaLearn协办,并为此次比赛设置了“史上”难度最高的比赛项目——基于时序关系型数据的AutoML。

时序关系型数据在在线广告、推荐系统、金融市场分析、医疗等应用场景中非常常见,人们往往需要利用这样的数据去构建机器学习模型,并应用机器学习模型提升对应业务的效果。

赛事主要负责人、第四范式资深算法科学家涂威威表示这是AutoML比赛历史上首次考虑时序关系型多表数据,会重点考察AutoML在实际应用场景中的能力,应对关系型、时序等多表类型数据的挑战,探索AutoML解决实际问题的价值。竞赛已于4月1日正式拉开帷幕,挑战赛分Feedback(反馈)、Check(校验)、AutoML(盲测)3个阶段,最终根据AUC排名选出冠军团队,并在7月20日公布比赛结果。

值得一提的是,KDD Cup比赛向来由具备深厚学术积累和行业实践的顶级企业或高校承办,竞争极为激烈,历届承办方包括微软、阿里等巨头公司和卡耐基·梅隆大学等知名高校。

大数据文摘据大赛的主办资质等问题采访了本次的主办方之一——第四范式资深算法科学家、也是本次AutoML主委会成员涂威威,他表示KDD Cup每年赛事需要大家提案,组委会会根据赛事挑战性、实际应用性、赛程规划等多维度标准来筛选赛事方案。

第四范式作为首届KDD CUP AutoML大赛的主办方,将会肩负起赛事提案、数据提供、平台搭建、赛事报名招募、竞赛以及评选等全部流程重任。

“具体审核流程并不清楚,我们在KDD Cup赛事提案获得了组委会及主席的认可和信任,KDD Cup的Chair也充分表明了对AutoML应用价值的肯定。”

AI技术的发展,兴起于比赛,成功于行业,此前ImageNet赛事推动了一大批CV公司的成长,并且极大地促进了行业爆发。AutoML的产业发展延续了这个路径,此次首登“数据世界杯”的比赛舞台,KDD平台将有望吸引更多“全球最聪明的大脑”参与到AutoML进程中,AutoML或将落地于更广泛的行业和场景,迎来新的发展高峰。

对于这次新增赛题AutoML,涂威威也表示,反映了整个大行业的AI自动化趋势。因为AI人才紧缺始终是AI落地的核心痛点,自动化工具就是试图解决这样的痛点,正在成为改变目前AI科学家瓶颈以及行业应用门槛的关键技术,近年来AutoML已成为国内外科技巨头关注的焦点。

“AutoML是机器学习国际研究的前沿,需要更多的研究者参与到基础算法研究和实际落地中来,我们深知需要整个学术界和工业界一起来推动技术的进步,因此我们做了很多实际的推动,KDD Cup最终选择重点关注AutoML比赛,并引用我们的比赛作为AutoML大赛的示例与首秀,也从侧面证明了我们这几年推动的正向效果。”

最后,对于本次“史上最难比赛项目”,第四范式也为参赛者提供了一些小tip:

首先,欢迎更多对AutoML关注和有兴趣的同学参加比赛,甚至加入我们一起推动AutoML的发展,共同探索AutoML无限可能。

需要提醒参赛者提交AutoML方案是需要注意的几个关键点:

如何自动生成有效的时序信息?

如何将多个相关表信息有效整合?

如何解决数据分布随时序缓慢变化的问题?

如何自动捕获有意义的表间联系?

如何自动高效地选择合适的机器学习模型和超参数?

如何让方案更通用,即如何使其适用于未知的任务?

如何保持计算和内存成本可接受?

希望所有参赛者能在本次挑战赛中,充分展示自己的能力和风采,取得更好的成绩。当然,AutoML技术的发展还有很多更具挑战性的难题在前面等着我们,在今后比赛中我们会继续与大家一起挑战更高难度的问题,让AutoML真正大幅降低了机器学习的应用门槛,赋能非机器学习背景的人可以轻松使用。

目前,KDD2019官网已经放出了大赛的三个赛题,其中,AutoML比赛详情页面已经发布。SIGKDD-2019将于2019年8月4日至8日在美国阿拉斯加州安克雷奇举行。比赛预计将持续2-4个月,获胜者将在2019年7月中旬被通知,并在KDD会议开幕式上接受颁奖,最终在会议期间在KDD杯研讨会上展示他们的解决方案。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分