电子说
此前,AI科技大本营曾报道过奖金池高达 300 万元的 AI Challenger 2018 比赛。与往届不同,今年的比赛共有 5 个主赛道,5 个实验赛道。
其中,5 个主赛道的数据集包括:观点型问题阅读理解数据集、细粒度用户评论情感分析数据集、英中文本机器翻译、多标签短视频分类数据集、以及自动驾驶数据集。
5 个实验赛道的数据集包括:基于北京气象局3年气象数据的天气预报竞赛,世界上首个农作物病害检测竞赛和数据集,国内首个眼底病变医学图像检测竞赛和数据集,以 3D 虚拟图像训练机器“认识”真实世界物品的竞赛和数据集,让机器借助辅助知识学习从未见过的新概念的首个国际性零样本学习竞赛和数据集。
如今 AI Challenger 2018 已经进入第二阶段,AI科技大本营有幸采访到了创新工场人工智能工程院执行院长 王咏刚,中国气象局北京城市气象研究所副所长 陈敏,以及上海新客科技创始人 刘新农,让我们得以对这个比赛的意义有更深的了解。
天气预报竞赛
▌意义和影响
气象要素(如风、温度、湿度等)的变化,深刻影响着人类生活的各个方面。因此,准确预报未来气象要素,可广泛服务于人们日常生活(如穿衣着装),交通运输(如航班起降),工业(如风能发电),和农林畜牧业(如水产养殖),致灾天气避险(如台风预警),突发事件应急处理(如化工原料泄漏)等领域。
随着人们生活水平的提高、生活方式的丰富,传统天气预报方式也正在遇到越来越大的挑战。AI Challenger 2018 联合中国气象局北京城市气象研究所,也是希望探索传统气象+人工智能能不能提高天气预报的准确性。
实际上,人工智能技术在气象界很早就开始用了。对气象学家来讲,这不是最新的方法,但是真正用到日常还非常少。为什么?
首先,AI 工程人员缺少数据集,找不到很客观的评测标准,也缺乏基于 AI 预测天气的成体系的论文或者学术例文,基本是上从零开始;其次,天气预报涉及到的数据维度和数据因子,要远多于此前比较成功的 AI 应用领域;最后是普适性的问题,在天气预报方法领域,有太多极端的情况,任何一个方法的推出,都要经过所有的考验,最后才能真正大规模地实际应用。
因此,这个比赛是向外探索的第一步,担任着验证未来可能性的使命。
▌数据集和赛程
据介绍,本次 AI Challenger 平台上开放的北京市气象数据集,由北京市 10 个气象站点,共 3 年多的逐小时历史“观测”和“睿图”资料组成。“观测”集包含 9 个地面气象要素,通过气象仪器实时监测得到;“睿图”集包含地面和特征气压层共计 29 个气象要素,由数值预报模式在超级计算机上运算产生。两者区别为:前者仅记录当前气象要素实况;后者可预测未来 36 小时内气象要素估计值,但存在误差。
这是北京市气象局首次公开发布的气象数据集,其时间跨度长且密度高,包含气象要素的实况和预报两部分,对提高天气预报准确性具有重要作用。AI Challenger 的参赛选手获得与气象局相同的数据,双方同时对天气进行预测,并与随后的真实情况作比对。
下载地址:
https://challenger.ai/dataset/wfd2018
天气预报竞赛目前已经进入到决赛阶段,选手需要连续 7 天每天对天气进行预测,并以最终的总成绩决定排行榜,前五名将进入 12 月 18、19 日在北京进行的 AI Challenger 总决赛答辩与颁奖。
农作物病害检测竞赛
▌意义和影响
我国是农业大国,农业与我们的生活息息相关,而农作物病害对农业影响巨大。据中国统计年鉴,2016 年,全国农业生产总值达 5.93 万亿元,占 GDP 的 8.0%,而由农业病害等灾害造成的直接损失达 0.503 万亿元,占农业生产总值的 8.48%,可见农业病害防治对于农业生产乃至国家经济都至关重要。
目前,大部分农民依赖于经验,而现在新生代的农民的经验是不足,看错病跟用错药的现象更为普遍了。因此通过人工智能的方法,对农作物进行准确的病害识别并推荐合适的防治措施,创造出能为植物看病的“植物医生”,可以挽救作物的生命,保证作物的产量,并减少农药的用量。
▌数据集和赛程
据介绍,整个农作物病害检测竞赛的数据集有标注图片 50,000 张,包含 10 个物种(苹果、樱桃、葡萄、柑桔、桃、草莓、番茄、辣椒、玉米、马铃薯),27 种病害,合计 61 个分类(按“物种-病害-程度”分)。数据集随机分为训练(70%)、验证(10%)、测试 A(10%)与测试 B(10%)四个子数据集。其中,训练集有 32739 张图片,验证集有 4982 张图片,测试集 A 有 4959 张图片,测试集 B 有 4957 张图片。
全部0条评论
快来发表一下你的评论吧 !