电子说
谷歌AutoML是一个基于谷歌在图像识别领域的最新研究成果——神经架构搜索( Neural Architecture Search,NAS )开发而成的机器学习云软件工具包。NAS作为算法,面对给定的特定数据集,它会搜索最合适的神经网络来对该数据集执行特定任务。
AutoML是一套实现机器学习的工具,可以轻松地训练高性能的深层网络,而不需要用户掌握任何深层学习或人工智能知识,你要做的所有事只是给数据贴上标签。Google将使用NAS为你的特定数据集和任务找到最佳神经网络,这种方法比人类手动设计神经网络表现的更加出色。
它具有可以提供个性化的机器学习模型,用户需要做的就是提供你需要训练的数据。在图形化的界面下整个流程十分容易上手,完全改变了过去复杂的研究过程。同时所有的机器学习技术都是最先进的,你可以在这里用最棒的技术训练出先进的算法。
AutoML完全改变了整个机器学习的游戏规则,面对许多应用程序APP,不再需要专门的技能和知识。许多公司只需要选择合适的深度网络来完成更简单的任务,例如图像分类、语音识别和文本处理。届时他们不再需要雇佣5个机器学习博士,而只要雇佣一个能够操作鼠标和组织数据的人。
目前只有很少的一部分企业拥有研究和部署机器学习和人工智能业务的能力。只有很有限的一部分人能够创造先进的机器学习模型。即使是一家已经开始涉足人工智能的公司,依旧需要大量的努力来建立时间紧迫过程复杂的定制化机器学习需求。虽然市面上有很多包含预处理模型的API提供,但将AI带给每一个人还有很长的路要走。
但AutoML弥补了人工智能在应用上的不足和技术的限制,并使更多的企业更好的利用AI并从中受益。它可以帮助经验有限的公司利用自己的数据来通过最为先进的机器学习技术来建立定制化的模型。这一技术不仅可以提高机器学习专家的生产力,更帮助缺乏经验的工程师们构建出他们梦想中的强大AI系统。
毫无疑问,企业使用“人工智能”的方式将会发生巨大转变。但究竟是如何变化的呢?这种变化对谁有利?那些深度机器学习领域的人会怎样呢?这篇文章将详细分析Google的AutoML以及软件2.0带来的变化,对机器学习领域的企业和开发人员意味着什么。
AutoML发展越快,企业要投入的研发越少
人工智能领域的许多企业,尤其是初创企业,在深度学习的背景下,都在做相对简单的事情。这些企业大部分的成果价值来自于它们最终组合出来的产品。例如,大多数计算机视觉初创公司都在使用某种图像分类网络,这实际上将是AutoML在该工具包中的第一个入门工具。事实上,作为当前最先进的图像分类网络,Google的NASNet已经在TensorFlow中公开了代码。现在,企业可以跳过产品开发流程中的复杂的实验研究步骤,只需把学习神经网络转移过来去完成他们设定的目标任务即可。由于实验研究减少,因此可以将更多的业务资源用于产品设计、开发和重要的数据处理。
说到这里,下面就要唠一唠产品。
产品体验变得更加重要
由于更多的时间花在产品设计和开发上,公司将会加快产品更新换代的速度。公司的主要价值将会更多的体现在他们的产品或技术有多好用方面。产品设计得够好吗?使用够方便吗?数据流程的设置方式是否能够快速轻松地改进模型?这些新的问题将是公司优化其产品并能够比竞争对手更快的更新产品的关键所在。尖端研究也将不再是提高技术性能的主要驱动力。主要的驱动力变成了数据和资源。数据和资源变得至关重要
如果研究变成公司中不那么重要的一部分,那么一个公司要如何脱颖而出呢?如何在竞争中鹤立鸡群呢?当然,销售、市场营销以及我们刚才讨论的产品设计都非常重要,但是,这些深度学习技术表现的巨大驱动因素是数据和资源。拥有的针对任务的数据越干净、越多样化 (兼顾质量和数量),就越能使用诸如AutoML等软件工具来改进模型。这意味着获取和处理数据需要大量资源。所有这些都部分地表明了我们正在脱离编写大量代码的繁杂生活。
软件2.0 : 深度学习成为大多数人工具箱中的另一个工具
使用谷歌AutoML,你要做的就是上传已经标签好的数据,这样就万事俱备了!对于那些对这个领域理解不深需求也不深的人来说,他们只是想借用这种技术的杠杆力量,来撬动更大的成果。深度学习的应用APP变得更容易获得。在工具包中使用更少的编码,就可获取更多的使用工具。事实上,对大多数人来说,深度学习只是工具箱中的另一个常规工具罢了。Andrej Karpathy在sofeware 2.0上写了一篇很棒的文章,讲述了辛苦的码农如何从编写大量代码转向更多的进行产品设计和使用工具的,然后让AI完成其余的工作。
但是,这一切还需要创新科学和科研。
创新科学和研究仍有重要的空间
尽管有了这些易于使用的工具,但发展的进程并没有结束。就像当汽车被发明出来时,我们也没有停止继续开发它们,即使现在它们已经变得很高级了,我们还在不停的研发。人工智能还有很多可以提升的空间。比如AI还不够有创造力,也不会推理,也不能处理复杂的任务。它需要海量的标记数据,而获取这些数据耗时又耗钱。训练仍然需要很长时间才能达到最高精度。深度学习模型的性能对于一些简单的任务(如分类)是很好使的,但是在本地化等方面只是表现的尚可,有时甚至很差(取决于任务的复杂性)。我们甚至都没能从内部深入了解深层网络。
所有这些都为科学和研究提供了施展拳脚的空间,特别是为当前人工智能技术的推进提供了机会。在商业方面,一些公司,尤其是科技巨头(如谷歌、微软、Facebook、苹果、亚马逊)需要通过科学和研究去创新现有的工具来和其他公司竞争。这些公司确实都可以获得大量的数据和资源,设计出出色的产品,进行大规模的销售和营销等,他们确实可以利用这些资源使自己在这场竞争中木秀于林,而这些竞争优势也可以来自于尖端的创新。
然后还留下最后一个问题~
Good or Bad?
总的来说,创造人工智能技术的这种转变是一件好事。大多数企业将利用现有的机器学习工具,而不是去创建新的工具,因为也确实没必要这样做。接近尖端的人工智能对许多人来说不再高不可攀,这意味着对所有人来说这都是一项更好的技术。人工智能也是一个相当“开放”的领域,例如Andrew Ng这样的行业内的大咖创造了非常受欢迎的课程来教授人们了解这一重要的新技术。让事情变得更容易理解有助于人们向快节奏的技术领域过渡。
这种转变以前也发生过很多次。计算机编程从汇编级编码开始。后来转到了C语言这样的代码。今天很多人认为C语言太复杂了,所以使用c++。很多时候,甚至不需要像c++这样复杂的东西,所以只需要使用Python或R的超高级语言。如果你不需要一些超低级别的东西,那么你就没有必要使用它(例如C代码优化、从零开始的深度网络的研发),而且可以简单地使用一些更高级别的和内置的东西(例如Python、迁移学习、AI工具)。
与此同时,在人工智能技术的科学和研究方面继续努力至关重要。我们一定可以通过设计基于人工智能的新产品为世界带来巨大的价值。但这需要新的科学来推动。人类的创造力永远是宝贵的。
全部0条评论
快来发表一下你的评论吧 !