使领域专家能够执行数据科学对业务有明显的好处。但是,这不是一夜之间发生的事情。随着组织开始将数据分析工具交到其领域专家手中,挑战可能会出现,包括向持怀疑态度的人展示数据分析的价值。准备好应对这些挑战将使项目向前发展,并使批评者陷入困境。
新技术的学习曲线
挑战:数据分析领域的创新步伐非常快,每一项新技术都有自己的学习曲线。在许多情况下,原始技术是由计算机科学家开发的,目标受众也是具有非常强大的编程技能的人。这些软件包是用许多不同的编程语言实现的,所以对于那些不全职编写代码的人来说,学习曲线非常陡峭。
溶液:具有领域知识的工程师应该寻找能够让他们快速启动和运行的工具,最好是在他们已经熟悉的计算平台中。像MATLAB中的那些点击式应用程序可以作为这些工程师的简单起点。除此之外,通常需要一个编程接口来微调分析,以提高稳健性和准确性。如果企业认真对待数据分析,他们也应该寻找培训课程,这些课程可以帮助工程师比从反复试验中学习更快地成长。
数据分析领域的大量前沿研究创造了一波有可能颠覆性的新技术浪潮。然而,在那股浪潮之后,成功的工具出现了,这些工具对于具有领域知识的工程师来说已经足够通用。
工程师或数据科学家:谁做什么?
挑战:组织正试图确定“谁是做这项工作的正确团队?虽然数据科学家通常在机器学习方面具有很强的背景,但他们通常对业务及其产品的来龙去脉很陌生或不熟悉。工程和科学团队对业务及其产品有了解,但可能没有机器学习的经验。
溶液:一个常见的折衷方案是将具有领域知识的工程师与数据科学家配对,以利用他们的各自优势,但在许多情况下,这可能是不可能的,因为领域专家远远多于数据科学家。另一种解决方案是采用工具,同时降低机器学习的标准(对于领域专家)并提供灵活性和可扩展性(对于数据科学家)。在实践中,这意味着采用一种既具有图形界面(即应用程序)又具有编程语言的工具。
即使数据科学小组在组织内不断壮大,数据科学工作也将继续由具有领域知识的工程师和数据科学家完成。两者都将在企业成功采用数据分析方面发挥重要作用,因此创建一个可以进行协作的环境是关键。
分析最终会在哪里结束?
挑战:如果成功开发的分析或机器学习模型无法与业务的系统、产品和服务集成,则其对业务的价值有限。这可能意味着将分析与IT组织维护的服务器集成,或将分析部署到嵌入式设备(例如物联网系统中的边缘节点)。
传统上,分析是在适合研究和开发的工具中开发的,但不适合在生产中运行分析,因此分析必须重新编码为不同的编程语言,然后才能部署。此过程通常需要数周到数月,并且可能会引入错误。
溶液:用于开发分析的平台提供了打包算法以在不同生产环境中运行的方法。寻找一种工具,该工具可提供集成路径和应用程序服务器,以便与常见 IT 系统配合使用,并且还面向嵌入式设备。例如,MATLAB 提供了部署路径,用于将分析与 IT 系统中常用的编程语言(例如 Java 和 .NET)集成,以及将分析转换为可在嵌入式设备上运行的独立 C 代码。这两个部署选项都可以通过点击式界面访问,这使得它们对具有领域知识的工程师具有吸引力。通过自动执行将分析转换为在生产系统中运行的过程,这些工具可显著缩短设计迭代的时间。
使领域专家能够将机器学习和其他数据分析技术应用于其工作的技术将继续存在。它们为工程团队提供了令人兴奋的创新机会 - 无论是在设计工作流程还是他们创造的产品中。数据科学家的短缺似乎不会很快得到解决。领域专家将在填补这一空白方面发挥关键作用。他们对业务及其生产的产品的了解使他们能够很好地找到应用数据分析技术的创新方法。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !