精选全球机器学习和AI领域的10篇热门报道

电子说

1.3w人已加入

描述

本文精选了过去一个月内全球机器学习和AI领域的10篇热门报道,内容既包括算法和技术上的突破,也有独树一帜的观点和建议,还涵盖一些名校的AI课程资源和资料,值得AI爱好者和从业者收藏参考借鉴。

1、OpenAI的技术可能让大规模生成以假乱真的假新闻

OpenAI训练了一个神经网络,却不愿意共享。为什么?这个神经网络能够凭借单个句子中生成完全的假新闻。换句话说,这可能成为批量生成假新闻的一种工具。

本文介绍了OpenAI训练神经网络时获得的结果,给出了用该网络预测超过40GB文本的下一个单词时的结果,结果很理想,但问题是:如果这些技术落入坏人之手怎么办?

OpenAI决定不与分享这些结果,理由是“这些成果可能成为对此类问题担忧的早期开端”。确实,这是一个既存在潜在威胁,又容易被大部分人接触到的案例。而且我认为,这个决定绝对是迈向负责任的人工智能技术的一步。

文章链接:

https://openai.com/blog/better-language-models/

2、如何发现假新闻的内在模式?

目前,对抗假新闻成为越来越重要的话题。本文介绍了利用AI“去伪存真”的技术和所面临的障碍。

目前,在一些特定的障碍中,由文章主题频率引起的偏差是最重要的。事实上,包含“特朗普”或“克林顿”的词语更可能是假新闻。训练神经网络以便他们能够有效地执行未知主题是这里的真正挑战。

本文推广了一个重要的主题,在我看来,每个人都应该对此引起重视。

文章链接:

https://news.mit.edu/2019/opening-machine-learning-black-box-fake-news-0206

3 、为什么将数据科学应用在生产领域这么困难?

如果企业能够有效地将数据科学成果融入现有业务流程,那么数据科学可以为公司带来真正的价值。这就是作者的观点,他在文章中解释了为什么数据科学很难实现高效应用。

数据科学对资源方面要求很高,因此,开发人员和运营部门必须共同努力,快速为客户带来稳定的新功能。在我看来,打破工作团队中的孤岛效应,并让整个公司参与自动化决策主题达成这一目标的必要条件。

此外,作者关于IT基础设施部署效率问题的表述是在生产领域成功应用数据科学的关键。

文章链接:

https://www.datascience.com/blog/why-is-it-so-hard-to-put-data-science-in-production

4、数据科学的职业内容已经不像你想的那样了!

机器学习

这篇文章行文直截了当。现在,人们常常对数据科学家的日常工作存在某些误解。澄清这一问题,对于目前在刚刚在该领域迈入职业生涯的大量年轻数据科学家来说是尤为重要事情。你们想错了!对于数据科学家而言,仅仅掌握一些最先进的算法是不够的。

不过,解决这个问题仍然有希望!这篇文章就给出了掌握数据行业以及作为数据科学家必备的技能。我真的很喜欢作者对工作的诚实态度。天下没有免费的午餐,所以你需要努力工作和耐心。

然而,通过逐一处理真正的问题,你的进步可能比你想象的要快。 “永远不要让炒作压倒你。”

文章链接:

https://veekaybee.github.io/2019/02/13/data-science-is-different/

5、利用机器学习提升风能发电的价值

机器学习

“涡轮机的成本已经大幅下降,使用率也已经大幅上升”。所以,DeepMind目前提高风力发电价值的条件已经初步成熟。为了实现这个目标,深度学习可能会大展身手。

利用深度学习算法,准确预测风力和风向,可以让涡轮机所有者优化在电网中的部署情况。然后,根据预测结果做出的规划越细致,单位风能所能创造的价值就越多。

这篇文章简洁而高效,文中给出了DeedMind的机器学习算法让风力发电实现增值的不同步骤和背景,提出了鲜明的论点。这里要给无碳技术点个赞!

文章链接:

https://deepmind.com/blog/machine-learning-can-boost-value-wind-energy/

6、深入研究并了解神经网络的工作原理

本文的基础是另一篇展示神经网络的文章,该网络可以生成美丽的颜色组合。在他重现他在互联网上发现的一篇文章中,作者遇到了导致图像质量不佳的几个问题。

因此,他在本文中介绍了自己解决这个问题的一些步骤,并提供了一些中间结果和假设。

Jupyter Notebook提供了构建自己的神经网络并改进网络性能的一些指导意见,从现在开始,你就是艺术家了!

文章链接:

https://towardsdatascience.com/making-deep-neural-networks-paint-to-understand-how-they-work-4be0901582ee

7、利用TensorFlow代码示例介绍深度学习

对于想要开始使用TensorFlow的人来说,这篇文章是必读的。作者讨论了从MLP到深度强化学习的7种架构范例,最重要的是,提供了实现其中每一种的代码示例。

本文以非常清晰和教学化的方式介绍了MIT深度学习的课程材料。

文章链接:

https://medium.com/tensorflow/mit-deep-learning-basics-introduction-and-overview-with-tensorflow-355bcd26baf0

8、AlphaStar:《星际争霸II》制霸之路

近年来,视频游戏迅速成为机器学习算法的热门领域。 《星际争霸》成为众人瞩目的焦点,这是一款非常成功且极具挑战性的游戏。对算法而言,难点包括非完全信息、需要短期和长期战略的组合,行动指令和行动效果之间存在延迟等。

本文首先简要描述了学习阶段使用的神经网络,然后通过可视化和交互式原理图详细介绍了网络学习路径。

此外,将AlphaStar的AI的游戏方式与真实玩家的游戏方式进行比较真的很有趣。可以看到,算法在一些有趣的领域中超越了人类玩家水平,如APM、多线操作等。

文章链接:

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

9 、给神经网络做个“显微手术”

本文介绍了一个简单但很棒的想法,可以手动修复有偏见的神经网络。

MIT的研究人员研究了一种工具(NeuroX),对受过语言翻译训练的神经网络的神经元进行排序。此排名的目标是衡量每个神经元在翻译过程中的重要程度。

消融一个重要的神经元会大大降低网络的性能,而消融一个不那么重要的神经元几乎对性能没有什么影响。在对抗网络训练中的偏见时,这个工具的作用更加具体。它试图找出排名最高与识别性别有关的排名最高的神经元,然后:祝贺,你的神经网络不再有性别歧视了!

文章链接:

http://news.mit.edu/2019/neural-networks-nlp-microscope-0201

10、优步的数据工作流程的规模化管理

优步公司每天生成的原始数据量超过100PB。因此,公司需要能够在运营团队和机器学习工程师之间共享可靠、可扩展、可维护的系统。为此,优步开发了Piper,这是一款集中式工作流程管理系统。

本文清楚地介绍了优步对此工具进行的迭代改进,相信这些改进应该会引发任何应用数据系统的人的浓厚兴趣。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分