微软封禁员工讨论OpenAI DALL-E 3模型漏洞

描述

  美企微软软件工程师谢恩·琼斯(Shane Jones)于今年2月初指认OpenAI的DALL-E 3模型存在漏洞,该模型可产生一系列色情内容。琼斯在公布这一问题后,竟收到微软的“封口令”威胁。尽管如此,他仍选择向外披露该漏洞。

  琼斯去年底在进行自主研究时,发现OpenAI的图像生成模型DALL-E 3存在一个漏洞,漏洞利用者可以越过AI保护墙来制作色情内容。他将此情况报告给微软和OpenAI,并发文警示这种攻击可能给公众带来危害,要求他们暂停使用DALL-E 3模型或在修复漏洞之前先下线。

  然而,琼斯随后收到了来自微软法务部门和管理层的压力,要求其删除领英上的相关文章且禁止对外透露信息。尽管他多次试图联系公司高层,寻求解释并解决漏洞问题,但都没得到回应。在此期间,漏洞也没有得到解决,于是,琼斯决定向媒体和相关部门公开。

  琼斯亦表示,近期网络上广为传播的AI生成泰勒·斯威夫特(Taylor Swift)的不雅照片可能与此次漏洞有关。因为那些图片是根据微软的Designer AI创作出来的,其实质是用的DALL-E 3底层架构,因此在此事件中,微软对琼斯施加“封口令”的行为,无疑是种严重的失策。

  对此,微软发表声明回应媒体,承认问题的存在,并承诺修复漏洞,解决员工的疑虑。同时强调,琼斯所揭示的漏洞,成功率并不高,并且技术上无法“突破所有针对该模型设定的安全措施”,至于,“这一漏洞与泰勒·斯威夫特照片的制作是否有关联,则不得而知”。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分