美企微软软件工程师谢恩·琼斯(Shane Jones)于今年2月初指认OpenAI的DALL-E 3模型存在漏洞,该模型可产生一系列色情内容。琼斯在公布这一问题后,竟收到微软的“封口令”威胁。尽管如此,他仍选择向外披露该漏洞。
琼斯去年底在进行自主研究时,发现OpenAI的图像生成模型DALL-E 3存在一个漏洞,漏洞利用者可以越过AI保护墙来制作色情内容。他将此情况报告给微软和OpenAI,并发文警示这种攻击可能给公众带来危害,要求他们暂停使用DALL-E 3模型或在修复漏洞之前先下线。
然而,琼斯随后收到了来自微软法务部门和管理层的压力,要求其删除领英上的相关文章且禁止对外透露信息。尽管他多次试图联系公司高层,寻求解释并解决漏洞问题,但都没得到回应。在此期间,漏洞也没有得到解决,于是,琼斯决定向媒体和相关部门公开。
琼斯亦表示,近期网络上广为传播的AI生成泰勒·斯威夫特(Taylor Swift)的不雅照片可能与此次漏洞有关。因为那些图片是根据微软的Designer AI创作出来的,其实质是用的DALL-E 3底层架构,因此在此事件中,微软对琼斯施加“封口令”的行为,无疑是种严重的失策。
对此,微软发表声明回应媒体,承认问题的存在,并承诺修复漏洞,解决员工的疑虑。同时强调,琼斯所揭示的漏洞,成功率并不高,并且技术上无法“突破所有针对该模型设定的安全措施”,至于,“这一漏洞与泰勒·斯威夫特照片的制作是否有关联,则不得而知”。
全部0条评论
快来发表一下你的评论吧 !