微软封禁员工讨论OpenAI DALL-E 3模型漏洞

微云疏影 2024-02-02 1240

　　美企微软软件工程师谢恩·琼斯（Shane Jones）于今年2月初指认OpenAI的DALL-E 3模型存在漏洞，该模型可产生一系列色情内容。琼斯在公布这一问题后，竟收到微软的“封口令”威胁。尽管如此，他仍选择向外披露该漏洞。

　　琼斯去年底在进行自主研究时，发现OpenAI的图像生成模型DALL-E 3存在一个漏洞，漏洞利用者可以越过AI保护墙来制作色情内容。他将此情况报告给微软和OpenAI，并发文警示这种攻击可能给公众带来危害，要求他们暂停使用DALL-E 3模型或在修复漏洞之前先下线。

　　然而，琼斯随后收到了来自微软法务部门和管理层的压力，要求其删除领英上的相关文章且禁止对外透露信息。尽管他多次试图联系公司高层，寻求解释并解决漏洞问题，但都没得到回应。在此期间，漏洞也没有得到解决，于是，琼斯决定向媒体和相关部门公开。

　　琼斯亦表示，近期网络上广为传播的AI生成泰勒·斯威夫特（Taylor Swift）的不雅照片可能与此次漏洞有关。因为那些图片是根据微软的Designer AI创作出来的，其实质是用的DALL-E 3底层架构，因此在此事件中，微软对琼斯施加“封口令”的行为，无疑是种严重的失策。

　　对此，微软发表声明回应媒体，承认问题的存在，并承诺修复漏洞，解决员工的疑虑。同时强调，琼斯所揭示的漏洞，成功率并不高，并且技术上无法“突破所有针对该模型设定的安全措施”，至于，“这一漏洞与泰勒·斯威夫特照片的制作是否有关联，则不得而知”。

打开APP阅读更多精彩内容