近日,最新一期的《自然-人类行为》杂志发表了一项AI研究成果。该研究显示,在一组实验中,两款AI大语言模型在某些情境下展现出与人类相似甚至胜过人类的心理状态感知能力。
心理状态感知能力,又称心智理论,对于人类社交至关重要。来自德国汉堡-埃彭多夫大学医学中心的James W. A. Strachan及其团队设计了一系列测试,以评估AI模型在发现错误观念、理解间接言辞以及辨识不敬等多个维度的表现。
值得注意的是,他们使用了GPT和LLaMA2这两款模型进行实验,并将其与1907名参与者进行比较。
实验结果表明,GPT在识别间接请求、错误观念和误导信息时,有时甚至超过了人类的平均水平;然而,在辨识不敬信息方面,LLaMA2优于人类,而GPT表现欠佳。
对此,Strachan解释说,LLaMA2的成功可能源于其较低的偏见程度,而非真正对不敬信息敏感;至于GPT的表现不佳,他认为主要原因在于它过于保守地坚持自己的结论,而非推理出错。
全部0条评论
快来发表一下你的评论吧 !