ChatGPT回答编程问题错误率超50% 仍能骗过三分之一的提问者


【资料图】

据报道,美国普渡大学的研究发现,OpenAI 开发的人工智能聊天机器人 ChatGPT 在回答软件编程问题时,错误率超过一半,但仍能骗过三分之一的提问者。

该研究团队分析了 ChatGPT 对 517 个 Stack Overflow 网站上的问题的回答,评估了其正确性、一致性、全面性和简洁性。他们还对回答进行了语言和情感分析,并对 12 名志愿参与者进行了问卷调查。

最终的结论是,ChatGPT的回答虽然语言风格良好,但52%的回答是错误的,77%是冗长的。

同时,参与实验的志愿者只有在回答中存在明显错误时,才能发觉问题存在;其他情况下他们会被AI友好且细致的语言风格误导。

这无疑意味着,对于开发者来说,现阶段的生成式AI距离作为编程时的辅助工具还有着较为遥远的距离,甚至可能会起到反作用。

不过,需要注意的是,OpenAI很早之前就在官网告知用户,AI的回答“可能会产生关于人、地点或事实的不准确信息。”

关键词: