ChatGPT回答编程问题错误率超50% 仍能骗过三分之一的提问者

【资料图】

据报道，美国普渡大学的研究发现，OpenAI 开发的人工智能聊天机器人 ChatGPT 在回答软件编程问题时，错误率超过一半，但仍能骗过三分之一的提问者。

该研究团队分析了 ChatGPT 对 517 个 Stack Overflow 网站上的问题的回答，评估了其正确性、一致性、全面性和简洁性。他们还对回答进行了语言和情感分析，并对 12 名志愿参与者进行了问卷调查。

最终的结论是，ChatGPT的回答虽然语言风格良好，但52%的回答是错误的，77%是冗长的。

同时，参与实验的志愿者只有在回答中存在明显错误时，才能发觉问题存在；其他情况下他们会被AI友好且细致的语言风格误导。

这无疑意味着，对于开发者来说，现阶段的生成式AI距离作为编程时的辅助工具还有着较为遥远的距离，甚至可能会起到反作用。

不过，需要注意的是，OpenAI很早之前就在官网告知用户，AI的回答“可能会产生关于人、地点或事实的不准确信息。”