3秒寫800字作文 AI考生評比: GhatGPT最快、文心一言有文采

6月7日,在北京钱学森中学考点外,考生们等待进入考场。 (新华社)

人工智能(AI)话题昨首次进入高考作文,不少媒体也请出AI考生应战,经实测,GhatGPT仅用时三秒钟就创作出了一篇800字的作文,在速度和效率上绝对是第一名。而在各AI系统评比,文心一言有文采,豆包更懂中文,GPT-4o更深度,Kimi展现了文科生般的流畅表达。在AI彼此互打分数上则展现出「惺惺相惜」,都给出了接近满分的好成绩。

据文汇报报导,2024年高考各地语文作文试题都离不开当下的科技热点。报导实测GhatGPT试「我写我自己」,没想到仅用时三秒钟就创作出一篇800字作文,无论是逻辑还是用词都符合题目的要求。甚至在不同角度的指导下,「AI考生」又用不同侧重点再创作出了三篇作文,在速度和效率上绝对是第一名。

而蓝鲸财经以四大AI系统试写高考作文题目「互联网的普及、人工智能的应用,是否使我们的问题是否会愈来愈少?」,有趣的是,百度的文心一言、字节的豆包、国内AI领域的网红Kimi 智能助手、OpenAI的ChatGPT 4o等不同人工智能软件都指出在AI发展之后,人类面对的问题会愈来愈复杂,AI也面临伦理等问题需要正视。

文心一言称互联网的普及、人工智能的应用后,问题非但不会减少,反而会如雨后春笋般不断涌现,且AI虽能解答许多问题,但它也有其局限性。它不能代替我们去感受、去体验、去创新。豆包指AI引发信息安全等新挑战。Kimi称也必须警惕信息过载和知识泡沫的问题。ChatGPT 4o指如何判断信息的真实性和可靠性成为新的挑战。通义千问则称技术的快速叠代引发了伦理、隐私等问题。

报导最后点评,文心一言对中文的理解更为精准透彻,同时还引用了名人名言,在作文的表现上比起其余三个大模型更具文采。豆包兼具思考性与逻辑性,但文章偏向白话,欠缺一定的文采。Kimi展现了文科生般的流畅表达,但在内容深度略显不足。通义千问侧重于实际建议和方法,但缺乏更深入的分析和具体例证。GPT-4o具有更深度的思考,但表达流畅性方面欠缺。

另据羊城晚报以各AI系统写高考作文后并互相评分显示,以满分为60分,腾讯混元大模型给文心一言信打分56分,点评文章在审题立意、语言表达、内容深度等方面均表现良好,但在一些细节上仍有提升空间。文心一言给ChatGPT打55分,点评文章结构清晰,逻辑严密,论据充分,论证有力,但在深度和广度上还可以进一步提升。