ChatGPT 5.2 在东京大学入学考试中超越人类最高分

AI 创业公司 LifePrompt 最新测试显示,OpenAI 的 ChatGPT 5.2 Thinking 模型在东京大学和京都大学的本科入学考试中取得了超过人类最高考生的成绩。

ChatGPT 5.2 东京大学入学考试

具体成绩

东京大学

  • 文科三类:452/550 分(人类最高分 434 分)
  • 理科三类(医学,竞争最激烈):503/550 分(人类最高分 453 分),数学获得满分

京都大学

  • 法学部:771 分(人类最高通过分 734 分)
  • 医学部:1176 分(人类最高分 1098 分)

测试方法是将试卷转为图像输入模型,作文部分由知名补习学校河合塾的教师评分。值得注意的是,AI 在英语科目得分率为 90%,但在世界史等需要论述回答的科目上仅得到 25%。

从不及格到超越最高分

这个结果的进步幅度比数字本身更值得关注:

  • 2024 年,LifePrompt 使用 ChatGPT-4 测试东大入学考试,未能达到最低及格线
  • 2025 年,使用 o1 模型测试,首次过线
  • 2026 年,ChatGPT 5.2 Thinking 模型超越人类最高分

三年时间,从不及格到碾压人类顶尖考生。

需要反思什么

庆应义塾大学教授、日本人工智能学会会长栗原聪指出,人类和 AI 不应在同一个竞技场竞争,因为 AI 擅长吸收已有数据,这和计算器比人类算得快是同一个道理。

就像计算器在计算速度和精度上超过人类一样,AI 在考试中获得高分是自然现象。人类在创造新价值方面仍然保持优势。现在是时候重新思考侧重知识记忆和计算能力的考试制度了。

这个判断的关键在于:AI 超越的不是人类的智力天花板,而是考试制度的智力天花板。当考试主要考察对已知知识的记忆和再现能力时,AI 拿高分只是一个时间问题。真正需要追问的是,这样的考试本身到底在选拔什么能力。

相关推荐