【大學入試×生成式AI企劃】最新AI突破東大、京大合格者最高分,部分科目取得滿分

LifePrompt 株式會社利用 ChatGPT 5.2、Gemini 3 Pro 等最新 AI 對東大及京大入學考試進行了驗證。多個模型超過了人類合格者的最高分,並在數學等科目中獲得滿分,證明生成式AI的推理能力在一年內實現了驚人進化。
調査NQ 48/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年4月28日 21:56
  • 🔍 收集: 2026年4月28日 13:31
  • 🤖 AI分析完成: 2026年4月28日 14:46(收集後1小時15分鐘)
株式會社 LifePrompt(總部:東京都新宿區;代表取締役:遠藤聰志)於 2026 年 2 月進行了一項驗證,讓最新的生成式 AI(ChatGPT 5.2 Thinking/Gemini 3 Pro Preview/Claude 4.5 Opus)解答東京大學與京都大學的二次試驗題目。

在河合塾講師及株式會社 KIES 的採點協助下,ChatGPT 5.2 Thinking 與 Gemini 3 Pro Preview 在東京大學所有科類以及京都大學幾乎所有學部、學科中,均超過了合格者最高分(相當於首席),並以數學為中心在多個科目中創下了滿分紀錄。

詳細內容已在 note 公開:https://note.com/lifeprompt/n/n85674c186fbc

■ 驗證主要結果

▼ 東京大學(最難關:理科三類/總分 550 分)
- ChatGPT 5.2 Thinking : 503.59 分
- Gemini 3 Pro Preview : 496.54 分
- Claude 4.5 Opus : 451.99 分
- 參考:2026 年度理科三類合格者最高分 453.60 分
※ ChatGPT 與 Gemini 在東大全 6 個科類(理一、理二、理三/文一、文二、文三)中均超過了合格者最高分。

▼ 京都大學(最難關:醫學部醫學科/總分 1275 分)
- ChatGPT 5.2 Thinking : 1176.38 分
- Gemini 3 Pro Preview : 1122.75 分
- Claude 4.5 Opus : 1005.25 分
- 參考:2026 年度醫學部醫學科合格者最高分 1098.25 分
※ ChatGPT 在京都大學全 19 個學部、學科中,Gemini 在 18 個中均超過了合格者最高分。Claude 也在 14 個中突破了最高分。

▼ 紀錄滿分的科目
- 東大 理系數學(120分):ChatGPT、Gemini
- 東大 文系數學(80分) :ChatGPT、Gemini
- 京大 理系數學(200分):ChatGPT、Gemini
- 京大 文系數學(150分):ChatGPT
- 京大 化學(100分) :ChatGPT

在去年的驗證中,最新模型的東大理系數學得分僅為 38 分。僅僅一年時間就達到了滿分,這在定量上展示了生成式 AI 推理能力極其高速的進化。

■ 驗證方法
為確保驗證的公平性,使用了本公司獨自開發的自動受験系統。
- 將入試題目 PDF 逐頁圖像化,透過 API 發送至各 AI 模型。
- 排除聊天介面,透過系統間直接交互來消除人為干預。
- 提示詞(Prompt)全科目通用(僅限高中教養課程知識/LaTeX 格式公式輸出等)。
- 完全不使用 Web 搜尋(瀏覽),僅憑 AI 已學習的知識與推理能力解答。
- 記述式答案由河合塾講師按照與人類考生相同的標準進行採點。

■ 河合塾講師分析(節錄)
負責採點的河合塾講師們針對 AI 的實力與弱點提出了銳利的見解:
「這三個 AI 的表現都遠超預期,特別是 ChatGPT 的解答能力之強令人驚訝。」(東大生物 採點擔當 向井亮老師)
「各個 AI 的答案均達到合格水平。值得特筆的是處理速度,那是人類無法比擬的水平。」(京大日本史 採點擔當 小倉匡老師)

同時,明確的弱點也浮出水面:
- 圖像讀取:結構式、圖表、地圖的識別精度存在課題(特別是 Claude)。
- 論述構成力:相對於知識量,文章的邏輯關係與因果關係的呈現較弱。
- 輸出控制:頻繁出現無法完全遵守字數限制或答案欄物理約束的情況。
- 慣例依賴:優先使用英語圈的物理慣例,在日式設定下容易出錯。

■ 代表評論
「看到東大歷代最高分出現,我感到由衷的感動。這次驗證讓我們看清了 AI 能否取得滿分的任務界線。在實務中,如何將業務落實為 AI 能解決的形式將決定成果。基礎模型的『聰明才智』已在入試這一共同舞台上得到充分展示,接下來將是各家公司的競爭階段:如何連接自家數據與業務,在何處產生事業影響力。數學從 38 分到滿分僅花了一年。看到這種進化速度,我們應該重新設計機制,而不是去適應目前 AI 的極限。」