OpenAI 模型推翻 80 年幾何猜想：AI 科學發現真的來了嗎？

OpenAI 宣稱一個通用推理模型自主推翻 Erdős 於 1946 年提出的 unit distance 猜想，並由數學家驗證與簡化。這是 AI 從解題工具走向原創科學發現的重要訊號。

發佈於： 2026-05-25

OpenAI 在 2026 年 5 月 20 日宣布，一個通用推理模型自主推翻了離散幾何中的一個重要猜想：Paul Erdős 於 1946 年提出的 unit distance 問題相關上界猜想。

這不是「模型考試考高分」那種新聞。OpenAI 宣稱模型不是背出答案，而是找到新的數學構造，讓一個被研究將近 80 年的猜想被反例推翻。後續論證經過 AI grading pipeline 與數學家檢查，數學家 Will Sawin 也簡化並強化了結果。

如果這個成果持續被學界接受，它會是一個重要分水嶺：AI 不只是幫人類整理知識，而是可能開始參與原創科學發現。

發生了什麼？

OpenAI 官方公告表示，一個內部通用推理模型解決了離散幾何中的 central conjecture。

問題可以用很直覺的方式理解：

如果在平面上放 n 個點，最多可以有多少對點剛好距離為 1？

這就是 unit distance problem。Erdős 在 1946 年提出相關猜想後，這個問題長期困擾組合幾何研究者。

OpenAI 表示，模型不是沿著多數人期待的證明方向前進，而是反過來嘗試構造反例，並把代數數論等工具帶進離散幾何問題。最後結果顯示，原本被廣泛相信的上界方向不成立。

簡化後的流程大致是：

模型產生研究思路與反例構造方向
OpenAI 以 AI grading pipeline 做初步檢查
數學家檢視結果
Will Sawin 簡化並強化論證
OpenAI 公布成果與相關說明

這裡最關鍵的不是「AI 算得快」，而是「AI 選擇了一條與人類主流直覺不同的路」。

為什麼重要？

1. 這不是一般 benchmark

AI 模型在數學 benchmark 上拿高分，已經不是新鮮事。真正難的是：

問題是否尚未被解決？
解法是否不是訓練資料裡已有內容？
推理是否能被人類數學家檢查？
結果是否能推動一個研究領域？

OpenAI 這次選中的問題非常有象徵性。它不是冷門小題，而是離散幾何裡長期被研究的核心問題之一。

如果模型真的找到新的構造方式，那代表 AI 的能力正在從「解既有題庫」靠近「參與研究前沿」。

2. AI 科學發現的價值不只在答案

很多人看 AI 科學突破時，只問「答案對不對」。但對研究來說，真正重要的還包括：

它提出了什麼方法？
它引入了哪些跨領域工具？
它打破了哪些既有直覺？
它是否產生新的問題？
人類能否理解並擴展它？

OpenAI 這次的故事之所以重要，是因為模型似乎把代數數論的思路帶進離散幾何，形成跨領域連結。

這和 AI 在藥物、材料、物理、數學上的潛力一致：AI 不一定只是跑更大的搜尋，而是可能幫研究者看到不同領域之間的隱藏路徑。

3. 但這不等於 AGI 已經到來

這篇新聞很容易被過度解讀成「AGI 已經到了」。這樣太快。

更精準的說法是：AI 已經能在部分高度結構化的研究領域中，產生值得嚴肅驗證的原創結果。

但它仍需要：

人類檢查證明
學界審查與吸收
形式化驗證
釐清模型實際貢獻與人類後處理的邊界
重複出現在更多領域與問題類型

換句話說，這不是「AI 取代數學家」，而是「數學家可能多了一種新的研究夥伴」。

讀者真正想知道什麼？

搜尋「OpenAI 80 年數學問題」「Erdős conjecture AI」「AI 科學發現」的讀者，通常想知道：

OpenAI 到底解了什麼問題？
這是真的嗎，還是誇大宣傳？
這和 AGI 有什麼關係？
AI 會不會取代科學家？
一般人為什麼要在意？

最合理的回答是：這是一個嚴肅但仍需要學術消化的突破。它不代表 AI 全面取代科學家，但代表 AI 已經開始進入研究創造的核心流程。

Mason 的判斷

這則新聞真正的爆點，不是「AI 解了一題數學」，而是 AI 開始有可能改變科學發現的分工。

過去研究者用 AI 做資料清理、文獻整理、模擬、蛋白質結構預測或定理證明輔助。這些都很有價值，但多半是把 AI 放在既有研究流程的一段。

OpenAI 這次的主張更進一步：模型可能自己找到了研究方向，並提出足以讓猜想倒下的構造。

如果未來這種模式擴大，科學工作會變成三層：

AI 提出候選思路與構造
人類研究者理解、驗證、簡化與命名
形式化工具與社群審查確認可靠性

這會讓科學發現速度變快，但也會讓「誰是發現者」「如何審查 AI 輸出」「學術 credit 怎麼分配」變得更複雜。

對一般讀者來說，這件事最值得記住的一句話是：AI 科學發現的未來，不是模型直接宣布真理，而是模型把人類帶到以前沒想到要看的地方。

不同角色的建議

研究者

把 AI 當成產生候選方向的工具，而不是直接信任答案
建立可追溯的驗證流程：原始輸出、簡化過程、人類修改、形式化檢查都要分清楚
跨領域問題會更適合 AI 協助，因為模型可能看見不同文獻區塊之間的連結

AI 產品團隊

科學 AI 產品不能只做聊天介面，必須整合驗證、引用、實驗記錄與可重現流程
「模型提出」和「人類驗證」應在 UI 與文件中明確分層
高信任場景要避免把未驗證猜想包裝成已確定結論

一般讀者

不要把這件事看成單純炒作，也不要立刻解讀成 AGI
觀察後續學界如何引用、審查與擴展結果，比看公司公告更重要
未來 AI 對科學的影響，可能比對辦公室自動化更深

FAQ

OpenAI 模型到底解了什麼問題？

OpenAI 宣稱一個通用推理模型推翻了 Erdős 於 1946 年提出、與平面上 n 個點之間最多能有多少單位距離點對相關的離散幾何猜想。這是 unit distance problem 相關的重要問題。

這個結果已經被完全證明了嗎？

OpenAI 表示結果經過 AI grading pipeline 與數學家檢查，並由數學家 Will Sawin 簡化與強化。不過像所有重大數學結果一樣，仍需要更廣泛的學術社群閱讀、審查與吸收。

這代表 AGI 已經出現了嗎？

不宜這樣下結論。這代表 AI 在特定研究問題上可能產生原創貢獻，但 AGI 涉及更廣泛、穩定、可遷移的能力。這是 AI 科學發現的重要訊號，不是 AGI 的直接證明。

Sources:

№ · further reading