回到頂部
OpenAI 模型推翻 80 年幾何猜想:AI 科學發現真的來了嗎?

OpenAI 模型推翻 80 年幾何猜想:AI 科學發現真的來了嗎?

OpenAI 宣稱一個通用推理模型自主推翻 Erdős 於 1946 年提出的 unit distance 猜想,並由數學家驗證與簡化。這是 AI 從解題工具走向原創科學發現的重要訊號。

OpenAI 在 2026 年 5 月 20 日宣布,一個通用推理模型自主推翻了離散幾何中的一個重要猜想:Paul Erdős 於 1946 年提出的 unit distance 問題相關上界猜想。

這不是「模型考試考高分」那種新聞。OpenAI 宣稱模型不是背出答案,而是找到新的數學構造,讓一個被研究將近 80 年的猜想被反例推翻。後續論證經過 AI grading pipeline 與數學家檢查,數學家 Will Sawin 也簡化並強化了結果。

如果這個成果持續被學界接受,它會是一個重要分水嶺:AI 不只是幫人類整理知識,而是可能開始參與原創科學發現。


發生了什麼?

OpenAI 官方公告表示,一個內部通用推理模型解決了離散幾何中的 central conjecture。

問題可以用很直覺的方式理解:

如果在平面上放 n 個點,最多可以有多少對點剛好距離為 1?

這就是 unit distance problem。Erdős 在 1946 年提出相關猜想後,這個問題長期困擾組合幾何研究者。

OpenAI 表示,模型不是沿著多數人期待的證明方向前進,而是反過來嘗試構造反例,並把代數數論等工具帶進離散幾何問題。最後結果顯示,原本被廣泛相信的上界方向不成立。

簡化後的流程大致是:

  1. 模型產生研究思路與反例構造方向
  2. OpenAI 以 AI grading pipeline 做初步檢查
  3. 數學家檢視結果
  4. Will Sawin 簡化並強化論證
  5. OpenAI 公布成果與相關說明

這裡最關鍵的不是「AI 算得快」,而是「AI 選擇了一條與人類主流直覺不同的路」。


為什麼重要?

1. 這不是一般 benchmark

AI 模型在數學 benchmark 上拿高分,已經不是新鮮事。真正難的是:

  • 問題是否尚未被解決?
  • 解法是否不是訓練資料裡已有內容?
  • 推理是否能被人類數學家檢查?
  • 結果是否能推動一個研究領域?

OpenAI 這次選中的問題非常有象徵性。它不是冷門小題,而是離散幾何裡長期被研究的核心問題之一。

如果模型真的找到新的構造方式,那代表 AI 的能力正在從「解既有題庫」靠近「參與研究前沿」。

2. AI 科學發現的價值不只在答案

很多人看 AI 科學突破時,只問「答案對不對」。但對研究來說,真正重要的還包括:

  • 它提出了什麼方法?
  • 它引入了哪些跨領域工具?
  • 它打破了哪些既有直覺?
  • 它是否產生新的問題?
  • 人類能否理解並擴展它?

OpenAI 這次的故事之所以重要,是因為模型似乎把代數數論的思路帶進離散幾何,形成跨領域連結。

這和 AI 在藥物、材料、物理、數學上的潛力一致:AI 不一定只是跑更大的搜尋,而是可能幫研究者看到不同領域之間的隱藏路徑。

3. 但這不等於 AGI 已經到來

這篇新聞很容易被過度解讀成「AGI 已經到了」。這樣太快。

更精準的說法是:AI 已經能在部分高度結構化的研究領域中,產生值得嚴肅驗證的原創結果。

但它仍需要:

  • 人類檢查證明
  • 學界審查與吸收
  • 形式化驗證
  • 釐清模型實際貢獻與人類後處理的邊界
  • 重複出現在更多領域與問題類型

換句話說,這不是「AI 取代數學家」,而是「數學家可能多了一種新的研究夥伴」。


搜尋意圖:讀者真正想知道什麼?

搜尋「OpenAI 80 年數學問題」「Erdős conjecture AI」「AI 科學發現」的讀者,通常想知道:

  1. OpenAI 到底解了什麼問題?
  2. 這是真的嗎,還是誇大宣傳?
  3. 這和 AGI 有什麼關係?
  4. AI 會不會取代科學家?
  5. 一般人為什麼要在意?

最合理的回答是:這是一個嚴肅但仍需要學術消化的突破。它不代表 AI 全面取代科學家,但代表 AI 已經開始進入研究創造的核心流程。


Mason 的判斷

這則新聞真正的爆點,不是「AI 解了一題數學」,而是 AI 開始有可能改變科學發現的分工。

過去研究者用 AI 做資料清理、文獻整理、模擬、蛋白質結構預測或定理證明輔助。這些都很有價值,但多半是把 AI 放在既有研究流程的一段。

OpenAI 這次的主張更進一步:模型可能自己找到了研究方向,並提出足以讓猜想倒下的構造。

如果未來這種模式擴大,科學工作會變成三層:

  1. AI 提出候選思路與構造
  2. 人類研究者理解、驗證、簡化與命名
  3. 形式化工具與社群審查確認可靠性

這會讓科學發現速度變快,但也會讓「誰是發現者」「如何審查 AI 輸出」「學術 credit 怎麼分配」變得更複雜。

對一般讀者來說,這件事最值得記住的一句話是:AI 科學發現的未來,不是模型直接宣布真理,而是模型把人類帶到以前沒想到要看的地方。


不同角色的建議

研究者

  • 把 AI 當成產生候選方向的工具,而不是直接信任答案
  • 建立可追溯的驗證流程:原始輸出、簡化過程、人類修改、形式化檢查都要分清楚
  • 跨領域問題會更適合 AI 協助,因為模型可能看見不同文獻區塊之間的連結

AI 產品團隊

  • 科學 AI 產品不能只做聊天介面,必須整合驗證、引用、實驗記錄與可重現流程
  • 「模型提出」和「人類驗證」應在 UI 與文件中明確分層
  • 高信任場景要避免把未驗證猜想包裝成已確定結論

一般讀者

  • 不要把這件事看成單純炒作,也不要立刻解讀成 AGI
  • 觀察後續學界如何引用、審查與擴展結果,比看公司公告更重要
  • 未來 AI 對科學的影響,可能比對辦公室自動化更深

FAQ

OpenAI 模型到底解了什麼問題?

OpenAI 宣稱一個通用推理模型推翻了 Erdős 於 1946 年提出、與平面上 n 個點之間最多能有多少單位距離點對相關的離散幾何猜想。這是 unit distance problem 相關的重要問題。

這個結果已經被完全證明了嗎?

OpenAI 表示結果經過 AI grading pipeline 與數學家檢查,並由數學家 Will Sawin 簡化與強化。不過像所有重大數學結果一樣,仍需要更廣泛的學術社群閱讀、審查與吸收。

這代表 AGI 已經出現了嗎?

不宜這樣下結論。這代表 AI 在特定研究問題上可能產生原創貢獻,但 AGI 涉及更廣泛、穩定、可遷移的能力。這是 AI 科學發現的重要訊號,不是 AGI 的直接證明。

Sources:

№ · further reading

延伸閱讀