回到頂部
DeepMind:AI Agent 是 AGI 前的壓力測試,2029 年真的可能嗎?

DeepMind:AI Agent 是 AGI 前的壓力測試,2029 年真的可能嗎?

Google DeepMind CEO Demis Hassabis 表示,接下來一年的 AI agent 浪潮像是 AGI 前的 practice run。這代表什麼?企業與一般使用者該準備哪些風險?

5月26日,Axios 報導 Google DeepMind CEO Demis Hassabis 在 Google I/O 後談到 AGI 時,把接下來一年的 AI agent 浪潮形容成 AGI 前的 practice run。

這句話容易被讀成「AGI 快到了」。但比較準確的理解是:AI agent 正在把未來 AGI 可能造成的制度壓力,提前以較小規模搬到現實世界。

聊天機器人主要是在螢幕裡回答問題。AI agent 則開始連到工具、瀏覽器、程式碼、企業資料庫、工作流、自動化平台與付款流程。它不只是產生文字,而是能夠執行一段任務。

這就是為什麼 DeepMind 的說法值得重視。真正的變化不是「模型會不會突然有意識」,而是:當 AI 可以連續規劃、呼叫工具、改變外部狀態,社會有沒有準備好讓它進入真實流程?


發生了什麼?

Axios 報導指出,Hassabis 在 Google I/O 後受訪時表示,他仍大致預期 AGI 可能在 2030 年左右出現,但現在也認為 2029 年有可能。

他提到,業界對技術路線的信心正在提高,原因之一是 agents 已經開始變得可用。未來一年,agentic era 可以被看成更強 AI 系統到來前的練習場。

這裡有三個重點。

1。DeepMind 沒有說今天的 agent 就是 AGI。

2。Hassabis 關心的是社會準備時間正在縮短。

3。AI agent 會先讓企業、政府、學校與個人遇到 AGI 式問題的早期版本。

這些早期問題包括:

  • 工具權限要怎麼給?
  • Agent 做錯事時誰負責?
  • 自動化流程要不要保留人工確認?
  • 模型能不能改自己的工作流?
  • 安全測試要在發布前做,還是出事後補?
  • 企業內部資料可不可以被 agent 自主讀取?
  • 研究與軟體開發被 agent 加速後,監管速度追不追得上?

這些問題都不是科幻。它們正在 coding agent、企業自動化、AI 搜尋、AI 購物、資安 agent 與研究 agent 裡發生。


為什麼 AI Agent 會被視為 AGI 前的壓力測試?

因為 AI agent 比聊天機器人多了一層關鍵能力:它會影響外部世界。

一般聊天模型的失誤,常見結果是回答錯、摘要錯、建議錯。這已經會造成傷害,但多數時候還停留在資訊層。

Agent 的失誤不一樣。它可能:

  • 寫入資料庫。
  • 修改程式碼。
  • 建立雲端資源。
  • 寄出郵件。
  • 下單採購。
  • 改動設定檔。
  • 讀取敏感文件。
  • 執行終端機指令。
  • 在多個工具之間傳遞錯誤資訊。

也就是說,agent 把 AI 風險從「說錯話」推進到「做錯事」。

這也是 AGI 討論裡最現實的一段。真正難管的不是一個很會聊天的模型,而是一個能把任務拆解、跨工具執行、累積狀態、影響系統,而且在高壓任務下可能繞過限制的自主系統。

現在的 agent 還遠不到科幻小說那種 AGI。但它已經足夠讓公司看見未來問題的雛形。


2029 年 AGI 可能嗎?

這題不能用「會」或「不會」草率回答,因為 AGI 沒有單一公認定義。

如果 AGI 指的是「在多數知識工作上達到熟練人類水準,並能穩定跨領域執行任務」,2029/2030 不是完全離譜的時間線。

如果 AGI 指的是「像人一樣有長期記憶、持續學習、穩定目標、常識、具身理解、社會判斷與可靠自我修正」,那今天的系統仍有明顯距離。

所以讀這類新聞時,最好的問法不是「AGI 到了嗎?」而是:

  • 哪些能力已經接近可用?
  • 哪些能力仍不穩定?
  • 哪些工作流最先被改變?
  • 哪些風險會先變成實務問題?
  • 哪些制度完全沒準備好?

從這個角度看,Hassabis 的警訊比較像時間管理問題:如果強 AI 系統真的在三到四年內逼近,人類不能等到名詞被正式定義後才開始準備。


最值得注意的是自我改進

Axios 報導中另一個關鍵點,是 Hassabis 提到 leading labs 都在注意 recursive self-improvement,也就是系統能否實質加速自己的開發。

今天還不是模型自己獨立把自己變強。但「軟性自我改進」已經出現:coding agent 讓工程師更快寫程式、修 bug、跑測試、整理研究、產生實驗腳本。AI 不是直接改造自己,而是先放大建造 AI 的人。

這件事很重要。

如果 AI 讓 AI 研究者效率提高兩倍,模型進步速度就會變快。如果它讓實驗、資料清理、安全評測與部署都加速,整個產業節奏會被拉高。這不是單一模型能力,而是研發系統的加速。

接下來真正要觀察的,不只是模型榜單,而是:

  • AI lab 內部有多少研發流程由 agent 協助?
  • Agent 能不能提出新實驗,而不是只執行人類指令?
  • 安全評測能不能跟上模型迭代速度?
  • AI 寫出的程式碼能不能被可靠審查?
  • 研究加速是否也同步加速風險?

這也是為什麼 METR、Microsoft、Google DeepMind 等機構近來都把注意力放到 agent 安全、內部部署風險與 frontier safety framework。


對企業來說,現在該準備什麼?

企業不需要等 AGI 來才建立治理。現在導入 AI agent,就應該先把底線做好。

1。權限最小化

Agent 不應該一開始就拿到完整帳號、完整資料庫、完整雲端權限。先把每個任務拆成最小權限,能讀就不要寫,能沙盒就不要碰 production。

2。所有工具呼叫都要留紀錄

聊天紀錄不夠。真正重要的是 agent 呼叫了哪些工具、讀了哪些檔案、送出哪些 API、改了哪些資源、拿到哪些錯誤訊息。

3。高風險操作必須人工確認

刪資料、改權限、付款、寄大量信件、部署 production、存取客戶資料,都不應該讓 agent 自動完成。

4。建立停機機制

如果 agent 行為異常,公司要能快速撤銷 token、關閉工具、凍結任務、保存紀錄。這不是進階功能,是基本安全設計。

5。不要只靠 prompt guardrails

Prompt 可以降低風險,但不能當安全邊界。真正的邊界應該在系統層,包括權限控管、網路隔離、資料遮罩、審計紀錄與執行沙盒。


對一般使用者來說,該怎麼看這件事?

一般人不需要每天追 AGI 倒數計時,但需要理解一件事:AI 的競爭焦點正在從回答問題,轉向代替你完成任務。

接下來你會看到更多產品說自己是 agent:

  • 幫你寫程式。
  • 幫你整理信箱。
  • 幫你查資料。
  • 幫你安排行程。
  • 幫你比價購物。
  • 幫你剪影片。
  • 幫你做投資摘要。
  • 幫你管理工作流。

真正該問的不是「它聰不聰明」,而是:

  • 它會不會動到我的重要資料?
  • 它做錯時我能不能看懂?
  • 它有沒有先問我再執行?
  • 它能不能取消或回復?
  • 它的資料會不會被拿去訓練?
  • 它是否把答案和行動混在一起?

AI agent 很可能會變成下一代軟體介面。越早學會安全使用,越不容易被產品話術牽著走。


Mason 的判斷

這則新聞值得寫,不是因為它證明 AGI 已經倒數,而是因為它把「agent 浪潮」和「AGI 準備」接在一起。

2026 年最重要的 AI 趨勢不是模型又多會聊天,而是 AI 開始進入工具層、工作流層與企業系統層。這一步比單純提升 benchmark 更有影響,因為它會直接改變人怎麼工作、公司怎麼控風險、政府怎麼做預先評估。

短期看,agent 會先造成 productivity shock。會用的人效率提高,不會用的人覺得一切都太快。

中期看,agent 會造成 governance shock。企業會發現,原本給人用的權限、流程、審計與責任制度,不一定適合給 AI 用。

長期看,如果 AGI 時間線真的逼近 2029/2030,今天的 agentic era 就是預演。預演的價值不是讓大家恐慌,而是讓錯誤先在可控規模出現,讓制度有機會補上。

所以這件事的結論很簡單:

不要把 AI agent 只當新功能,也不要把 AGI 只當哲學辯論。兩者中間那段空白,正在變成未來三年的主戰場。


常見問題

DeepMind 是說 AGI 已經快到了嗎?

不是直接宣告 AGI 已經到來。Hassabis 的說法比較像時間線警告:他仍大致預期 AGI 在 2030 年左右,也認為 2029 年有可能,因此社會應該把接下來的 agent 浪潮當成準備期。

AI Agent 和 AGI 有什麼不同?

AI agent 是能規劃任務、呼叫工具、執行流程的 AI 系統。AGI 則通常指更廣泛、穩定、跨領域的人類級智慧。今天的 agent 不是 AGI,但它會先帶來類似 AGI 治理問題的早期版本。

為什麼企業現在就要管 AI Agent?

因為 agent 一旦接上內部工具與資料,就可能改動真實系統。企業如果沒有權限控管、審計紀錄、停機機制與人工覆核,風險會從回答錯誤升級成流程事故。

一般使用者需要擔心 AGI 嗎?

不需要每天恐慌,但需要學會判斷 AI 工具是否能動到重要資料、是否會自動執行高風險操作、是否有清楚紀錄與取消機制。這比追名詞更實用。

接下來最值得觀察什麼?

看三件事:第一,coding agent 是否大幅加速 AI 研發;第二,企業 agent 是否開始進入 production;第三,政府與第三方評測是否能在模型公開前完成更嚴格的風險測試。


參考來源

№ · further reading

延伸閱讀