福利加码,Gate 廣場明星帶單交易員三期招募開啟!
入駐發帖 · 瓜分 $30,000 月度獎池 & 千萬級流量扶持!
如何參與:
1️⃣ 報名成為跟單交易員:https://www.gate.com/copytrading/lead-trader-registration/futures
2️⃣ 報名活動:https://www.gate.com/questionnaire/7355
3️⃣ 入駐 Gate 廣場,持續發布交易相關原創內容
豐厚獎勵等你拿:
首發優質內容即得 $30 跟單體驗金
每雙周瓜分 $10,000U 內容獎池
Top 10 交易員額外瓜分 $20,000U 登榜獎池
精選帖推流、首頁推薦、周度明星交易員曝光
詳情:https://www.gate.com/announcements/article/50291
陶哲軒對數學界敲警鐘:嚴厲批評AI過度評估
近頃,「AI已獨力解決人類長年未能破解的數學難題」等大膽的新聞層出不窮。在這些報導的影響力日益擴大的同時,卻有意想不到的人物提出異議。那就是泰倫斯·陶。作為積極運用AI於數學研究的專家,他對此的警告格外具有分量。陶並非否定AI本身,而是呼籲停止媒體與社會對其「神話化」。
為何「AI數學革命」的幻想會如此盛行
「AI完全自動解決50年來的數學難題——數學家失業時代即將來臨」。這樣的煽動性標題你或許曾見過。對於夢想AGI(通用人工智慧)出現的人來說,這是希望之光;而對於希望維護人類智慧尊嚴的研究者而言,則是隱藏的危機。
事實上,這類轟動新聞的背後,存在著對資訊的片面理解。將個別成功案例誤認為整體能力,將未經驗證的成果當作既成事實,這些誤解逐漸累積,形成了「AI數學無敵論」。
泰倫斯·陶在深夜發聲,正是為了將這些過度期待拉回現實。他在更新的GitHub頁面「AI對 Erdős 問題的貢獻」中,詳細說明了在評估AI對未解決的 Erdős 問題的貢獻時應注意的點。
泰倫斯·陶指出的AI評價陷阱
陶列舉的注意事項,乍看之下似乎在否定AI的成果,但實際上是在重新定義「真正的成功」。
難度差異被忽視:Erdős問題涵蓋從極其困難的核心問題,到長年未解的「長尾問題」,難度範圍極為廣泛。AI擅長後者,但若僅以「解題數量」來判斷,便會嚴重誤判實際能力。
「未解決」標籤本身不確定:網站上列出的問題,多未經系統文獻調查。即使標記為「Open」,也可能早已在過去的論文中被解決。AI認為解決的問題,實際上可能數十年前就已找到解法——這種情況並不少見。
成功案例才被曝光:記錄中多為AI成功的例子,失敗的嘗試與無進展的研究幾乎看不到。這種篩選效應,使得AI的能力被高估。
問題描述本身可能有誤或模糊:部分 Erdős 問題的表述缺乏嚴謹性,理解需要深厚領域知識。甚至可能利用表面漏洞,聲稱已解決。
數學價值不僅在於答案的正確與否:證明成立固然重要,但數學的真正價值在於其與既有理論的聯繫,以及對其他研究領域的啟示。人類研究者在撰寫論文時,會自然描述背景、動機、文獻關聯與方法限制等「語境」。但如陶所指出,AI主導的證明往往缺乏這些知識深度。
大量問題無法形式化:解出一些較小的 Erdős 問題,並不代表能在頂級學術期刊發表論文。若解法只是對現有方法的小改良,則更難。
形式驗證的陷阱:用 Lean 等工具將AI生成的證明形式化,表面上看是提升可信度,但過程中可能暗中加入公理、誤解問題描述,或利用程序的「角落行為」。特別是當形式化證明異常短或不自然時,需特別留意。
AI的真正角色:「體力工作」到「知識橋梁」
2026年1月,#728番と#729號 Erdős 問題被AI完全解決,並在Lean中驗證成功。這證明在特定領域,AI能產生「可行的證明結構」並進行形式驗證。
那麼,AI在數學研究中扮演何種角色?陶列出多個分類。
AI能產生完整解答、AI誤判已解決問題、AI協助文獻搜尋、以及AI將人類證明形式化等,皆屬不同角色。特別值得注意的是「AI驅動的文獻回顧」——AI在此扮演事前調查的角色,驗證已有成果或標記未解決的正確性。
綜合來看,陶強調的核心是:AI擅長數學中的「例行公事」、填空、形式化、論文撰寫與修正、文獻調查等「體力勞動」。但真正提問深層問題、創造新概念、將成果融入數學整體知識體系的工作,仍然高度依賴人類。
數學的未來:人類指揮與AI執行
陶此次深夜警告的核心,不是低估AI,而是要正確認識其本質。
未來的數學家形象或許將大為不同。不是孤獨的思索者,而是指揮硅基智慧軍團的指揮官。在廣袤的數學原野上,人類指示方向,AI開拓道路,搭建橋梁。這種分工,將是下一代數學研究的理想模式。
我們應該避免過度美化AI的成果。同時,也不能低估這股正在根本改變追求真理方式的力量。陶的訊息,正是在冷靜與現實中,為未來開啟一條光明之路。