廣場
最新
熱門
新聞
我的主頁
發布
GateUser-781c6543
2026-04-01 11:37:05
關注
#ClaudeCode500KCodeLeak
昨天,人工智能界悄然爆炸。一位人士注意到Anthropic的Claude Code npm套件中,包含了一個配置錯誤的.npmignore文件,裡面藏著一個源碼映射文件——一個 .map 文件——其中包含約512,000行原始TypeScript源碼,跨越近1,900個文件。這是市面上最先進的AI編碼代理之一的整個架構層,靜靜地擺在那裡,可下載、可索引、公開。不是模型權重,也不是訓練數據,而是更具爭議性的一些東西:完整的框架、支架、連接線,讓Claude Code在你的終端中實際表現出來,寫出你的程式碼。
社群反應迅速。數小時內就架設了鏡像。研究人員開始將這段程式碼反饋給Claude本身,並請它解釋它所讀取的內容。回傳的自我分析結果,依照你的觀點,可能既令人深感震撼,也令人暗自擔憂——兩者兼具。
以下是泄露的程式碼實際揭示的內容,以及為何它的重要性遠超過迷因循環。
系統提示架構並非一份單一連貫的文件。它由超過一百個條件片段拼湊而成,每個片段根據啟用的工具、用戶的模式、偵測到的上下文動態注入。僅安全監控組件就重達5,600個tokens——約22,000字的條件指令,專門用來監控對抗性輸入。這不是事後加上的安全功能,而是一層平行的認知層,與其他所有部分並行運行,始終讀取相同的文件和程式碼片段,並在任何工具調用前尋找提示注入的跡象。
Plan Mode(計劃模式),由Shift+Tab觸發的功能,不僅僅是“思考再行動”的暫停。它會啟動三個平行代理。一個映射整個程式碼庫,一個進行所謂的面試流程,執行本身則在一個隔離的git工作樹中進行,與實時工作目錄隔離。這些代理之間的協調邏輯是明確、結構化的,對於一個開發者工具來說,令人驚訝地複雜。
記憶層次的設計幾乎所有用戶都未必察覺。有會話層記憶,預期之內。有團隊共享記憶,還有一個被程式碼稱為autoDream的背景整合過程,異步運行,修剪冗餘條目,合併相關記憶。這個名字足夠富有象徵意義,當人們發現它時引發了一連串反應,但其機制本身很簡單:一個維護流程,旨在長期保持記憶庫的實用性,而非讓它膨脹成噪音。
對抗性驗證器值得獨立一段說明。程式碼生成後,會啟動一個獨立代理,只有一個任務:試圖破解它。找出邊界案例,暴露邏輯錯誤,在輸出傳遞給用戶前返回PASS或FAIL。這不是事後的語法檢查,而是嵌入在交付流程中的對抗子代理。程式碼還顯示,這個驗證器是可配置的,暗示Anthropic將其視為一個調節旋鈕而非開關——你可以調整它的破解難度。
在程式碼中發現的未公開功能則更具推測性,因為這些都未被正式推出。BUDDY似乎是一個持久的AI伴侶,具有追蹤類似情感或參與度指標的狀態——在X上流傳的Tamagotchi比喻雖然過於簡化,但並非完全錯誤。KAIROS是一個主動通知系統,意味著它會主動聯繫用戶,而非等待被調用。ULTRAPLAN則指向一個使用Opus級模型的雲端規劃模式,代表最強大的規劃層是遠端運行而非本地。這些功能何時推出、以何種形式推出,完全未知,但它們在這個階段的存在,透露出產品路線圖的雄心。
反蒸餾(anti-distillation)防禦是泄露中最具哲學意義的部分。程式碼中包含邏輯,旨在向試圖通過自動探測來蒐集或蒸餾模型行為的人展示假工具輸出。目的是污染試圖模仿Claude行為的訓練信號。令人忍俊不禁的是,這個內部稱為Undercover Mode的防禦機制,竟然在同一個套件中被泄露。這種設計如果出現在小說中,會讓人覺得牽強。
程式碼品質的觀察值得一提,因為它們講述的故事與架構不同。在那些優雅設計的多代理流程和精心構建的記憶系統中,有些函數超過3,000行。任何有經驗的工程師都會稱之為“意粉絲(spaghetti)”。這並非批評——它提醒我們,即使是最先進的AI基礎設施,也是在壓力下由人類建造,外在的優雅與內部的雜亂之間的差距,是軟體的普遍常數。這也意味著,這份泄露的程式碼並非完美無瑕的範例,而是一個帶有所有疤痕的實用代碼庫。
這對更廣泛的AI領域意味著什麼,值得深思。架構層——框架、支架、代理協調邏輯——歷來被視為區分這些工具的專有秘密。模型權重大多無法取得,訓練數據受到嚴格保護。但行為層,也就是決定模型在產品中實際行動方式的部分,現在已經完整曝光,成為領先的編碼代理之一。其他團隊會讀取這些內容,學術研究者也會研究,競爭者亦然。Anthropic花費大量工程時間開發的平行代理啟動、對抗驗證、層級記憶整合和提示注入檢測技術,現在已成為公開知識。
截至本文撰寫時,Anthropic尚未發表正式聲明。npm套件已經被修正。鏡像已經廣泛存在,難以有效抑制。討論很快會隨之而去,像往常一樣。但這個產物——描述一個前沿AI編碼代理實際思考與協調的512,000行程式碼——將被長期研究,成為系統建構者的寶貴資料。
真正的啟示不是Anthropic犯了錯,而是“黑箱AI”與“完全可讀取AI系統”之間的差距,比大多數人想像的要小得多。魔法是真實的,但它也是TypeScript。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
1人按讚了這條動態
打賞
1
留言
轉發
分享
留言
請輸入留言內容
請輸入留言內容
留言
暫無留言
熱門話題
查看更多
#
四月行情預測
32.59萬 熱度
#
加密市場普遍上漲
5.43萬 熱度
#
金銀同步走強
33.54萬 熱度
#
ClaudeCode50万行源代码泄漏
80.64萬 熱度
#
川普釋放停戰訊號
5.5萬 熱度
熱門 Gate Fun
查看更多
Gate Fun
KOL
最新發幣
即將上市
成功上市
1
PYL
Pylora
市值:
$2268.96
持有人數:
0
0.00%
2
TT
TRUMP TOWER
市值:
$2265.51
持有人數:
1
0.00%
3
大汉民族
大汉民族
市值:
$2417.93
持有人數:
2
0.00%
4
😃
wwe
市值:
$0.1
持有人數:
0
0.00%
5
漫威粉丝币
漫威粉丝币
市值:
$2286.2
持有人數:
1
0.00%
置頂
🤔 此時此刻,全世界只有你還沒抽獎了?
別盯著盤面看啦,來 #Gate广场 抽個金條壓壓驚!
第 17 期成長值抽獎進行中,尤其是新朋友,中獎率 100%,真的不打算來“白嫖”一下嗎?
🎁 錦鯉清單: 10g 純金金條、紅牛賽車周邊、大額體驗券...
🚀 极速上車: 廣場發帖/點贊攢夠 300 積分即可開抽!
👇 戳這裡,測測今天的歐氣:https://www.gate.com/activities/pointprize?now_period=17
#BTC #ETH #GT
網站地圖
#ClaudeCode500KCodeLeak
昨天,人工智能界悄然爆炸。一位人士注意到Anthropic的Claude Code npm套件中,包含了一個配置錯誤的.npmignore文件,裡面藏著一個源碼映射文件——一個 .map 文件——其中包含約512,000行原始TypeScript源碼,跨越近1,900個文件。這是市面上最先進的AI編碼代理之一的整個架構層,靜靜地擺在那裡,可下載、可索引、公開。不是模型權重,也不是訓練數據,而是更具爭議性的一些東西:完整的框架、支架、連接線,讓Claude Code在你的終端中實際表現出來,寫出你的程式碼。
社群反應迅速。數小時內就架設了鏡像。研究人員開始將這段程式碼反饋給Claude本身,並請它解釋它所讀取的內容。回傳的自我分析結果,依照你的觀點,可能既令人深感震撼,也令人暗自擔憂——兩者兼具。
以下是泄露的程式碼實際揭示的內容,以及為何它的重要性遠超過迷因循環。
系統提示架構並非一份單一連貫的文件。它由超過一百個條件片段拼湊而成,每個片段根據啟用的工具、用戶的模式、偵測到的上下文動態注入。僅安全監控組件就重達5,600個tokens——約22,000字的條件指令,專門用來監控對抗性輸入。這不是事後加上的安全功能,而是一層平行的認知層,與其他所有部分並行運行,始終讀取相同的文件和程式碼片段,並在任何工具調用前尋找提示注入的跡象。
Plan Mode(計劃模式),由Shift+Tab觸發的功能,不僅僅是“思考再行動”的暫停。它會啟動三個平行代理。一個映射整個程式碼庫,一個進行所謂的面試流程,執行本身則在一個隔離的git工作樹中進行,與實時工作目錄隔離。這些代理之間的協調邏輯是明確、結構化的,對於一個開發者工具來說,令人驚訝地複雜。
記憶層次的設計幾乎所有用戶都未必察覺。有會話層記憶,預期之內。有團隊共享記憶,還有一個被程式碼稱為autoDream的背景整合過程,異步運行,修剪冗餘條目,合併相關記憶。這個名字足夠富有象徵意義,當人們發現它時引發了一連串反應,但其機制本身很簡單:一個維護流程,旨在長期保持記憶庫的實用性,而非讓它膨脹成噪音。
對抗性驗證器值得獨立一段說明。程式碼生成後,會啟動一個獨立代理,只有一個任務:試圖破解它。找出邊界案例,暴露邏輯錯誤,在輸出傳遞給用戶前返回PASS或FAIL。這不是事後的語法檢查,而是嵌入在交付流程中的對抗子代理。程式碼還顯示,這個驗證器是可配置的,暗示Anthropic將其視為一個調節旋鈕而非開關——你可以調整它的破解難度。
在程式碼中發現的未公開功能則更具推測性,因為這些都未被正式推出。BUDDY似乎是一個持久的AI伴侶,具有追蹤類似情感或參與度指標的狀態——在X上流傳的Tamagotchi比喻雖然過於簡化,但並非完全錯誤。KAIROS是一個主動通知系統,意味著它會主動聯繫用戶,而非等待被調用。ULTRAPLAN則指向一個使用Opus級模型的雲端規劃模式,代表最強大的規劃層是遠端運行而非本地。這些功能何時推出、以何種形式推出,完全未知,但它們在這個階段的存在,透露出產品路線圖的雄心。
反蒸餾(anti-distillation)防禦是泄露中最具哲學意義的部分。程式碼中包含邏輯,旨在向試圖通過自動探測來蒐集或蒸餾模型行為的人展示假工具輸出。目的是污染試圖模仿Claude行為的訓練信號。令人忍俊不禁的是,這個內部稱為Undercover Mode的防禦機制,竟然在同一個套件中被泄露。這種設計如果出現在小說中,會讓人覺得牽強。
程式碼品質的觀察值得一提,因為它們講述的故事與架構不同。在那些優雅設計的多代理流程和精心構建的記憶系統中,有些函數超過3,000行。任何有經驗的工程師都會稱之為“意粉絲(spaghetti)”。這並非批評——它提醒我們,即使是最先進的AI基礎設施,也是在壓力下由人類建造,外在的優雅與內部的雜亂之間的差距,是軟體的普遍常數。這也意味著,這份泄露的程式碼並非完美無瑕的範例,而是一個帶有所有疤痕的實用代碼庫。
這對更廣泛的AI領域意味著什麼,值得深思。架構層——框架、支架、代理協調邏輯——歷來被視為區分這些工具的專有秘密。模型權重大多無法取得,訓練數據受到嚴格保護。但行為層,也就是決定模型在產品中實際行動方式的部分,現在已經完整曝光,成為領先的編碼代理之一。其他團隊會讀取這些內容,學術研究者也會研究,競爭者亦然。Anthropic花費大量工程時間開發的平行代理啟動、對抗驗證、層級記憶整合和提示注入檢測技術,現在已成為公開知識。
截至本文撰寫時,Anthropic尚未發表正式聲明。npm套件已經被修正。鏡像已經廣泛存在,難以有效抑制。討論很快會隨之而去,像往常一樣。但這個產物——描述一個前沿AI編碼代理實際思考與協調的512,000行程式碼——將被長期研究,成為系統建構者的寶貴資料。
真正的啟示不是Anthropic犯了錯,而是“黑箱AI”與“完全可讀取AI系統”之間的差距,比大多數人想像的要小得多。魔法是真實的,但它也是TypeScript。