-
首頁
-
技術與產品
- 智能硬件
- 工業互聯
- ? 邊緣網關
- ? LoRaWAN組網
- ? 電力線載波通訊模組
- ? 閥門控制器
- ? PLC數據采集網關
- 電力
- ? 一鍵順控裝置
- ? 底盤車物聯網控制器
- ? 機械特性監測裝置
- ? 低壓綜保控制模塊
- 智能硬件
- 新能源
- ? 清潔機器人控制器
- ? 逆變器數據采集網關
- ? 紅外抄表采集裝置
- ? 儲能EMS管理機
- ? 就地顯示屏
- 平臺軟件
- ? 成套設備在線監測平臺
- ? 智能開關柜專家診斷系統
- ? 母線槽智能在線監測平臺
- ? 光伏清潔機器人遠程運維平臺
- ? 光伏電站遠程運維平臺
- ? 新型儲能管理系統EMS
- AI智能體
- ? 智能畫圖機器人
-
解決方案
- 新能源
- “無人值守”光伏電站智能運維解決方案
- 光伏清潔機器人智能控制和運維解決方案
- 光伏柔性支架在線監測物聯網解決方案
- 場站光伏組件缺陷現場檢測解決方案
- 新型儲能管理系統(EMS)解決方案
- 直流電源屏在線監測解決方案
- 電力
- 成套開關柜在線監測物聯網解決方案
- 中低壓電氣設備智能化升級解決方案解決方案
- 多模態智能感知、一鍵順控專家系統
- 真空斷路器智能化解決方案
- 操作機構機械特性物聯網軟硬件一站式解決方案
- 母線槽智能在線監測解決方案
- 低壓綜保模塊智能解決方案
- 工地臨時配電箱在線監測物聯網解決方案
- 機械裝備
- 變頻器物聯網軟硬件一站式解決方案解決方案
- 科研儀器在線監測物聯網解決方案
- 智能割草機遠程控制物聯網解決方案
- 工業縫紉機物聯網解決方案
- 電梯空調遠程監控物聯網解決方案
- 碼頭卸船機遠程運維物聯網解決方案
- 鋸床在線監測物聯網解決方案
- 礦山機械遠程運維物聯網解決方案
- 智慧水務
- 水泵物聯網軟硬件一體化解決方案
- 萬州城區智慧排水體系升級解決方案
- 智慧供暖
- 智慧供暖全景運營物聯網解決方案
- 空氣源熱泵熱站專項系統
- 智慧供熱用戶繳費平臺系統
- 智慧供熱用戶監控平臺系統
-
成功案例
- 電力
- 基于多源數據融合的高壓斷路器健康管理系統設計項目
- 高壓斷路器數據采集與故障診斷技術研究項目
- 新能源
- 基于無人值守的大跨距高凈空的柔性大型光伏電站智能在線監控項目
- 基于數據挖掘的光伏電站遠程運維技術項目
- 機械裝備
- 萬州城區智慧排水體系升級排水設施安全監測項目建設實施方案
- 智慧供暖全景運營物聯網解決方案項目
- 空氣源熱泵熱站專項系統熱站監控系統項目
- 智慧供熱用戶繳費平臺系統項目
- 智慧供熱用戶監控平臺系統項目
-
新聞中心
- 公司新聞
- 行業新聞
-
關于我們
- 公司簡介
- 聯系方式
- 加入我們
- 咨詢服務
-
首頁
-
技術與產品
- 智能硬件
- 工業互聯
- ? 邊緣網關
- ? LoRaWAN組網
- ? 電力線載波通訊模組
- ? 閥門控制器
- ? PLC數據采集網關
- 電力
- ? 一鍵順控裝置
- ? 底盤車物聯網控制器
- ? 機械特性監測裝置
- ? 低壓綜??刂颇K
- 智能硬件
- 新能源
- ? 清潔機器人控制器
- ? 逆變器數據采集網關
- ? 紅外抄表采集裝置
- ? 儲能EMS管理機
- ? 就地顯示屏
- 平臺軟件
- ? 成套設備在線監測平臺
- ? 智能開關柜專家診斷系統
- ? 母線槽智能在線監測平臺
- ? 光伏清潔機器人遠程運維平臺
- ? 光伏電站遠程運維平臺
- ? 新型儲能管理系統EMS
- AI智能體
- ? 智能畫圖機器人
-
解決方案
- 新能源
- “無人值守”光伏電站智能運維解決方案
- 光伏清潔機器人智能控制和運維解決方案
- 光伏柔性支架在線監測物聯網解決方案
- 場站光伏組件缺陷現場檢測解決方案
- 新型儲能管理系統(EMS)解決方案
- 直流電源屏在線監測解決方案
- 電力
- 成套開關柜在線監測物聯網解決方案
- 中低壓電氣設備智能化升級解決方案解決方案
- 多模態智能感知、一鍵順控專家系統
- 真空斷路器智能化解決方案
- 操作機構機械特性物聯網軟硬件一站式解決方案
- 母線槽智能在線監測解決方案
- 低壓綜保模塊智能解決方案
- 工地臨時配電箱在線監測物聯網解決方案
- 機械裝備
- 變頻器物聯網軟硬件一站式解決方案解決方案
- 科研儀器在線監測物聯網解決方案
- 智能割草機遠程控制物聯網解決方案
- 工業縫紉機物聯網解決方案
- 電梯空調遠程監控物聯網解決方案
- 碼頭卸船機遠程運維物聯網解決方案
- 鋸床在線監測物聯網解決方案
- 礦山機械遠程運維物聯網解決方案
- 智慧水務
- 水泵物聯網軟硬件一體化解決方案
- 萬州城區智慧排水體系升級解決方案
- 智慧供暖
- 智慧供暖全景運營物聯網解決方案
- 空氣源熱泵熱站專項系統
- 智慧供熱用戶繳費平臺系統
- 智慧供熱用戶監控平臺系統
-
成功案例
- 電力
- 基于多源數據融合的高壓斷路器健康管理系統設計項目
- 高壓斷路器數據采集與故障診斷技術研究項目
- 新能源
- 基于無人值守的大跨距高凈空的柔性大型光伏電站智能在線監控項目
- 基于數據挖掘的光伏電站遠程運維技術項目
- 機械裝備
- 萬州城區智慧排水體系升級排水設施安全監測項目建設實施方案
- 智慧供暖全景運營物聯網解決方案項目
- 空氣源熱泵熱站專項系統熱站監控系統項目
- 智慧供熱用戶繳費平臺系統項目
- 智慧供熱用戶監控平臺系統項目
-
新聞中心
- 公司新聞
- 行業新聞
-
關于我們
- 公司簡介
- 聯系方式
- 加入我們
- 咨詢服務
-
首頁_07180934_815_10151909_993
-
首頁_07180934_815
-
首頁_old
-
首頁_250319
-
首頁_03251519_245
-
首頁_07180934_815_10151909_993
-
首頁_07180934_815
-
首頁_old
-
首頁_250319
-
首頁_03251519_245
【行業動態】AI自己造AI,概率60%,2028年底前!Anthropic聯創坐不住了
AI系統,可能很快就能自行構建自身了!
說這句話的人,是Anthropic聯合創始人Jack Clark。
5月4日,他在X上發帖:「我認為,遞歸自我改進(RSI)有60%的概率在2028年底之前發生?!?/span>

除了Anthropic聯合創始人身份之外,Clark還是《Import AI》的創辦者兼主筆,長期跟蹤AI能力進展。
這次發帖,他在《Import AI》上同時發布了一篇完整的分析文章。

https://importai.substack.com/p/import-ai-455-automating-ai-research
這是一件大事。我不知道該如何理解它。這是一個我不情愿接受的看法:其影響太過巨大,讓我感到自身渺小,而且我不確定,社會是否已準備好迎接自動化AI研發所帶來的變革。
Clark在文章里寫:如果這一天到來,人類將跨過一道「盧比孔河」,進入一個幾乎無法預測的未來。
他不認為這會發生在2026年,但他預判一兩年內可能在非前沿模型上,出現這樣的概念驗證:一個模型,端到端訓練出自己的繼任者。
支撐Clark結論的,主要來自公開信息:arXiv、bioRxiv、NBER上的論文,加上他對各大前沿實驗室產品的持續觀察,Clark以此拼湊出一幅關于AI進展的全景圖。
在他看來,AI工程化生產的所有組件,今天已經基本齊了。剩下的問題是:模型什么時候能積累足夠的創造力,開始像人類研究員一樣推動前沿演進。
四年
從30秒到12小時
Clark的核心論據,是一批能力進展曲線。
先看METR的時間軸圖。

https://metr.org/time-horizons/
METR是一個專注AI能力評估的機構,他們追蹤的是:AI系統能獨立完成一項任務,在50%成功率水平線上,這項任務如果讓一個熟練的人來做大概需要多少時間。
-
2022年,GPT-3.5的數字是:30秒;
-
2023年,GPT-4把這個數字推到了4分鐘;
-
2024年,o1推到了40分鐘;
-
2025年,GPT-5.2(高配版)跨到了6小時;
-
2026年,Claude Opus 4.6已經到了12小時。
四年,從30秒到12小時,翻了1440倍!
AI能力研究員Ajeya Cotra認為,2026年底之前,這個數字有望突破100小時。
如果達到100小時時間跨度,它將能覆蓋許多多日級軟件/研究輔助任務。
編程能力同樣也在起飛。
SWE-Bench衡量的是AI解決真實GitHub工程問題的能力。2023年底,Claude 2的得分是2%。到今年,Claude Mythos Preview達到93.9%,這個基準基本被打穿了。
CORE-Bench測的是另一件事:給AI一篇論文和對應的代碼庫,讓它獨立復現實驗結果,這是AI研究員最基本的日常工作之一。
2024年9月該測試推出時,最好成績是21.5%。2025年12月,Opus 4.5在Claude Code scaffold下verified accuracy 為77.78%,經人工校驗后為95.5%,項目方稱CORE-Bench已被解決。
https://hal.cs.princeton.edu/corebench_hard
15個月,從21.5%到95.5%。
MLE-Bench測的是AI獨立參加Kaggle競賽的能力,覆蓋75個真實比賽項目。
2024年10月發布時最高分16.9%,到2026年2月,Gemini 3加搜索工具的組合已經達到64.4%。
https://github.com/openai/mle-bench
Anthropic內部還有一個測試:讓模型優化一個僅使用CPU的小型語言模型訓練代碼,越快越好,以未優化版本的速度為基準。
-
2025年5月,Claude Opus 4:2.9倍;
-
2025年11月,Opus 4.5:16.5倍;
-
2026年2月,Opus 4.6:30倍;
-
2026年4月,Claude Mythos Preview:52倍。
不到一年,從2.9倍漲到52倍。
這是AI在優化AI訓練代碼這件事情上的進展速度。
99%的工程活
AI快接完了
這里有一個關鍵問題:AI研究這件事,到底有多少是純工程,多少是真正的創意?
Clark給出了一個框架,引用了愛迪生那句話:天才是1%的靈感和99%的汗水。
他認為,AI研究也是如此。
一個典型的AI研究循環是這樣的:拿一個現有系統,在某個維度上擴大規模,觀察什么地方開始出問題,修掉工程問題,再擴大一輪。
這個過程里,大部分工作是數據清洗、跑實驗、調參數、讀論文、復現結果,這些都是「汗水」,不是「靈感」。
偶爾會出現真正改變范式的發明,比如Transformer架構,比如混合專家模型(MoE)。但那是1%,而且這1%越來越不是瓶頸,因為那99%的工程工作正在被AI快速接管。
Clark列了幾個信號:
AI已經能管理其他AI。Claude Code、OpenCode這類工具里,單個AI可以扮演「項目經理」,把任務分發給多個子AI并行處理,之后匯總結果。
這和一個人類研究團隊的組織方式沒有本質區別。
PostTrainBench測試了一件事:AI能不能自己微調開源小模型,提升它在某個任務上的表現?
這個工作通常是前沿實驗室里有經驗的研究員在做。
截至2026年3月,AI系統在這個任務上能做到人類研究員效果的一半左右,大約是25%到28%的提升幅度,而人類基線是51%。
https://posttrainbench.com/
Anthropic內部還有一個「自動化對齊研究」的概念驗證:讓一組AI agent,在AI安全研究問題上自主攻關。
結果是,AI給出的方案超過了Anthropic人類研究員的基線。
https://www.anthropic.com/research/automated-alignment-researchers
Clark把這些證據串在一起的判斷是:AI今天已經能自動化AI工程的絕大部分,AI研究里有多少能自動化,還不完全清楚,但跡象已經很明顯。
質疑聲也來了
Clark的帖子發出后,行業里也出現了一些質疑。
華盛頓大學機器學習教授,《終極算法》作者Pedro Domingos回復到:「從LISP在50年代發明以來,AI就能構建自己了。問題在于,這個過程究竟能帶來遞增回報還是遞減回報——而目前沒有任何證據支持前者?!?/span>
遞歸自我改進聽起來很科幻,但能循環不等于循環有收益。如果每一代AI優化自己的效率只有邊際改善,而不是指數級放大,那這件事的影響范圍會非常有限。
還有人質疑概念邊界。「RSI到底有沒有一個權威定義?」一位名叫Dan Brickley的研究員問道。
另一個更尖銳的觀察來自賬號@crepesupreme:
2027年30%,2028年60%。一年內概率跳升30個百分點,意味著2027到2028年之間存在某個不連續的能力事件。那個具體事件是什么?
Clark在通訊文章里回應了這個隱含問題:他認為AI研究仍需要某種創意突破才能真正進入「自我研發」循環:AI目前在這一塊還沒有變革性的表現。這正是他給2027年只打30%的原因;而如果這個缺口在2028年底前被填上,概率就升到60%。
但他同時也承認,自己預判的是概率,而不是確切的時間點。
還有人問他:「你在Anthropic工作,你為什么要去翻公開數據?直接走下樓去問研究員不就行了?」
Clark的答案是:用公開數據,是因為公開數據才有可信度。他要的不是內部判斷,是一個任何人都能獨立核驗的結論。
窗口還開著
但在縮窄
Clark在通訊文章里寫:他為什么不給2027年更高的概率?
因為他認為AI研究還包含一些對創意直覺的要求,而AI目前在這一塊只有「誘人的早期信號」,還沒有系統性突破。
他列了兩個信號:一個是Gemini模型參與攻克Erd?s數學問題,在700個問題里解出了1個被數學家認為有一定原創性的解。
另一個是斯坦福、UBC等機構與Google DeepMind合作,AI在發現新數學證明中起到了「非常實質性的作用」。
這些結果在AI能力演化的時間軸上,可能是某種早期信號。
Clark的估計是:如果2028年底沒有出現他描述的情況,那說明當前技術路徑存在某個根本性的能力天花板,需要人類的創意才能突破。
更關鍵的是「如果出現了」之后的問題。
Anthropic在2026年3月宣布成立The Anthropic Institute時,官方聲明里寫了這樣一句話:
如果AI系統的遞歸自我改進確實開始發生,那么世界上誰應該被告知,以及這些系統應該如何治理?
https://www.anthropic.com/news/the-anthropic-institute
連Anthropic自己,都還沒有這個問題的完整答案。
Clark在通訊文章里給出了一個更技術性的擔憂:今天的對齊技術,如果有99.9%的準確率,在遞歸迭代50代之后,準確率會跌到95.1%;迭代500代之后,跌到60.5%。
除非你的對齊方案在理論上能保證在更智能的系統上同樣有效,否則問題會很快出現。
也許,Clark想要說的是:治理窗口是有限的,而且它正在縮窄。他希望通過文章發出一個提醒:這件事留給討論、研究和治理設計的時間,比大多數人想象的短。
據奧特曼直播及媒體報道,OpenAI的目標是讓AI在2026年9月前達到「AI 研究實習生」水平,2028年達到更完整的自動化研究員;Anthropic自己也在發表自動化對齊研究的概念驗證;一家叫Recursive Superintelligence的新公司剛剛完成5億美元融資,其目標之一就是自動化AI研究。
整個行業已經在朝這個方向加速了。
Clark說,無論從哪個維度看,數據都指向同一個方向,而每一條曲線,都在向右上方飛,時間越長,能力越強,而且沒有任何一條顯示出減速的跡象。
注:文章來源于為微信公眾號《新智元》。
