原文連結: 從資料中心到戴森球:P-1 AI 的硬體工程 AGI 之路
再者,過去幾年當我問到,為什麼沒有人在研究用於建構實體世界的人工智慧時,答案基本上都是訓練資料,對吧?根本上來說,如果你想要一個能協助你設計飛機或修改飛機的人工智慧工程師,然後你問:「嘿,如果我把 A320 的機翼面積增加 10%,會發生什麼事?」嗯,為了能夠回答這個問題,你的模型最好是用數百萬種飛機設計來訓練的。然而,自從萊特兄弟以來,根本就沒有設計出數百萬種飛機,即使你奇蹟般地取得了所有這些設計資料——但你並沒有。而且,即使它們都以一種連貫的、語義整合的方式建模——但它們並沒有,對吧?但即使是假設性的情況,你可能也只有大約一千種設計,對吧?自航空誕生以來。
所以,這遠遠不足以訓練一個大型[音樂]模型。今天我們很高興歡迎 P1 AI 的執行長 Paul Arnango。Paul 曾是 DARPA 的主管,並在 35 歲時成為 Airbus 最年輕的技術長。現在,他正在 P1AI 將他的科幻夢想變為現實。P1AI 試圖為實體世界建構工程通用人工智慧(AGI)。
所以我們已經有了像 Enthropic Cursor 和 Devon 這樣出色的公司,它們正在改變軟體工程。但是,無論是資料中心的冷卻器還是飛機,實體世界的硬體工程尚未被 AI 徹底改變。我們與 Paul 討論了這個機會、收集資料的主要瓶頸,以及他如何設想他們的代理人 Archie 不斷進化,以協助建構我們周遭的實體世界,從戰鬥機到星艦。
Paul,非常感謝您今天加入我們,我們很高興您和您的傑克羅素㹴米格魯混種犬 Lee 一同參與節目。歡迎。嗯,讓我們從我們剛舉辦的 AI 會議 AI Ascent 開始。在會議上,Jeff Dean 談到了 vibe coding 的潛力,以及在未來一年左右,AI 如何可能實現一位全年無休的初級軟體工程師。
所以,軟體工程似乎正經歷著這個垂直起飛的時刻。您認為在實體工程方面,實體世界正在發生什麼事?
為何實體世界的人工智慧發展緩慢?
簡短的答案是,沒有太多進展。嗯,我們創立 P1AI 的原因之一是,你知道,我從小看硬科幻長大,我被承諾會有 AI 協助我們建構,你知道的,實體世界,我們周遭的世界,最終是星艦和戴森球。
當深度學習革命真正開始起飛時,我問了一個問題,嗯,誰在建構這些東西?像是,誰在做那個能幫助我們建構實體世界的 AI?答案是沒有人在做。而且它甚至不在那些基礎實驗室的議程上。
嗯,幾年後的今天,2025 年,情況依然如此,對吧?所以,呃,我們問了為什麼會這樣。嗯,我們可以在之後的播客中討論為什麼會這樣。我們認為我們有一個解決方案,可以補救一些原因,一些挑戰,並真正將其推向市場。所以我認為,順帶一提,Jeff,我們非常感謝他成為公司的天使投資人,我認為,呃,你知道,編碼 AI 已經醞釀了很長時間。
呃,我的一位共同創辦人 Sushma Jad 在 2011 年就以程式合成為主題完成了他的博士論文,對吧?所以這不是一項新技術,但我認為它現在才找到產品市場契合點,對吧?正確的包裝、正確的商業模式、正確的定價模式。我認為實體 AI,呃,我們有幸站在許多編碼 AI 工作的巨人肩膀上。所以,如果你能對你的實體系統進行程式化表示,你就可以使用一些程式合成類型的技術,嗯,來創造實體設計。所以,我們並非,你知道,這不會花上十年或十五年。嗯,我們認為我們今年就能把技術積木組合起來,並希望最快明年就能開始找到產品市場契合點。
關鍵的技術積木
可以嗎?是的。我們可以深入探討一下嗎?那些技術積木是什麼?需要哪些部分到位才能讓這一切成為現實?是的。
所以,所以最大的問題,對吧?而且,再說一次,過去幾年我一直在問,為什麼沒有人在研究用於建構實體世界的人工智慧,答案是訓練資料,對吧?根本上說,如果你想要一個人工智慧工程師來幫助你設計飛機,或者修改飛機,然後你說,嘿,如果我把 A320 的機翼面積增加 10%,會發生什麼事?
嗯,為了能夠回答這個問題,你的模型最好是用數百萬種飛機設計來訓練的。然而,自從萊特兄弟以來,根本就沒有設計出數百萬種飛機,即使你奇蹟般地取得了所有這些設計資料——但你並沒有。而且,即使它們都以一種連貫的、語義整合的方式建模——但它們並沒有,對吧?但即使是假設性的情況,你可能也只有大約一千種設計,對吧?自航空誕生以來。
所以,這遠遠不足以訓練一個大型模型。因此,對我們來說,最基礎的技術積木就是創建這個訓練資料集。它是合成的,嗯,基於物理原理並結合供應鏈資訊,包含了任何實體產品領域的假設性設計。所以可能是飛機,也可能是其他東西。
嗯,而且,呃,讓它足夠大,嗯,並且讓它足夠有趣。所以,大多數實體產品的設計空間幾乎是無限大的,對吧?就像,它非常巨大。所以你無法隨機取樣。你也無法均勻取樣。你必須非常巧妙地取樣。你希望在主流設計周圍密集取樣,但在設計空間的角落和邊緣則稀疏取樣。
嗯,因為那能教會你一些東西。即使設計空間的那個角落或邊緣是你永遠不想去的地方,嗯,它也能教會你的模型為什麼會這樣,對吧?嗯哼。所以,所以創建這些,呃,這些用於訓練模型的資料集,這就是,呃,我們方法的核心。
當然,如果你現在有一百萬個飛機設計,以及每個設計的性能向量,然後你在後訓練階段,甚至在預訓練階段,加入一個大型語言模型(LLM),你並不會奇蹟般地得到一個好的工程師,對吧?所以,接下來的問題是,模型的架構看起來是怎樣的?嗯,今天我們使用一種由許多不同模型組成的聯邦式方法,我們可以,我們可以更詳細地討論它們,嗯,這些模型負責工程推理的不同部分,然後它們都由一個類似協調者的推理大型語言模型(LLM)來協調,這個 LLM 同時也作為與使用者的介面。
實現基於物理的推理與供應鏈整合
你能多談談這個嗎?你如何讓你的模型能夠進行基於物理的推理?這些工作現在是在某種設計軟體中完成的嗎?這些東西是在工程師的大腦裡嗎?你如何將這些知識放入模型中?我能再補充一下方程式中供應鏈資訊的部分嗎?這一切是如何發揮作用的?當然。
當然。那麼,嗯,首先讓我或許描述一下產品實際上是什麼,好嗎?因為我認為那將有助於回答問題的一部分。嗯,所以我們在某些方面非常專注於人類工程師在設計實體系統時所做的認知自動化。那麼,人類工程師做些什麼呢?人類非常擅長接收一堆需求,並從中提煉出關鍵的設計驅動因素。
假設一個或多個可能的解決方案來滿足這些設計驅動因素,進行初步的規模估算,大致了解答案會是什麼樣子,對吧?以及在進行這種規模估算時,相關的現象學是什麼?我所說的現象學是指,像是不同的物理現象,因為這不僅僅關乎幾何形狀,對吧?這些是多物理場系統,所以它們有電氣、熱、振動、電磁干擾等等,有時這些很重要,有時則不重要,對吧?而人類非常擅長,優秀的工程師。
對吧?他們非常擅長在進行初步規模估算時,選擇哪些模態是重要的,以及這是否真的能成功,這是否真的會是一個可行的設計,然後人類非常擅長了解有哪些工具可用於詳細設計和分析。這些工具的適用範圍是什麼?以及如何使用它們?如何為這些工具設定問題?而這正是我們試圖解決的認知自動化問題。
嗯,所以第一個產品叫做 Archie。所以如果我提到 Archie,那不是,那不是 Lee。Archie 是代理人。嗯,專注於認知自動化的一個非常重要的結果是,我們並非試圖在工具層面競爭。現有的詳細設計、分析和模擬工具已經存在,我們希望 Archie 知道如何使用那些工具,就像人類知道如何使用它們一樣。
但我們不試圖取代工具。我們不試圖讓它更好。我們不試圖與它競爭。我們不試圖以任何方式取代它。對。我們只是了解到它們的存在,呃,以及它們的有效範圍,並且就像人類一樣,在它們之上運作。沒錯。是的。所以你的問題是關於,呃,那麼有哪些不同的模型,對吧?以及你如何,你如何進行工程推理,嗯,基本上所有我剛才描述的事情,提煉需求,挑選關鍵設計驅動因素,規模估算等等。
它們都簡化為幾個基本操作,嗯,這些操作包括設計評估,對吧?所以如果你有一個特定的設計,那個設計的性能如何?嗯,再次強調,模擬相關的現象技術,那是,那是在設計中的。另一個是設計合成。所以如果我有一個指定的性能或指定的需求,呃,向量,那麼設計是什麼?嗯哼。對。
第三類則稍微複雜一些,那就是在設計中找出錯誤並進行填補。但基本上,任何工程查詢,任何人類工程師所做的工程任務,嗯,都可以簡化為這些操作的某種序列。嗯哼。嗯,所以我們接下來要做的是,首先要有一個能夠從組織中的人類那裡接收任務,並將其分解為正確的基本操作序列的推理協調器,然後是模型,有些模型是神經網路,有些則不需要是神經網路,嗯,這些模型實際上擅長執行那些操作。嗯哼。
嗯,所以協調推理器背後的一些東西,例如,是一個圖神經網路,它非常擅長作為性能空間上基於物理的代理模型。
對吧?那是一個例子。另一個是幾何推理模型,它可以讓你回答關於相對定位、封裝、干擾等等的問題。有些幾何推理操作非常容易,只需透過演算法,就像軟體 1.0 的風格一樣,對吧?你不需要神經能力。
一些更複雜的你可以用視覺語言模型(VLM)來做。嗯,呃,我認為還有另一類實體推理操作,我們還不知道如何解決。嗯,而且我認為將會有一代,呃,AI 模型即將問世,它們將是實體世界模型。嗯哼。嗯,它們對於空間,對於一些更複雜的高階空間推理任務,將有更好的直覺。
嗯,然後你有物理推理,對吧?你有某種多物理場推理。嗯,同樣有幾種不同的方法。有些是軟體 1.0。有些是神經網路。一個例子是,我們有所謂的「腦白質切除術」大型語言模型(LLM)。呃,它是一個 LLM。它不再擅長英語。嗯,但它非常擅長對實體系統設計的多物理場表示進行程式化表示,並對其進行推理。 所以,嗯,這算是一種由 LLM 推理器協調的模型聯邦組合,嗯,這個推理器同時也是使用者的介面。
Archie 的當前能力與評估 (Archie IQ)
Archie 今天能做什麼?這與現今一般的硬體系統工程師相比如何?Archie 的未來展望又是什麼?是的,這是個好問題。
所以,所以我們今天所做的,我們公司成立大約九個月了。嗯,我們在種子輪前期所做的,基本上是一個玩具示範,嗯,圍繞著住宅冷卻系統,對吧?所以像是空調裝置,那類東西。嗯,而且,呃,我們選擇那個的原因是,它是一個相當多物理場的領域。
所以你有流體流動,你有氣流,你有熱交互作用,你有,呃,嗯,電氣系統,對吧?所以,所以它很豐富,但系統中的組件數量不是很多,而且很多物理現象學是相當線性化的,對吧?就像你可以簡化它。嗯,所以它足夠豐富,足以令人信服,但又不會複雜到讓我們陷入例如資料生成的困境,對吧?或者供應鏈的部分,我想稍後再談,嗯,把它做好。
嗯,呃,所以那個展示已經存在了。我們已經公開發布了。嗯,而且,呃,問題當然是,它到底有多好,對吧?嗯,除了進行「感覺測試」(vibe test),對吧?就是讓人與它互動,然後你覺得「哦,還不錯」。嗯,目前並沒有一個真正好的答案。
所以我們投入了相當多精力的一件事,就是針對實體系統 AI 和實體工程 AI 的評估。嗯,而且,呃,到這個節目播出時,我想我們會有一篇 Archive 論文發表,嗯,那篇論文會描述我們的評估方法。我們稱之為 Archie IQ。嗯,目標是對人類進行評估。
所以,一位入門級的人類工程師、一般的人類工程師、專家級的人類工程師,以及 Archie,讓我們能夠有一個封閉循環的過程來改進,呃,改進 Archie,使其在 IQ 量表上不斷提升。
Archie 的發展藍圖:從資料中心冷卻到航空航太
你認為你會繼續專注於住宅冷卻系統,然後你會擁有一個住宅冷ENING系統代理,最終會成為一個飛機設計代理、一個星艦設計代理嗎?這是正確的思考方式嗎?或者你正在建構的是一個單一的代理?不,我認為正確的思考方式是,至少在初期,我們必須為每個產品領域、每個產品垂直市場創建不同的訓練資料集。你們是如何規劃這個藍圖的?比如,如果藍圖從住宅冷卻系統開始,接下來會如何發展?這個整體的藍圖看起來是怎樣的,才能達到為實體世界建構工程 AGI 的目標?藍圖上有哪些內容?是的。
所以,所以首先,住宅對我們來說只是一個我們選擇的玩具問題。嗯,我們的第一個市場,我們計劃與客戶、與設計夥伴一起部署的市場,實際上是資料中心冷卻系統。好的。它們仍然是熱力引擎,對吧?所以,它們與住宅暖通空調並沒有那麼大的不同,但它們的複雜度顯然高出一個數量級,規模也大得多,而且這是一個非常有趣的市場,因為它們在應對資料中心客戶的需求方面遇到了困難。
我們正處於一個冷卻系統成為長期瓶頸,制約資料中心發展的時刻,這有點瘋狂。所以這是一個迫切的痛點。嗯,在很多方面,這些系統的交付受到工程頻寬的限制,也就是說,無法為每個資料中心提供半客製化的解決方案。
所以,我們擁有一個非常熱情的客戶群,呃,為了那個早期部署。而這些系統,你知道,現在系統中大約有一千個獨特的零件。好的。對。物理領域相當豐富,但物理現象本身仍然相當線性化。對。所以從合成資料生成的角度來看,這是一個相當容易處理的問題,這就是為什麼我們喜歡把它作為第一個,第一個垂直領域。 嗯,然後我們繼續發展,我想我們的發展主要基於,呃,合成訓練資料,這種基於物理的合成訓練資料的複雜性。嗯,所以我們,我們的期望是,我們每年在產品複雜度上大約會提升一個數量級。好的。嗯,所以第二個垂直領域可能是工業系統。
像是工廠裡的那些東西,從物料搬運、工業機器人、銑床、車床,對吧?那些東西。嗯,然後我們進入行動領域。嗯,可能是汽車,可能是農業、礦業設備,對吧?那些汽車和重型機械,然後是航空航太和國防。是的。
嗯,但只是給你一個數量級進展的概念,資料中心冷卻系統大約有一千個獨特零件,飛機大約有一百萬個獨特零件,對吧?所以它們之間相差三個數量級,而且我們認為,根據我們目前的預測,每個數量級大約需要一年時間。
訓練資料與客戶整合
訓練系統所需的資料有多少來自系統的使用,使得簡單的用例開始引導更複雜的用例?有多少是從您擁有的其他訓練資料生成技術提供給系統的?所以我們認為我們可以將 Archie 訓練到入門級工程師的水平。
所以像是大學畢業,嗯,但在特定公司的產品或一些深入的流程和實務方面並不是特別精通。是的。或者很多詳細的供應鏈,你知道,原因資料。那不是你在大學裡學到的東西。是的。對。所以我們認為我們可以僅憑我們產生的非專有合成資料來做到這一點,意思是非客戶專有。
嗯,所以目標是讓 Archie 被聘為入門級工程師,對吧?讓他進門。嗯,然後我們與客戶建立關係。我們有資料,資料,呃,資料共享協議,對吧?以及所有這些事情都已解決,然後 Archie 就可以開始學習防火牆後面的東西了。是的。對。當然,這要取決於客戶的默許,對吧?但我們,我們然後可以導入他們的產品生命週期管理(PLM)系統。
我們可以導入他們所有基於模型的,呃,嗯,呃,呃,基於模型的工具和模型。嗯,我們可以導入大量該系統的真實世界,呃,性能資料。品質問題,對吧?那些,那裡有很多東西。嗯,而且,所以我們認為 Archie 可以憑藉大量真實世界資料,當然還有,呃,AI 模型的改進,相當迅速地從入門級提升到一般,再到專家級工程師的專業水平。
工程 AGI 的定義:布魯姆分類法的應用
當你談到工程 AGI 時,你有定義嗎?我們還沒有找到一個普遍認可的 AGI 定義。你對 AGI 的定義是什麼?它如何適用於未來的測試,當你擁有工程 AGI 時,你怎麼知道你擁有了它?是的,所以回到評估,嗯,我們採用了所謂的布魯姆分類法,這是一個認知知識分類法,用於人類學習,於 50 年代開發,近年來已應用於大型語言模型。嗯,我們已將其調整以適應工程任務。所以該分類法有一個金字塔結構,對吧?在最低層,你只有資訊的回憶,對吧?這相對簡單。然後你對設計有語義理解。所以除了回憶之外,像是這個零件做什麼用?嗯,然後你具備評估一個設計或對設計進行修改的能力,對吧?所以例如更改這個組件或重新調整某些東西的尺寸,對性能有什麼影響?嗯,然後是,呃,找出設計中錯誤的能力。
對吧?所以這是錯誤校正和填補。嗯,然後是合成一個全新的設計,或對現有設計進行重大修改。然後是頂峰,我們稱之為 E AGI,工程 AGI,那就是反思,也就是某種程度的自我意識,關於我剛才使用了什麼流程來完成這個層級結構中前面五個級別的工作。
嗯,我用了什麼流程?那個流程有哪些限制?有沒有替代的流程?我可能在哪裡出錯了?這些是實際上大多數在現場的工程師都做得不太好的事情,嗯,而且通常是保留給資深級別、專家或技術院士,對吧,在大型工業公司中。
所以對我們而言,那確實是人類工程智慧的頂峰,就是對工程過程本身及其局限性的自我認知。嗯,然後還有一個不同的維度,那就是它是否能夠在我們沒有針對該領域進行訓練的情況下,跨領域進行泛化。
嗯,所以我想說這是兩個軸向,你可以說你可以在一個軸向上實現某種 AGI,在另一個軸向上實現 AGI,或者在兩個軸向上都實現 AGI。嗯,任君選擇。我們希望能做到兩者。
擴展至複雜系統:是否需要研究突破?
你認為要解決目前零件複雜度數量級的系統,一直到飛機甚至更多零件的系統,需要什麼?僅僅是規模法則的問題嗎?你知道,大型語言模型會變得更好,你將能夠產生更多合成數據,然後更多數據、更多運算、更大的模型,你就能夠在未來解決這些更複雜的系統,還是你認為需要研究突破才能達到目標?不需要研究突破,我想,我想我們完全是在應用研究領域運作,對吧?我們採用前沿實驗室正在進行的現有研究,並將其應用於我們非常具體的,我們非常具體的問題。
嗯,我們沒有看到,我的意思是,我的意思是,顯然在擴展方面存在計算能力的限制,對吧?要生成,所以有 CPU 計算來生成合成資料,嗯,因為那涉及到大量的模擬和取樣等等,然後有 GPU 計算來訓練,GPU 計算來進行推斷,嗯,所有這些,今天我認為我們無法為一個百萬零件的系統做到,對吧?因為如果你想想,或許可以回到你關於供應鏈從何而來的問題,Pat,嗯,就是,所以,我們如何創建這些合成資料集?嗯,如果一個系統中有一百萬個獨特的零件,嗯,為了組成某種跨越設計空間的組合,並創建,你知道,非常大量的相鄰系統和一些遠距離系統,嗯,你需要一個組件目錄,一個組件模型目錄,以及一些規則,你可以根據這些規則將這些組件組合成系統。
嗯哼。嗯,而且你的零件目錄需要比一個典型的系統設計大上幾個數量級。好的。所以如果一個系統中有一百萬個獨特零件,你的零件目錄可能需要一億或十億個,呃,十億個零件,所以你需要創建那個零件目錄。好的。
嗯,今天我們是手動進行的。嗯,我們正在建構大量的自動化工具,實際上還有很多 AI 工具,嗯,來幫助我們建構那個零件模型的零件目錄。嗯,然後你必須智慧地組裝那些零件。所以這不是龍捲風掃過廢料場然後組裝出一架 747,對吧?而是你實際上有一些方法來創建它。
嗯,然後你必須模擬每一個,並得到一個性能向量,對吧?那就是訓練資料集。
供應鏈的角色
所以它具有供應鏈資訊,因為理論上,你目錄中的所有組件要么反映了供應鏈中的真實組件,要么你可以引入假設性組件,對吧?因為有時創新不僅僅是組裝現有的東西,而是說:「嘿,我需要一個新的馬達,或者我需要一個新的壓縮機。
我需要這個新的東西,或者我需要那個新的東西。」是的。對。所以你可以引進不存在的新組件,但你知道那些是什麼,以及你計劃如何獲得它們。是的。對。所以這就是我們所說的「供應鏈知情」。而「基於物理」意味著組裝這些組件的規則模擬了你關心的所有相關互動模式,以及它們如何互動的現象學。
嗯,而且,呃,產生的設計確實是可實現的設計。
客戶視角:大型工業公司的工程流程
我很想聽聽顧客回饋的觀點。所以你以前,你知道,你以前就是顧客。值得注意的是,你曾是 Airbus 的技術長。嗯,或許你能否為我們這些沒有待過工業巨頭核心的人,稍微說明一下設計一架新飛機的流程是怎樣的?或者,你知道,這些公司的所有工程師都在做什麼?
在工程 AGI 出現前後,他們的生活又是什麼樣子?是的,這是一個非常好的問題。所以,呃,我想我已經給你一個合理的抽象描述,說明工程師做什麼,那就是他們根據一套需求來操作,這些需求可能不是系統層級的需求,對吧?工程師可能在處理一個子系統、一個組件或一個小玩意兒,嗯,對吧?但他們仍然有需求,他們仍然需要從那些需求中挑選出關鍵的設計驅動因素,找出解決方案,進行初步的規模估算,然後進行詳細的分析。對吧?那個工作流程
以一種分形的方式在整個系統和整個工程組織中被複製,而工程組織的設計大致上是為了反映你正在建構的產品,對吧?嗯,而且,而且我們將 Archie 定位為既是代理人(agent),意味著他相當自主,所以他不是助手(assistant),嗯,他真正的設計目標是增強一個團隊,而不是幫助個人。
對吧?所以我們試圖將 Archie 定位為加入團隊的一名員工。呃,我們的使命宣言之一是,世界上每家主要工業公司的每個團隊都有一位 Archie。嗯,而且,呃,Archie 加入團隊,目標是向這些公司銷售「工作」,而不是,呃,不是軟體。
是的,向像 Airbus 這樣的公司銷售軟體工程軟體非常非常困難。嗯,生態系統中有數百甚至數千種工程工具,它們以各種複雜的方式連接在一起,委婉地說,對吧?有時,有時是不太優雅的,對吧?像是用膠水黏合的方式。將一個新工具引入那個生態系統非常非常複雜。
此外,這些公司的勞動力預算遠大於方法和工具,也就是軟體預算。嗯,所以你想要解決的是勞動力的部分,嗯,而不是工具的部分。
Archie 作為團隊成員
所以,Archie 的設計初衷就是要出現在團隊中,成為一名遠端工程師。所以顯然沒有實體化身。嗯,但他會出現在 Slack 或 Teams 或任何你正在使用的協作工具上,然後你就像對待一名初級工程師那樣給他分配任務,這位初級工程師或許在海外的工程中心工作,你就那樣與他互動。所以實際上,將 Archie 引入組織的阻力非常小。
你不需要做任何不同的事情。你不需要改變你的流程。嗯,你只是擁有這個成本較低的實體出現。嗯,Archie 可能在某些方面做得更好,在其他方面可能做得更差。
嗯,但是,但是目標是,是將他定位為一名工作者。
Archie 名字的由來
為什麼叫 Archie?這個名字是怎麼來的?嗯,所以它是字母 A。所以這讓我們可以在未來有 Bob、Charlotte 和 Daniel。嗯,呃,Archimedes,建築師(architect),對吧?所有這些我認為都與我們正在做的事情有關聯。
Archie 的初期應用場景:產品客製化
你認為 Archie 將會處理哪些類型的問題?你預期這會如何改變團隊中人類工程師的工作方式?在資料中心的應用中,這是我們預期今年進行試點的第一個應用,嗯,我們認為 Archie 最有前景但也最適用於其他領域的用例,基本上是進行產品客製化。所以是半客製化,在資料中心冷卻領域,他們稱之為「特製品」(specials)。
嗯,這是指採用現有的產品平台,並針對特定客戶的使用案例進行客製化。如此一來,才能滿足架構需求,對吧,滿足功能需求,滿足建築法規等等。呃,而這往往因個案而異,而且相當客製化。這也是大部分工程時間投入的地方。
嗯,所以這就是我們首先要用 Archie 解決的問題。嗯,但這個問題可以很好地轉移到其他領域。例如,Airbus 很少進行全新的飛機設計,但會做很多衍生型號,或者很多所謂的「領頭型號」(head of variants),這些是為特定航空公司設計的特定產品,對吧?有特定的客艙、特定的機上,呃,配置,機上娛樂配置,特定的駕駛艙,呃,需求等等。
對吧?所以這就是大多數工業公司的大多數工程師所做的事情,就是半客製化,呃,某種半客製化。
工程 AGI 的長遠影響
如果我們展望到 2030 年、2040 年,某個長遠的未來,世界上有數百萬、數百萬、數百萬的 Archie,或許還有 Bob、Charlotte 和 Daniel,嗯,而你已經實現了實體世界的工程 AGI。
一般人會如何感受到這帶來的影響?比如,他們會如何注意到,由於工程 AGI 的出現,他們的生活發生了怎樣的改變?所以我認為,呃,我認為這是一個時間跨度的問題,對吧?而且,呃,我對於預測超過三年以上的事情感到猶豫,尤其是在這些,呃,急遽指數型成長的時代。
呃,但我認為,我認為在初期,當 Archie 出現在工程團隊中,呃,並且讓團隊更有效率,或許幫助團隊更有效地完成工作。我們討論過的一個使用案例是,如果你每個團隊都有一個 Archie。是的。這些 Archie 之間能否比團隊之間的人類更好地協調,並且某種程度上說著他們自己的,呃,說著他們自己的速記方式。是的。
嗯,並且做那些事情。所以,所以那確實是關於提升現有工程組織的效率和效能。所以,對一般人而言,影響是更低成本的商品,對吧?以及,以及,以及產品。嗯,所以你是說我或許可以買一架飛機。對。或許。
嗯,我認為真正有趣的事情是當 Archie 能夠設計出我們無法設計的東西時,對吧?而那有點像是超級智慧的部分,它不僅僅是現有組織的效率問題,或者是提升現有組織的頻寬,而是真正設計出科幻小說中承諾給我們的東西。是的。
是的。呃,所以像是星艦、戴森球、曼特拉什卡大腦,以及那類東西。所以像是最終,我是一個夢想家。那就是為什麼,那就是為什麼,呃,我創立了這家公司,那就是我想要的未來。嗯,而那正是指引我們的北極星。但當然,我們同時也想建立一個務實且盈利的事業。
管理隨機性:AI 在關鍵應用中的挑戰
我們的合夥人 Constantine 有一個術語叫做「隨機性思維」(stochastic mindset),意思是如果你思考過去使用電腦的情況,你知道,那是預先決定的,你知道,你要求這個,你會得到那個,然而對於模型來說,你知道,根據定義,其本質中就存在隨機性的部分。
嗯,你如何思考在你的領域中管理這個問題?因為如果我思考一下,你知道,我可以隨意編寫一個網頁應用程式,如果它壞了也沒關係。但如果我隨意編寫一架飛機的程式然後它壞了,那就不太好了,對吧?那會是災難性的。所以,你如何思考管理實體世界中隨機性的本質?嗯,人類也相當具有隨機性,對吧?所以,如果你讓一個初級工程師處理一項任務,他們會犯錯。
呃,他們可能不會做正確的事。他們可能無法重複。所以我認為,呃,我認為我們需要量化,並且我們期望在今年稍後的試點中量化的問題是,Archie 產生的錯誤率是多少?嗯,如果那個錯誤率與人類工程師相當,那麼現有的工程組織中已經內建了很多,呃,很多制衡機制,以確保初級工程師犯的錯誤不會導致飛機墜毀。是的。對。
呃,所以有多層審查、有里程碑、有測試,對吧?有很多那些層次。所以如果 Archie 的錯誤率相當,或者錯誤率更好,嗯,那麼它應該能非常無縫地融入現有的流程中。
未來工程組織的樣貌
未來的工程或將會是什麼樣子?你認為未來我們會有,你知道,一人 Airbus 的等價物嗎?所以我再次不願預測超過三年的未來,我認為,我認為在未來幾年,我們的目標仍然是每個團隊都有一個 Archie。
所以 10% 的勞動力是 Archie。嗯,他們做那些人類可能覺得無聊、枯燥、對吧?呃,嗯,重複性的工作。嗯,而且或許還有額外的附加價值,像是 Archie 之間的協調,呃,諸如此類的事情。然後我可以想像一種超級智慧,你告訴它,我想要,呃,我想要你開始建造一個戴森球,然後它就開始建造戴森球。 這中間的過程難以預測。
快問快答
好的,快問快答。呃,我先來。你認為今年哪個應用程式或應用程式類別會異軍突起?
所以,我認為我們越來越接近實體 AI,不是我們討論的那種意義上的,而是指機器人技術以及用於擷取真實世界感測器資料的基礎模型。
嗯,而且我認為這兩者實際上對於我們正在努力建構的目標來說,都是非常重要的,呃,重要的基石。而且我認為它們非常非常接近。人形機器人,是或否?是的,我,我想,我想人形機器人,如果以一個基礎來說,是的,人形機器人,是的,基於與我們試圖建構一個能融入現有團隊的代理人相同的基礎。我認為人形機器人可以更容易地融入現有的,呃,現有的環境,即使它們並非最佳的,呃,最佳配置。
AI 從業人員應該閱讀哪些內容?
我想每個人都應該閱讀或重讀 Azimov 的機器人系列。啊,好選擇。因為我認為機器人三定律是經過深思熟慮的,而且實際上很多內容都需要以某種方式深深地植入這些模型中,以確保一致性。非常好的選擇。你欣賞哪些其他新創公司?我認為很多在,呃,在為,為,為擷取實體世界資料的模型所做的工作,嗯,我認為它們有點像是無名英雄,但卻非常重要,而且原因,如果,如果你不介意我對這個問題給出一個稍長的答案,我認為它們重要的原因是,你看,我們從根本上不知道神經網路為什麼能運作,對吧?但我們有一個模糊的,像是神經形態的、擬人化的,呃,觀點,哦,我們試圖某種程度上複製人類神經元的功能,然後你做足夠多的,你就會得到這些奇妙的湧現特性。
嗯,但如果你進一步思考,你會說,那麼人類是如何獲取知識的呢?
像一個人類嬰兒,他們做的第一件事就是觸摸,對吧?味覺、聽覺,呃,最終是視覺,然後是語言,然後是更高階的工程推理、空間推理,對吧?那些可能建立在語言之上,或者可能建立在他們擁有的其他一些感知,呃,呃,和感官,呃,感官模型之上的東西。嗯,對於大型語言模型(LLM)或者,或者說深度學習,我們已經複製了神經結構,對吧?在某種程度上,在某種近似程度上。但後來我們說,由於資料可用性的原因,我們要先從語言開始,我們要抓取整個網際網路,對吧?然後我們要做影片,我們也要做圖像,對吧?所以是視覺。但我們跳過了觸覺、味覺、聽覺等等,對吧?而我認為觸覺對於建立感知,對於,而且我一直回到空間推理以及抽象思考三維,三維物體和三維結構的能力,尤其重要。
嗯,所以我非常看好,呃,有很多公司。Archetype 是一個很好的例子,由我在 Google 的一位前同事創立,嗯,他們正在研究一個用於擷取感測器資料的基礎模型,而那個基礎模型實際上已經證明它可以推斷出,呃,那些資料背後的一些物理原理,對吧?我認為這非常酷,而且我認為所有這些建構模塊最終可能都需要存在,才能實現工程 AGI,僅僅語言和視覺是不夠的。嗯哼。
好的,最後一個問題。你個人最喜歡使用哪個 AI 應用程式?
比較不有趣的答案會是像 ChatGPT 和 Cursor,這兩個都有在用。或許更有趣的答案是,我們最近,呃,你知道,當我們剛結束隱形模式時,我們想製作一個影片,來展示我們一直在談論的那個北極星願景,也就是最終的工程 AGI 以及實現它的路徑。
所以我們與一家名為 IMIX 的工作室合作,嗯,這是一家以色列洛杉磯的公司。他們製作了川普加薩的影片。你們知道那個大約一個月前爆紅的影片嗎?好的。嗯,而且,呃,他們製作了一段完全由 AI 生成的,大約兩分鐘的 Archie 傳記短片,大家可以在我們的網站上看到。嗯,而且它是完全由 AI 生成的。 它在兩週內完成,而且成本大約是,我想說,是同等內容在沒有 AI 的情況下成本的五十分之一。嗯,但是所有東西,呃,語音、呃,影片、音樂,那部短片中的所有東西都是完全由 AI 生成的,使用了各種模型,有些是他們自己的,嗯,很多是他們從生態系統中,呃,拼湊而成的。
但對我來說,我,我完全被震撼了。非常酷。太棒了。Paul、Lee,非常感謝你們今天加入我們,分享更多關於你們對未來實體世界工程 AGI 的願景。我們期待著有一天你們能降低購買飛機的成本,同時也期待看到 Archie 能做些什麼。這是我們的榮幸。
感謝邀請我們。謝謝。