原文連結: 主權AI:為何各國正建立自己的模型

Anjney Midha 它們不被稱為AI數據中心,它們被稱為AI工廠。

Guido Appenzeller 工業革命時,擁有石油很重要;現在,擁有數據中心很重要。

Anjney Midha 這些模型不僅是運算基礎設施,它們還是文化基礎設施。

Guido Appenzeller 這不僅是自我定義文化,更是自我控制資訊空間。

Anjney Midha 所以,如果一個模型是由對你敵對的國家訓練的,那麼當模型發布時,要評估或基準測試它實際上會非常困難。這是一個巨大的漏洞。

Guido Appenzeller 我們是否正進入LLM外交的新時代?

Anjney Midha 我們是自己建立?是合作?還是做什麼?

Podcast Host/Narrator 今天,我們將深入探討一個既關乎地緣政治又關乎科技的議題。

本週,沙烏地阿拉伯王國宣布計畫建立自己的AI超級規模供應商,名為Humane。但他們不稱之為雲端供應商,而是稱之為AI工廠。光是這種說法就暗示著一種轉變。

數十年來,雲端基礎設施一直集中在兩個地方:美國和中國。

但隨著AI的興起,這種模式正在瓦解。

各國不再願意將其最具戰略意義的運算外包。

他們正在建立主權AI基礎設施工廠,以實現文化和運算上的獨立。

為了剖析這對全球AI堆疊、國家主權和新的數位力量動態意味著什麼,我邀請了Anjney Midha和Guido Appenzeller。我們將討論成為AI超級中心需要什麼、政府為何花費數十億美元控制推論管道,以及我們是否正進入AI的「Marshall Plan」時刻。

讓我們開始吧。

提醒:此處內容僅供參考,不應被視為法律、商業、稅務或投資建議,也不應用於評估任何投資或證券,且不針對A16Z基金的任何投資者或潛在投資者。

請注意,A16Z及其附屬公司也可能持有本播客中討論的公司股份。

有關更多詳情,包括我們投資的連結,請參閱a16z.com的披露資訊。

主權AI的崛起:為何國家正建立自己的模型

Interviewer/Podcast Host Anjney、Guido,我們想談談主權AI、AI與地緣政治。讓我們先從新聞開始說起。

我們的合夥人Ben現在正在中東,以他自己的方式參與其中。

發生了什麼事?為什麼它如此重要?

Anjney Midha 沙烏地阿拉伯王國宣布他們將建立自己的本地超級規模供應商或AI平台,名為Humane。

我認為值得注意的是,與雲端時代的現狀不同,他們將AI時代視為一個絕大多數AI工作負載希望在本地運行的時代。

如果你想想過去20年,雲端的演變方式是絕大多數雲端基礎設施基本上存在於兩個地方:中國和美國。

而美國最終成為全球絕大多數雲端供應商的所在地。

這似乎不是AI的發展方向,因為我們有許多前線國家基本上都在舉手說,我們希望基礎設施獨立。

其理念是,我們希望擁有自己的基礎設施,運行自己的模型,並能夠自主決定如何在不依賴任何其他國家的情況下建立AI的未來。

這是一個相當大的轉變。我認為頭條數字顯示,他們宣布的叢集建置規模約在1000億至2500億美元之間,其中約500兆瓦似乎是這些叢集的基本單位。

因此,許多國家,其中沙烏地阿拉伯王國是最近的一個,一直在宣布我們可以稱之為主權AI叢集。

與AI時代之前相比,這是一個相當戲劇性的轉變。

我不知道你是否同意這點。

Guido Appenzeller 我認為這非常精準。我認為許多地緣政治區域都在反思過去大型科技週期中發生的事情。無論技術在哪裡建立,以及誰控制了底層資產,都擁有巨大的權力來塑造法規、塑造這項技術的使用方式,並將自己置於下一波浪潮的有利位置。

在工業革命中,擁有石油很重要;現在,擁有數據中心也很重要。

Anjney Midha 沒錯。

Guido Appenzeller 所以,我認為這是一個非常令人興奮的發展。

Anjney Midha 是的。事實上,你通常可以透過人們用來傳達新基礎設施專案的語義,來判斷某事對某人來說為何重要。

對吧。就這次而言,如果你看看這些叢集建置是如何被提及的,它們被稱為AI工廠,而不是AI數據中心,它們被稱為AI工廠。我認為對此有兩種回應方式。

一種想法是,嘿,那只是品牌行銷。

那只是行銷人員在做他們的事情。而從底層來看,這其實只是數據中心,組件略有不同。

但世界上每個行業的每個人都在尋找在AI時代保持相關性的方法。而這是電腦基礎設施界實現這一目標的方式。

另一個相反的觀點會是,不,這不僅僅是行銷。如果你透視數據中心本身,你會發現它的許多部分與20年前的情況截然不同。

最大的差異在於活動組件是GPU。

對吧。大約20年前,你認為一個數據中心平均有多少GPU?百分之多少?

Guido Appenzeller 幾乎沒有,是的。這是一個非常新的現象。

Anjney Midha 而今天,我想如果你看看平均一個500兆瓦的數據中心,你再看看建置或運行該數據中心所需的資本支出中,GPU所佔的比例是多少?

Guido Appenzeller 非常巨大。

Anjney Midha 是的,那是一個巨大的轉變。

AI工廠:從數據中心到文化基礎設施

Guido Appenzeller 我認為我們也看到了一種專業化,對吧?為經典的以CPU為中心的工作負載而建置的數據中心,以及為高密度AI數據中心而建置的數據中心,看起來非常不同。你需要在機架上進行液體冷卻,你需要在靠近發電廠的地方提供非常不同的能源供應。你會希望及早鎖定該能源供應。

然後,我認為我們也看到消費者行為的變化,傳統上,你會希望一個非常完整的堆疊,它有許多服務,可以幫助企業建構所有這些東西。

我們看到越來越多的企業實際上樂於只在簡單的Kubernetes抽象或類似的東西之上進行建構,並且基本上,你知道,從旁挑選一些Snowflake或Databricks類型的服務來補充。所以我認為這是一個新世界。

Anjney Midha 是的,這確實是事實,你可以看到AI工廠的技術組件與傳統數據中心完全不同。

然後是它的功能。

傳統上,傳統數據中心的大部分工作負載是為企業或開發者(無論是誰)運行雲端託管的工作負載,其中大部分數據集和工作負載實際上並沒有特別的傾向性。

當我說「有傾向性」時,我的意思並非它們必然會受到大量的文化監督。

你可以爭辯說中國的情況並非如此,中國希望對這些工作負載擁有全面監督。

對吧。但從2000年代的大部分時間,直到GDPR、CCP等出現之前,我們生活在一個中心化的時代,對於世界上大多數的開發者、企業來說,將大部分雲端基礎設施設在美國北維吉尼亞州是比較好的選擇,因為這為他們帶來了規模經濟。當然,隨著GDPR、CCPA、數據隱私法的興起,這種情況開始改變,因為那時你就有了逐區合規的要求。

這使得像Cloudflare這樣的公司的興起至關重要,Cloudflare的理念是分散式基礎設施,你可以將工作負載政策與用戶所在的位置綁定。

但總體而言,這對於社群媒體工作負載的興起尤為關鍵。然而,絕大多數企業工作負載並不需要去中心化的服務。

AI的不同之處似乎在於,這些模型不僅是運算基礎設施,它們還是文化基礎設施。

它們是根據包含大量內嵌價值觀和文化規範的數據進行訓練的。更重要的是,那是訓練步驟。然後當你進行推論時,也就是模型運行時,你會有所有這些訓練後步驟,你會引導模型說些什麼或不說,拒絕用戶或不拒絕。

而最後一哩路,在過去的一年裡,已經越來越清楚地表明,各國希望能夠控制在其管轄範圍內,工廠能生產什麼或不能生產什麼。

而這種緊迫性在過去並不存在那麼多。

Interviewer/Podcast Host 主要因為文化因素,還是因為某種獨立性或韌性?

Anjney Midha 這是個好問題。我的感覺是有兩件事正在發生,但如果你認為我說得不完整,你應該插話。一個是這些模型的能力正在超越我們所認為的技術早期玩具階段。

我想我們的合夥人Chris Dixon有一句名言,那就是世界上許多最重要的技術一開始都像玩具,對吧?四年前,當規模損失論文發表,GPT3發布時,大多數人看到它都說,好吧,那很酷。它確實能產生下一個詞。

Guido Appenzeller 那只是一個不錯的派對技巧。

Anjney Midha 那只是一個不錯的派對技巧,對吧?它只是一個隨機鸚鵡。

而現在,基礎模型實際上正在國防、醫療保健、金融服務等行業中運行。ChatGPT每月活躍用戶約有5億,他們在日常生活中利用這些AI模型做出真實的決策。

我認為使用這些AI模型。Google最近發表了一篇論文,展示了他們的基礎模型Gemini在解決醫療問題上的效力。問題是,當你查看人們使用模型進行提示的類型時,與兩三年前相比,最有趣的事情之一就是,過去主要是「幫我寫論文」,現在已經轉變為「編碼」和「幫我解決一系列醫療問題或個人生活相關問題」等等,現在很明顯這些能力可以用來。

驅動國防、醫療保健等任務關鍵型產業,並進而影響許多公民的生活。

因此,我認為這讓許多政府開始思考:「等等,如果我們依賴其他國家提供的底層技術,而我們的軍隊、國防、醫療保健、金融服務以及我們公民的日常生活都依賴於它,這似乎是我們主權的一個關鍵失敗點。」

所以這是一點。模型變得更好了,而且它們在許多重要的事情上都表現出色。

第二點是,我認為人們越來越相信,如果你無法控制模型的生產管道,那麼你註定要使用反映他人文化價值觀的模型。

我們曾與Deepseek就此進行過深入辯論,問題是Deepseek是否從根本上比在美國訓練的開源模型更具偏見。我認為有初步證據表明,至少在訓練後的Deepseek中,確實可以看出它被告知要避免回答許多主題和任務類型,這與Llama模型不同。

所以這是文化層面,我認為還有關鍵的國家能力層面,兩者結合在一起,導致對這種需求的大幅增長。

你可以稱之為主權AI,即你希望控制模型能做什麼、不能做什麼。或者你可以稱之為基礎設施獨立。我想每個人都有不同的說法。你可以稱之為我們的本地AI工廠生態系統。但我認為所有這些術語都試圖傳達同樣的意思,那就是我們必須控制我們自己的堆疊。

Guido Appenzeller 是的,我認為我會說得更強烈。我認為這不僅是自我定義文化,而是在某種程度上自我控制資訊空間。

我的意思是,今天我們開始看到在許多情況下,模型正在取代搜尋。

對吧。人們不再去Google,而是去ChatGPT,然後它會返回一個答案,對吧?如果存在歷史事實,並且在中國模型中沒有顯示,但在美國模型中顯示。

Anjney Midha 對。

Guido Appenzeller 那就是人們成長中接觸到的現實。

Anjney Midha 對。

Guido Appenzeller 而且如果你將來在學校寫論文,很多論文會由LLM評分。

所以在學校,一個可能真實的事實,對吧,可能會被評為錯誤,因為控制模型的人決定那不應該是訓練課程的一部分。所以它對輿論和價值觀產生了非常深遠的影響。

對抗性威脅與控制:國家自主權的關鍵

Anjney Midha 下游應用是一個有趣的點,因為它很難衡量。

當然,與兩年前相比,那時絕大多數的產品和應用,就像Guido所說的,基本上都是相當簡單的模型,對吧?

當時它們被認為相當複雜,但前沿變化得如此之快。今天,我們回頭看像GPT4這樣主要只是一個下一個詞預測模型,會說那相當基本,對吧?因為如果你透視像ChatGPT這樣的應用程式,表面上看起來沒什麼變化,對吧?它仍然是一個聊天機器人。你輸入你的需求,它就會吐出答案,與兩年前相比。但從底層來看,發生了瘋狂的演變,有四到五個不同的系統彼此互動,對吧?你有一個推理模型,可以產生一個思維鏈來思考它接下來應該做什麼,包括然後做我們稱之為工具使用的行為,對吧?呼叫第三方工具。

然後你有一個概念,就是這些模型可以開始自主學習,透過一個迴圈來接收你的輸入,推斷它需要做什麼,呼叫一個動作,然後評估它的輸出,然後更新那個迴圈,這開始看起來。更多人使用「代理」這個詞來稱呼它。但其理念是,它正從一個相當簡單的模型轉變為一個系統。

而且很難衡量這個系統中對抗性漏洞在哪裡。

所以,如果一個模型是由對你敵對的國家訓練的,當你編寫程式碼時,它會打開一個端口,或者我們所說的「回傳攻擊」,對吧,它會傳輸遙測數據,這在模型發布時實際上很難評估或基準測試,因為這些模型通常在非常學術或靜態的環境中進行測試。

所以當Deepseek問世時,它是一個如此出色的模型。它是一個非凡的工程成就,突然間每個人都在各地使用它。

許多CIO和CTO都非常緊張,因為他們想:「等等,如果這個模型以這種代理模式被使用,而我在為時已晚之前無法看到它在對抗性方面做了什麼,這就是一個巨大的漏洞。」

因此,我認為隨著系統從模型轉變為代理,對抗性威脅正在導致許多政府思考:「好吧,我們寧願讓整個東西在本地運行,以我們能夠鎖定的方式。」

再次,這回到了某種獨立性和供應鏈問題。

Interviewer/Podcast Host 你的預期是這將如何發展,以及它將在多大程度上在雲端上演?正如我們所提到的,有中國網路和所謂的西方世界其他地區網路。這種主權AI現象將會發展到多廣泛的程度?

Anjney Midha 是的,我會借用Guido使用過的一個類比,那就是在工業革命中,你可以看看資源流向哪裡。對吧。我想你應該談談如何從石油儲備的角度來看待它,這可以決定哪些國家可以或不能參與工業革命。

請說。

Guido Appenzeller 所以如果你看看工業革命,石油是許多技術的基礎,你需要石油儲備才能參與。我認為這將有點類似。對吧。如果你想在一個特定國家建立工業,如果你想能夠出口產品,如果你想能夠推動發展,並且如果你想駕馭隨之而來的力量,你就需要相應的儲備。我的意思是,我認為AI數據中心有點像這些石油儲備,但最大的不同在於,如果你有必要的投資資金和意志力,你實際上可以自己建造它們。但我認為它們將是建構所有上層的基礎,而這些上層最終將決定誰贏得這場競爭。

Anjney Midha 在我看來,那些投資建立AI工廠,或者借用Guido的類比,建立石油儲備的國家,我將它們視為一個國家群體。我們稱之為超級中心。對吧。這個概念是,它們擁有足夠的運算能力,可以在前沿競爭,並運行自己的主權模型和主權基礎設施。

然後還有其他所有國家,它們根本沒有資源來做到這一點。

如果你看看工業革命之後,你可以說下一個主要的技術革命是現代金融的出現,即Bretton Woods和IMF體系,現代金融說:「我們都將使用一種稱為美元的價值衡量標準。」

你或者在一個生產美元的國家,像美國;或者在一個生產大量商品並獲得美元的國家,像中國。

然後,如果你不屬於這兩者之一,你就真的必須弄清楚你是否與這些貿易集團中的一個結盟。

然後發生的事情是,像新加坡、盧森堡、愛爾蘭和瑞士這樣的國家意識到:「好吧,我們根本沒有資源來建立自己的儲備系統。而且我們沒有那麼多的本地生產可以獲得美元。我們無法真正進行貿易。」

所以我們必須找到一種方法將自己融入流動。

因此,新加坡當然以成為美元流入亞洲的入口而聞名,因為他們在法治、優良稅收制度、穩定政府和低腐敗等方面投入了大量資金。瑞士在歐洲投資和歐洲資本流動方面也做了類似的事情。所以我認為我們現在正在觀察的就是這種建置,其中有美國和中國,它們顯然擁有足夠的運算能力成為超級中心。然後像沙烏地阿拉伯王國這樣的人說:「我們想成為一個超級中心。」如果這意味著我們必須用我們的石油來獲取大量的Nvidia晶片,我們現在就會這麼做。

而且我認為在這個類別中,可能還有沙烏地阿拉伯王國、卡達、科威特、日本、當然還有歐洲。

然後我想問題是,其他所有國家該怎麼辦?

對我來說,不清楚成為AI界的「新加坡」需要做什麼。

也許AI界的「新加坡」最終會是新加坡本身,因為現在他們由於參與現代資本流動而擁有龐大的主權財富基金。但我認為許多其他國家都在思考,現在是我們真的該購買、建立、合作,還是做什麼的時候?

Interviewer/Podcast Host 是的。

請多談談這背後的含義。這對美國來說應該是令人興奮的事情嗎?當我們思考外交政策時,這意味著什麼?在所有這些本地環境中,現在都有贏家嗎?你能談談這裡的一些重大影響嗎?

Anjney Midha 你想試試看嗎?

Guido Appenzeller 我認為一場巨大的結構性革命既是威脅也是機會。

我認為美國和AI目前在全球處於領先地位。

是的,這是一個機會。保持領先並不容易。正如所有科技革命一樣。

Interviewer/Podcast Host 難道我們不希望人們像在雲端革命中那樣依賴我們嗎?或者我們從其更加去中心化中受益嗎?

Guido Appenzeller 世界不是一個地方,所以我認為完全的中心化不會發生。我認為領導者是好的。擁有也擁有該技術的強大盟友也非常有價值。所以我們可能正在尋求這些的平衡。

Anjney Midha 是的。為了更精準地說明你最後一點,你可以這樣思考:我們現在顯然處於不穩定平衡中。

所以Guido說得對,人類和歷史的軌跡就是事情會發展到穩定平衡。那麼什麼是穩定平衡呢?我認為一種思考方式是看看歷史類比。二戰後,當歐洲完全被摧毀時,一群非常有企業精神的私人部門和公共部門人士齊聚一堂,他們說:「嘿,我們可以選擇背棄歐洲,採取孤立主義的姿態,主要專注於戰後僅限美國的議程,或者我們可以嘗試採取一種政策,我們知道如果我們不幫助我們的盟友,其他人會這麼做。」

於是他們提出了Marshall Plan這個概念,對吧?美國許多領先企業,如GE和General Motors,實際上資助了歐洲的大規模重建。

這幫助許多歐洲經濟體迅速復甦。

當時Marshall Plan受到了大量批評,因為它幾乎被視為資本和資源的淨出口。

但它最終鞏固了美國和歐洲之間未來50年令人難以置信的貿易走廊,這將中國排除在那個等式之外。

Guido Appenzeller 70年。

Anjney Midha 是的,70年,真的。

所以我認為我們面臨一個選擇,是要像對待AI的Marshall Plan那樣處理它,對吧?然後說,嗯,一個穩定平衡當然不是我們背棄一群盟友的情況。因為中國肯定擁有足夠的運算資源,可以嘗試將像Deepseek這樣出色的模型出口到世界其他地區。

那麼我們希望我們的盟友使用Deepseek還是Llama呢?

在堆疊的模型層面,歸根結底就是這個問題,對吧。

而且我認為現實是,許多國家不會坐等結果。

這就是為什麼在歐盟有像Mistral這樣的努力,對吧?他們正受到不僅僅是歐洲國家,還有許多其他歐洲盟友的接觸,問道:「嘿,你們能幫助我們弄清楚如何建立我們自己的主權AI嗎?」

因此,我認為我們即將看到有史以來最大規模的AI基礎設施建置,因為大部分採購訂單和資本都由政府提供,他們意識到這是一個關鍵的國家需求。

而且他們的穩定平衡肯定不是依賴他人或依賴一個不確定的盟友。因此,那些肯定有能力資助自己主權基礎設施的國家現在正爭相這麼做。

國家化爭議與開源的未來

Interviewer/Podcast Host 那麼這對國家化爭議,或者你認為它會如何發展,意味著什麼?OpenAI前員工Leopold Aschenbrenner在他那份著名的報告中談到,嘿,如果這件事在某個時候變得像我們認為的那樣對國家安全至關重要,政府就不會只讓私人公司運行它。他們會希望採取一種更加整合的方法。你認為這種可能性有多大?在一個更加去中心化的世界中,這對監管的可行性又意味著什麼?

我們已經經歷了Deepseek,它已經改變了遊戲規則,因為我們正處於一場軍備競賽中,你無法控制一切。我們也在開源討論中,我們支持其中一些參與者。

你對這一切最終結果的看法是什麼?

Guido Appenzeller 我對此可能有很強烈的意見。我的意思是,我在德國長大,對吧。所以我受益於Marshall Plan,也看到了它如何將西德拉向美國,最終東德也拉向美國。

當所有人都意識到其影響時。

我從中學到的一個教訓是,我認為任何形式的中央計畫方法都行不通。東德和西德是一個很好的A/B測試。中央計畫與自由市場經濟。哪一個效果更好?對吧。我認為結果不言而喻。

因此,我認為基本上讓政府主導這裡的所有AI戰略,以Manhattan Project或Polo project(選擇你喜歡的成功專案)的方式,我看不到那會成功。你可能需要一個高度動態的生態系統,由大量公司競爭。

我想有些領域,政府可以對研究方面產生巨大的正面影響。我們一再看到這種情況。

資助尚未足夠應用,企業無法接手的基礎研究非常有價值。

我認為它可以在制定良好法規方面提供幫助。

不良法規很容易扼殺AI,正如我們所看到的。所以我認為政府有強烈的意願來領導和指導這方面。

但最終沒有一個可以制定所有細節的總體規劃,這必須來自市場。

Anjney Midha 我不同意Aschenbrenner的觀點。我強烈同意Guido的看法,那就是科技前沿的中央計畫歷史並不光彩,除了少數幾個基本上是短暫戰爭衝刺的情況。

對吧。而且可以說,即使是Manhattan Project,我想他在文章中用來類比的那個,

我們現在知道有洩漏。它實際上是洛斯阿拉莫斯或類似地方的一個隔離設施,他們仍然有間諜。

所以如果你從這個角度來看待:模型等同於核武。

我們必須透過將我們最聰明的研究人員鎖定在洛斯阿拉莫斯某個設施中來監管這些開發。而這將阻止最好的模型被出口。我認為那是很棒的小說,一部非常有趣的作品。

但對於任何曾經在任何大型政府系統中工作過(無論是樂趣還是不悅)的人來說,那都是白日夢。

好消息和壞消息是,從某種意義上說,模型權重在哪裡並不重要。重要的是運行模型的基礎設施在哪裡。從某種意義上說,推論幾乎更重要。

我認為一年前,我們在監管發展趨勢方面處於一個相當艱難的境地,當時美國有許多提案試圖規範模型的研發,而不是模型的濫用。

我認為幸運的是我們已經擺脫了那種情況。

我們現在所處的狀態,不幸的是,仍然是州級層面像打地鼠一樣的監管拼湊。它不一致。希望。我認為我們從早期政府行政命令中獲得了許多積極信號,希望這意味著AI周圍將會有統一的監管。但我認為答案不會是一個單一實驗室擁有一個上帝模型,然後國家像保護核彈一樣保護它。

我認為我們現在處於一種狀態,部分由於我們討論過的AI工廠的建置,許多國家擁有訓練前沿模型的能力,其中許多國家也相當願意公開出口它們。

中國是其中一個領頭羊。Deepseek迫使人們更新他們的先驗知識,就在Deepseek問世的前一年,華盛頓的許多科技領袖們作證,自信地表示中國在美國後面五到六年。

然後在OpenAI發布前沿模型26天後Deepseek就問世了。我的意思是,這徹底粉碎了所有這些論點。

所以算式已經改變了。我認為這意味著唯一的獲勝之道就是建立最好的技術並超越其他任何人的出口能力。

那麼問題是世界正在使用誰的數學?我們希望它是美國數學,對吧?

我的觀點是,我們最好是讓其他國家能夠提供自己的模型,理想情況是最好的產品獲勝。也就是說,最好的模型只來自美國和我們的盟友。

Interviewer/Podcast Host 是的。

Guido Appenzeller 我們是否正進入LLM外交的新時代?

Anjney Midha 事實上,Ben去年在FII Riyadh上就此有一個很棒的論點,他說類似這樣的話:因為這些模型,就像我們之前討論的,是文化基礎設施,你不希望在數位時代的網路空間被殖民。

我認為這非常精準。

Interviewer/Podcast Host 是的。

Anjney Midha 取代殖民,我們現在擁有的,我認為是基礎模型外交。

這是一個很好的說法。

Guido Appenzeller 我認為是。

Interviewer/Podcast Host 這符合美國相對的技能組合,即創新和與盟友合作,相對於中國,後者作為一個國家一直比較封閉。

我想談談像Mistral這樣的開源公司在一個更大的參與者更開放、來源更多、更感興趣的世界中的看漲情況。

Anjney Midha 所以有幾點,我們已經越來越多地討論這個問題。兩年前,當我們主導Mistral的投資時,我們對開源如何獲勝有一個相當明確的假設,即基礎模型最終越來越像傳統的運算基礎設施、儲存、網路等等。

因為閉源通常,如果你看看資料庫或作業系統,如Windows,閉源通常在開闢新用例方面領先,當然,它也從消費者那裡捕獲了大量的價值。

但當企業真正開始採用該技術時,他們通常會希望更便宜、更快、更多控制。

在AI的世界中,如果你無法存取權重,你就無法獲得大多數企業想要的控制。

當時,與前沿閉源模型真正可比的是Llama。

然後Llama的創作者離開去創辦了Mistral。所以這是一個相當自然的決定。

我認為從那時起,出現了另一個不同的東西,那就是主權AI基礎設施的概念。這不僅僅是模型,而是所有上下層的東西。

我想我們一直在討論的是,那麼這是否意味著理想的雲端基礎設施供應商也是最佳開源模型的供應商?

傳統上,雲端基礎設施是一個由核心業務在電信或商業領域的現有企業(如Amazon)主導的類別。

現在情況似乎正在改變。

我想你比我說得更精準,那就是如果你讓錯誤的人設計數據中心,他們就會設計錯誤的數據中心。

但我是在轉述這裡嗎?

Guido Appenzeller 不,我認為這完全正確。我的意思是,過去每一次大型技術浪潮。如果你看看PC革命或網路熱潮,我們都為系統開發了新的構建模組,例如CPU、資料庫或網路。

我認為現在正在建構另一個構建模組,那就是模型或AI,無論它最終會被稱為什麼。

所以從某種意義上說,它是第四個支柱,運算、網路、儲存已經變成了運算、網路、儲存、模型。

在這種世界中,雲端需要提供所有這四項。

Anjney Midha 沒錯。

Guido Appenzeller 所以我認為你完全正確。這只是基礎設施層的一部分,未來所有軟體系統都將建構在它之上。

Anjney Midha 我認為思考這個問題的一種方式是,有兩個前沿:能力前沿,然後是Pareto效率前沿。能力前沿通常由閉源主導,而Pareto效率前沿則受益於開源生態系統的飛輪效應,對吧?在這種情況下,你發布你的模型,整個開發者生態系統可以提煉它、微調它、發布更好的模型運行時改進、量化它等等。

這使得該技術系列比閉源版本運行效率更高。第二點是更安全,因為你讓全世界都在對你的模型進行紅隊測試,而不是像閉源供應商那樣,只有公司內部有限的一群人。所以對於原始模型抽象來說,其商業案例基本上是更便宜、更快、更高效、更可控。這非常強大。

然後,如果你問,那麼模型供應商有權贏嗎?在數據中心、晶片層面、叢集層面,模型堆疊下方是否有商業案例?以及上方是否有權贏?

讓我們先從堆疊的最頂層開始,人們越來越多地稱之為代理。

一個不那麼性感版本會稱之為完全端到端自動化工作流程。

對吧。今天,如果你看看世界上最大的航運公司,比如Mercs of the World或CMACGM,對吧。這些是龐大的物流和運輸公司,它們擁有相當複雜的工作流程。

如果你想想這些模型轉化為AI代理的力量,為這些任務關鍵型產業之一客製化該代理所需的工作是相當困難的。今天,一個我們看到大量進展的領域是強化學習,如果你設計出正確的獎勵模型,代理在完成該任務方面會變得更好。事實證明,設計正確的獎勵模型非常困難,即使對於像OpenAI這樣經驗豐富的團隊也是如此。我的意思是,他們三天前剛剛回溯了ChatGPT的一個更新,他們稱之為「諂媚更新」,因為他們設計了錯誤的獎勵模型。

因此,一家傳統的遺留產業公司根本不知道如何做到這一點。

問題是,他們寧願投入精力去客製化一個閉源模型還是一個開源模型呢?如果閉源供應商因某種原因倒閉、停業(這會發生),提高價格等等?

Guido Appenzeller 竊取他們的客戶。

Anjney Midha 是的,是的,竊取他們的客戶。

我們基本上就完蛋了。

而代理層的自然發展趨勢似乎也是轉向一個擁有底層開源基礎的部署合作夥伴。

我認為雲端基礎設施,即主權AI層,有點懸而未決,這可能是我們下一次播客的好主題。

Interviewer/Podcast Host 是的,絕對。那我們就以此作結吧。Anjney、Guido,非常感謝你們。這很棒。謝謝你們。

下次再見。