原文連結: 資料中心是新的運算單元:Crusoe CEO Chase Lochmiller
非常高興歡迎 Chase Lochmiller 和我的合夥人 David Khan。Chase 是我這些年來有幸見過幾次的人。有兩件事讓我印象深刻,也是我很高興他能來這裡的原因。第一,這傢伙很聰明。這是個好的起點。 第二,他對這個市場的觀點非常有趣且與眾不同,不同於在座大多數人,因為他的觀點更著重於伺服器、鋼鐵、電力,這些甚至比 GPU 層級更基礎的原始基礎設施,正是這些在推動著整個革命。而我們的合夥人 David 是採訪他的最佳人選,因為無論好壞,David 的一個簡單觀察——即大量資金投入底層建設,卻尚未有足夠的應用營收來回收成本——讓他因 AI 的「六千億美元問題」而聞名或聲名狼藉。所以我會把時間交給 David 和 Chase。謝謝。謝謝 Pat。
AI 工業革命:鋼鐵、伺服器與電力
我很興奮能主持這場座談。我們將討論 AI 工業革命,並強調「工業」這個詞。我們將談論鋼鐵、伺服器和電力。 Jensen 已經跟我們談過伺服器了。所以我們將聚焦於鋼鐵和電力。我想在座各位都知道,全球最強大的公司之間正在進行一場競賽,目標是建立最大的 GPU 叢集。我們聽說過十萬個 GPU 的叢集。現在我們聽說的是三十萬個 GPU 的叢集,而大型科技公司正在談論百萬級 GPU 叢集。 而這一切的核心人物就是 Chase。所以我很興奮能採訪他,我們將討論這背後發生的事情。Chase,現在我想你們在德州 Abilene 有 5000 人正在建造一個資料中心。
是的,我們有。每天有 5000 人在現場,幾乎是日以繼夜地工作,你知道的,為了加速 AI 基礎設施的建置。
從零開始打造 AI 工廠
也許跟我們談談,我們思考我們理解 Jensen 的伺服器。我們知道它們會放在資料中心。也許這裡有些人能想像資料中心的樣子,或者去過資料中心。但是,要從基本上是空地開始,建造這樣一個 AI 工廠,需要些什麼呢?
是的,我認為,我認為重要的是退一步,評估一下什麼是 AI 工廠?未來的 AI 資料中心是什麼樣子?它與現有的資料中心有何不同?因為,嗯,你知道,像資料中心這個詞,老實說,有點被過度使用了。把 20 年前提供網頁服務的資料中心,和今天管理著十萬以上 GPU 叢集的高效能 AI 資料中心相提並論,就像是把卡丁車和 Range Rover 都叫做交通工具一樣,對吧?它們都是交通工具,但你可能不會用它們來做同樣的事情,對。
嗯,所以,你知道,我認為,我認為當你審視今日的資料中心基礎設施,以及擴展 AI 真正需要的東西時,這是一個非常工業化的過程,對吧?投入其中的能源量,嗯,我知道這已經被談論很多了,但我想透過一些例子來幫助理解。例如,我想許多人會認為北維吉尼亞是全球資料中心的中心,對吧?那裡是大部分網際網路活動發生的地方。嗯,你知道,我們已經建設了數十年,對吧?那麼,北維吉尼亞的容量是多少?大約是,JLL 在 24 年底發布了一份報告,北維吉尼亞的總容量大約是 4.5 吉瓦。像 Crusoe 這樣一家成立 7 年的新創公司,嗯,你知道,我們正在建設大型 AI 基礎設施。 我們目前正在進行約 2 吉瓦的容量建設,目前正在施工中。我們的專案儲備中約有 20 吉瓦。所以你談論的是,你知道,這完全改變了能源地景和資料中心地景,以實現 AI,因為建造它所需的基礎設施數量龐大。
現在,像是它的瓶頸,你知道,它們總是在變動,對吧?我的意思是,我想曾經有一段時間根本拿不到晶片,你知道,那是主要的瓶leneck。我想現在很多情況都,你知道,有所緩解了,因為台積電 (TSMC) 和 Nvidia 的產量都已經提升,讓晶片更容易取得。但是,你知道,電力、鋼鐵、資料中心空間,這些已經成為主要的瓶頸,而且這些是複雜的供應鏈,你知道,不容易加速。所以,你知道,Crusoe 一直以來都採取這種非常第一性原理、垂直整合的方法來處理事情。所以,你知道,舉個例子,我們在美國本土自己建立了很多製造能力,以幫助加快營運時間表,速度對我們來說是至關重要的優勢。
嗯,所以,你知道,我們有關於低壓開關設備的報價,對吧?它基本上就像是,你知道,所有,它有點像是資料中心的電氣控制室,而我們得到的報價是 100 週。我當時覺得這太瘋狂了,你知道,100 週,我沒有 100 週。所以我們建立了一家工廠,開始自己製造開關設備。現在我們在 22 週內就能完成。嗯,就像在供應鏈中找到那些我們真正可以幫助加速的環節,嗯,許多這樣的基礎設施對我們成功地,嗯,以比以往任何人都快的速度建造這些超大型專案至關重要。
Crusoe 如何與科技巨頭合作
你如何說服大型科技公司與你合作?當我想到 Amazon、Google、Microsoft,我的意思是,這些公司本身就是資料中心公司。 在上一波浪潮,也就是雲端浪潮中,這對這些公司來說是內部核心競爭力,對吧?他們都建立了自己的資料中心。他們擁有龐大的團隊來做這件事。然而你們這家七年前還在油氣田燃燒塔上建造小型貨櫃的新創公司,現在卻成為許多這些公司建造資料中心的合作夥伴。 你是如何提出這個論點的?
嗯,我認為,我認為值得理解的是,雖然大型科技公司擅長很多事情,但它們本質上並非為快速行動而設計。事實上,從結構上來說,它們的設計就是為了不快速行動,尤其是在涉及非常重大的採購決策時。 所以,嗯,就像批准流程一樣,你知道,當我需要做一個購買某物的決定時,就像,就像我做了決定,然後它當天就發生了。嗯,而,你知道,如果你看看像 Microsoft 這樣的公司,所有這些流程中大約有 19 層的批准。 所以,你知道,僅僅從起跑線開始,他們在快速行動方面就存在巨大的劣勢。現在他們都制定了很棒的計畫,他們正在關注這個,像是,你知道,一個大型資料中心,你知道,100 兆瓦以上,大概需要 3 到 5 年的計畫。嗯,你知道,我們在 Abilene 做的第一階段,我們達到了 300 天。嗯,我們的第二階段,實際上只用了 200 多天。所以我們正在大幅加速這種基礎設施的上市時間,這對那些對這種規模和,嗯,你知道,專用基礎設施感興趣的大型科技公司和大型 AI 實驗室來說,是主要的價值主張。
超大規模資料中心與主權 AI
有傳言說你們參與了 Stargate 計畫。我不知道你是否被允許對此發表評論,但你對這些超大規模資料中心有何看法,不僅僅是在大型科技公司的層面,也包括國家層面?Jensen 談到過,並在他的財報電話會議上談論的是主權資料中心和主權 AI 策略。當我們從你我都可以去參觀的北維吉尼亞的資料中心,轉向這些大型專案時,它看起來會是什麼樣子?不動產的佔地面積如何?政府應該如何思考這個問題?你如何看待其發展?
是的,我認為有兩個主要的垂直領域在推動這一切。 其一是,嗯,你知道,由於這種規模的基礎設施所需的能源規模,嗯,你確實需要採取能源優先的方法,而這正是 Crusoe 所做的:將運算基礎設施的需求帶到我們可以獲得低成本、清潔且豐富能源的地區。 這正是我們來到西德州的原因。這就是我們來到德州 Abilene 的原因,因為那裡有大規模的再生能源過度建設,特別是風能,嗯,人們產生的風電在出售時,大約有 30% 的時間會出現負電價。而且實際上,棄風限電的情況非常普遍。 這意味著他們可以發電,但他們實際上不發,因為他們不想以負價格出售。所以,你知道,這與 AI 面臨的問題正好相反。AI 需要大量能源。所以,說「從來沒有人在德州 Abilene 建過資料中心,但如果我們這樣做了,我們將擁有豐富的清潔能源來為其供電」,這是一個很自然的契合點。 嗯,所以這才是驅使我們到那裡的原因。我認為,你知道,主權 AI 這個概念,我認為,是一個非常有趣的議題。嗯,因為這是我們看到的另一個維度,即對這類基礎設施的需求在地理上呈現出高度的分散性。這實際上與資料在地化有關。 當人們思考,嗯,你知道,有些資料可能屬於某個國家,或者,你知道,不能離開王國的四面牆,你知道,它必須留在那裡,嗯,他們想用這些資料做一些非常特別的事情。所以,嗯,這確實催化了大量對國內 AI 策略的投資需求,我認為人們也從,你知道,地緣政治,嗯,你知道,權力轉移的角度來看待這個問題。
AI 發展的能源瓶頸
或許跟我們多談談能源。嗯,我想在座的各位可能都有個抽象的概念,認為能源將是 AI 的限制因素,Sonia 上週寄給我一張圖表,顯示美國的能源是這樣,中國的能源是那樣。所以當你談到地緣政治的組成部分時,這真的很重要。 或許為我們剖析一下能源問題。真正的限制在哪裡?哪裡沒有限制?我們要如何加速發電?能源前景如何?以及,目前的情況有多糟?
是的,我認為這是一個有趣的問題,因為當你觀察美國時,公用事業公司在很長一段時間內都是一個非常沉寂的行業。 就像我們的總發電容量並沒有真正增長多少。它有點像是持平了,隨著事物變得更有效率,隨著,你知道,嗯,嗯,嗯,隨著,你知道,即使在電氣化趨勢下,效率的提升也已經超過了需求的增長。嗯,然後 AI 就像是需求的階梯式變化,對吧?所以,嗯,你有點像是看到這些沉睡的巨人被喚醒,說:「嘿,我需要一吉瓦的電力。 那個電力要從哪裡來?」嗯,你知道,我們再次不得不採取這種非常第一性原理的方法,像是,好吧,如果我們無法從公用事業公司獲得電力,我們能建一座發電廠嗎?嗯,所以,你知道,我們做過類似的事情。嗯,你知道,我們將 AI 視為一個巨大的機會,實際上也能加速嗯,下一代能源技術的發展。 我與三家小型模組化反應爐 (SMR) 公司達成了不同的協議,希望這些協議能夠加速核能作為未來資料中心供電關鍵能源的發展。嗯,所以,你知道,我將此視為業界加速許多有趣能源技術發展的巨大機遇。 嗯,並且,你知道,帶領我們進入一個智慧和能源都極其豐富的未來。嗯,我認為這正是這個時代的特殊之處,那就是,你知道,人類歷史上第一次,我們真正能夠製造智慧。 對吧?在此之前,像是,你知道,你必須用有機的方式,也就是生孩子。嗯,所以,你知道,而且養育他們需要很長時間,對吧?直到他們真正成為有生產力的智慧個體。今天,你知道,我們可以利用矽晶片製造智慧,而且,你知道,我認為這才是,嗯,當前這場繁榮以及這些 AI 工廠之所以特別的原因。這些 AI 工廠很複雜,對吧?我的意思是,Jensen,你知道,他先前談到的所有關於網路,你知道,架構、MVLink、Infiniband,以及,你知道,建造這些大規模相干叢集的事情,嗯,在使製造智慧成為現實方面,是一項巨大的技術突破。但圍繞著它還有所有不同的組件,Crusoe 真正專注於在資料中心,嗯,以及高效能服務虛擬化,嗯,你知道,圍繞著運算基礎設施進行建設。
能源談判的幕後
你能帶我們了解一下能源談判的幕後情況嗎?這是我腦海中想像的場景。並不多人了解公用事業的世界。我想我們大多數人可能都不了解。嗯,當我在 Sequoia 談論你時,我常常說你就像這個行業的洛克斐勒,對吧?你走出去,和電力公司的人談判,你談判這些交易,總得有人去做這件事,而這件事促成了其上的一切。 這實際上是如何發生的?
嗯,你知道,首先,我有一個很棒的團隊。我有很棒的人專注於此,而且我們不得不從非常多元的,你知道,背景中延攬人才。所以,你知道,我的團隊裡其實有一個人,我不知道有沒有人是《Land Man》這部劇的粉絲,但我團隊裡有個人以前確實是土地經紀人。 嗯,所以,你知道,他以前是和農民及牧場主談判,主要圍繞著,嗯,礦產權,你知道,基本上是他們土地下層的權益。嗯,你知道,現在他正在談判大規模的能源交易,你知道,以及土地和電力交易,嗯,來讓這些大型 AI 工廠成為現實。你知道,嗯,有很多像是噪音被製造出來,像是大量的湧入請求,你知道,人們寄東西給我們的團隊,我甚至無法想像 Sam 被多少機會轟炸。嗯,但是,要讓一個大型 AI 工廠成真,遠遠不只是有電力就夠了。我們看過那種像是「開著小貨車的兩個人」說:「喔,是的,我表哥的土地上有條大電線經過,而且我在德州有一大片牧場。 你知道,我們可以在那裡建一個大型 AI 資料中心嗎?」而且,你知道,答案通常是否定的。嗯,但是,你知道,這是一個許多不同組成部分必須匯集在一起的結果,包括電力、網路、許可,嗯,才能,以及,你知道,整個供應鏈,才能真正實現這一切。 嗯,你知道,舉個例子,在德州的 Abilene,你知道,我們有 5000 人在那裡工作。Abilene 鎮的人口是 12 萬人,對吧?所以,嗯,你談論的是僱用了鎮上相當大一部分的人口,而且,坦白說,還得引進大量勞工,嗯,因為,你知道,這些都是技術含量很高的行業,包括電氣、機械,嗯,以及各種建築行業,嗯,你知道,是這些行業讓這個建設成為現實。
未來資料中心的設計:資料中心即運算單元
您能跟我們談談資料中心的設計嗎?你可以閱讀,我的意思是 Meta 在網路上有公開資料。所有大型科技公司都在網路上公開資料。你可以非常詳細地了解計畫內容,資料中心的樣貌。有一件事一直讓我印象深刻,那就是你在維吉尼亞州的老式資料中心。你的伺服器分散在整個資料中心,而現在你有這些大型資料中心被重新利用,所有的 GPU 都集中在一個小叢集裡,對吧?因為你需要這樣設計資料中心。 網路正在改變,而 Jensen 一直在推動這項進展。未來的資料中心會是什麼樣子?液態冷卻如何融入其中?我們應該如何思考未來的資料中心究竟是什麼?
是的,我的意思是,老實說,這才是我最初投入這個領域的原因。Crusoe 當時正在建立一個 AI 雲端平台,我觀察著發展藍圖和不斷變化的運算架構,然後我對自己說,你知道,隨著我展望這些變化的運算架構,為了支援這些東西,資料中心從根本上將不得不轉變。所以,為了打造世界上最好的 AI 雲端平台,我真的需要成為建造 AI 資料中心的佼佼者。嗯,而且,你知道,整體而言,我認為最重要的方面確實是,你知道,你所看到的整體功率密度。 所以如果你看 20 年前,一個傳統的資料中心機櫃可能是 2 千瓦,也許是 4 千瓦。嗯,NVL72、GB200 的機櫃大約是 120 到 130 千瓦。嗯,Jensen 剛在 GTC 上宣布的是 Vera Rubin Ultra,它將是一個 600 千瓦的機櫃裝置。 所以你談論的是,你知道,整體功率密度增加了好幾個數量級,這從根本上改變了,你知道,熱力學,實際資料中心所涉及的熱力學。所以你必須,你必須大幅改變冷卻架構。所以當你走進我們的一個資料中心,它看起來,它非常有趣。 它看起來像自來水廠,對吧。有巨大的管道在整個資料中心輸送水。嗯,你知道,每棟建築大約有一百萬加侖的水。嗯,那種,你知道,將冷水送入,你知道,機櫃,以直接晶片液冷架構來冷卻晶片。 然後它會輸送到一個冷卻器,基本上是將熱量排放到,你知道,室外。所以,嗯,每棟建築有 84 個冷卻器。嗯,然後,你知道,我們非常專注於該資料中心周圍的網路會是什麼樣子,因為我們再次強調,我們不是在晶片層級或伺服器層級思考這個問題。 我們真正在叢集層級思考這個問題,對吧?資料中心是新的運算單元,而且,你知道,AI 工廠真正的意義就在於資料中心規模的電腦。嗯,當我們思考這個問題時,我們也會思考,如何將多個建築物連接在一起。 所以,你知道,在 Abilene,我們有,我們有八棟獨立的建築物正在該地點施工。嗯,所有這些都計劃相互連接。有 44 英吋的導管將每個網路核心相互連接,嗯,這樣你就可以擁有一個由 GB200 組成的相干叢集,你知道,而且,嗯,一旦它上線,那將是世界上最大的。
創辦人視角:像登山家一樣思考
所以,我喜歡那一點。資料中心就是新的電腦。我認為這是一種非常簡潔的說法。也許最後一個問題是關於你個人,關於你作為一個創辦人。我想你已經攀登了七大洲最高峰中的五座。你們公司的價值觀之一是「像登山家一樣思考」。 你和你的公司經歷了許多不同的組織和業務模式,並且不斷迭代。你的公司文化是如何影響你走到今天的?
嗯,是的,我的意思是,你知道,「像登山家一樣思考」這個價值觀是相當特別的,也是 Crusoe 獨有的。嗯,而且,你知道,它有點源於一個事實,那就是,你知道,我創辦 Crusoe 的時候,其實剛從珠穆朗瑪峰回來,當時我腦子裡想的很多都是登山的事。 嗯,而且,你知道,我當時在思考許多成為一名成功登山家的做法,以及這些做法如何能實際地啟發一個人成為公司的好員工。而且,嗯,你知道,在我們的情況下,情況是這樣的,看,我並不想讓每個人都成為極限運動員,必須去爬山才能成為好員工。 但我希望他們能將那些真正使這些事情成功的想法和做法融入其中。所以,你知道,當你在山區攀登時,你必須,你必須,你必須有一個 A 計畫,像是,你知道,你有一個登頂的計畫,而且,你知道,希望天氣能配合,你知道,一切都能按計畫進行,但你也必須為事情出錯做好準備。 我認為這種韌性和穩健性真正融入了我們流程設計和組織設計的每一個方面,這確實使我們能夠在公司歷史上多次不同的混亂時期茁壯成長。 所以,嗯,你知道,混亂中的韌性,我認為,是一個很棒的,嗯,你知道,我們已經,嗯,嗯,能夠,嗯,做得很好的原則。
謝謝。非常感謝,David。