原文連結: Mark Zuckerberg 與 Satya Nadella 暢談 AI 的未來、開源與開發者生產力

歡迎 Meta 創辦人暨執行長 Mark Zuckerberg 與 Microsoft 董事長暨執行長 Satya [音樂] Nadella。好的,很高興再次見到大家。呃,希望今天過得愉快。有很多令人興奮的事情。非常感謝能與 Satya 一同在此,他真的不需要任何介紹。他可說是締造了有史以來最偉大科技公司偉大轉型的傳奇人物。

謝謝你,Mark。嗯,基本上領導著,呃,你知道的,推動著 AI 和雲端以及所有這些重要領域,而且從我的角度來看,你一直以來都是我們在開源工作上的朋友和盟友。所以,我一直非常感謝我們在這方面的長期合作,以及你給我關於我們應該如何建立 Llama 生態系統及其周邊基礎設施的建議。所以,謝謝你來到這裡。

當然。這是我的榮幸,Mark。我應該說,我最早的記憶是與你見面,那時我還在 Bing 工作,大概是 2008 或 09 年左右,然後你給我上了一堂關於我某個錯誤觀點的長篇大論,回想起來更令人尷尬。是的。我記得這個。我永遠都會記得這個。你說,網路需要人。你需要看到人。我永遠不會忘記那句話。就像是,無論你到哪裡,都能擁有一個個人資料頁面的能力。這是我的一個記憶。

嗯,我很感激你原諒了我那件事。不過網路確實需要人,所以我想在這點上我是對的。但也許現在是代理人(agents)了。是的。嗯,我想或許兩者都需要。感謝老天。是的。嗯,但無論如何,所以,你知道,你多次提到,目前這個 AI 成長的科技時刻,讓你聯想到過去一些重要的轉型,從主從式架構(client-server)到網路的開端等等。所以我很好奇。是的。

AI 作為重大的科技轉型

所以對我而言,呃,你知道我成長於主從式架構(client-server)剛誕生的年代。我在 Windows 3 之後加入了 Microsoft,呃,所以我見證了主從式架構的誕生,然後是網路、行動裝置、雲端,然後你可以說這是第四次,或者第五次,取決於你怎麼計算。呃,這很有趣,對吧,就是每一次有這樣的轉變,整個技術堆疊(stack)都會被重新檢視,呃,然後你得回到第一原理開始建構。呃,我的意思是,我甚至認為雲端基礎設施的形態,對我來說,我從比如說 2007、08 年開始建構的,跟你為訓練所建構的核心儲存系統,看起來就不一樣,或者說這種訓練的工作負載,對吧,這種資料平行同步的工作負載,跟比如說 Hadoop 或其他東西非常不同。所以,事實上,我認為在每一次這樣的平台轉移中,你都必須重新思考技術堆疊上下的一切,這就是我認為我們時不時會面臨的情況。它有點像是從既有的基礎上發展出來的。網路誕生於 Windows,但它遠遠超出了那個範疇。我對此也是這麼看的。

是的,那說得通。我的意思是,你已經多次提到這一點,關於事物變得更有效率時,嗯,它會改變運作方式,人們最終會消耗更多服務,對吧?嗯,我想我好奇的一件事是,因為你們在企業業務方面做得很好,而我們對此沒有那麼多的了解,那就是你如何看待這在所有這些 AI 模型周圍的發展?對吧?你看到一代又一代,它們變得越來越有效率,並且比上一代提供更多的智慧。而且,你知道,顯然這一切都發生得非常快。所以我不確定你從中看到了什麼,但是,是的。

我的意思是,如果你想一想,對吧,就是,你知道,幾年前我們都還圍坐在一起說,喔我的天,摩爾定律(Moore's Law)怎麼了,你知道,它結束了嗎,我們該怎麼辦?而現在我們卻處於某種瘋狂的超光速摩爾定律之中。而且情況也一直如此,對吧,任何一次這樣的科技平台轉移,都不是關於單一的 S 型曲線,而是多個 S 型曲線的複合效應,對吧?即使只看晶片越來越好,你知道,像 Jensen 或 Lisa 這樣的人正在進行巨大的創新,你知道,他們的週期時間已經變得更快,所以假設那是摩爾定律。但除此之外,整個機群、系統軟體、最佳化、模型架構最佳化、推論的核心(kernel)最佳化、應用程式伺服器,甚至提示快取(prompt caching),我們在這方面都做得越來越好。嗯,所以你把所有這些加起來,每 6 個月、12 個月,你可能會得到 10 倍的改進,對吧?所以當你的能力以這樣的速度提升,價格也以這樣的速度下降時,基本上消費就會上升。所以我非常樂觀,我們正處於一個可以建構深度應用的階段。嗯,所以這些你擁有一個協調層(orchestration layer),其中包含這些代理人(agents)和多個模型的事物,我覺得我們已經到了那個地步。因為如果你想一想,即使是第一代的應用程式,它們的耦合度非常高,與單一模型高度耦合。但我們終於進入了多模型應用的階段,我可以協調一個確定性的工作流程,一個基於某個模型建構的應用程式代理人與另一個代理人對話。我們甚至有這些有用的協定,無論是 MCP 還是 A2,或者其他什麼,如果我們能稍微標準化一下,這些都是好事。然後,我們就可以建構出能夠利用我所謂的這些能力建構,但同時具有靈活性的應用程式。這就是我認為開源絕對可以扮演極其重要角色的地方。

是的。嗯,嗯,我肯定想確保我們能討論如何將多個模型一起使用。而且我認為這裡有一個像是「蒸餾工廠」(distillation factory)的整體概念,以及圍繞它的資訊和基礎設施,你認為 Microsoft 在擁有多個模型的情況下,處於提供這些服務的有利位置。嗯,也許我們稍後再回到這個問題。但在那之前,你知道,Microsoft 顯然在開源方面經歷了一段有趣的旅程,對吧?這是你在你的領導下早期所做的一件大事,就是擁抱它。而且,你知道,你們早期與 OpenAI 有合作關係,但同時也非常清楚,除了與封閉模型合作外,你們也希望確保 Microsoft 能夠很好地服務於開放模型。我很好奇你對此的看法,以及你認為開源生態系統將如何發展,以及為什麼這對你的客戶很重要,還有你如何看待你正在建構的所有基礎設施。

Microsoft 與開源

是的,你問這個很有趣,因為我,我成長的過程中,事實上,我在 Microsoft 一份具塑造性的工作,也是確保我們與當時各種 Unix 版本之間,在 NT 和 Unix 之間具有互通性。呃,那教會了我一件事,那就是互通性首先是客戶所要求的,如果你在這方面做得好,呃,那對你的業務有好處,顯然你也在迎合客戶的需求。所以對我們來說,我認為這塑造了我對開放的思考方式。我的意思是,我對封閉原始碼或開放原始碼並非教條式的,兩者在世界上都是需要的,呃,事實上,我認為客戶會要求它們,對吧,即使我們任何人有教條,也無關緊要,因為最終世界會朝那個方向發展,也就是說會有這樣的需求。因此,我認為,呃,例如,曾經有 SQL Server,也有 MySQL 或 Postgress,有 Linux,也有 Windows,事實上,Windows 上也有 Linux,我最喜歡用的其實是 Windows 上的 WSL,因為它讓使用許多開發工具並在 Windows 上部署變得很容易。所以總的來說,我認為擁有一種允許你混合搭配這兩者的姿態是非常有幫助的。這也符合你剛才談到的,因為我很多企業客戶希望能夠在許多情況下蒸餾(distill)他們擁有的模型。那是他們的智慧財產權。呃,所以在那個地方,一個開放權重(open-weight)的模型相較於封閉模型具有巨大的結構性優勢。呃,所以我確實覺得,現在這個世界,有了優秀的封閉原始碼前沿模型和優秀的開源前沿模型,會得到更好的服務。對我們這樣的超大規模雲端服務商(hyperscaler)來說,這是件好事,因為畢竟,呃,我們的工作就是服務,就像如果你去 Azure,你可以獲得很棒的 Postgress,你可以獲得很棒的 SQL Server,或者你可以獲得 Linux 或 Windows 虛擬機器,同樣地,我們希望提供選擇,並圍繞它提供很棒的工具。

Azure 在 AI 生態系統中的角色

所以,所以你認為 Azure 為開源所扮演的角色或定位是什麼?但我想這可以涵蓋所有這些,不必專指開源。所以對於剛開始的開發者來說,你試圖在哪個領域做出差異化並成為最好的?

首先,AI 工作負載並非只有一個 AI 加速器和一個你在推論時才知道的模型,對吧?因為事實上,如果你檢視任何 AI 工作負載的底層,都有儲存,對吧,除了 AI 加速器之外還有其他運算,並且對網路等有很大的依賴性。所以是核心基礎設施。因此,對我們 Azure 而言,我們希望建構運算、儲存、網路,外加 AI 加速器,即使是作為基礎設施即服務(IaaS),對於想要建構下一代代理程式的人來說,也要是世界級的。然後在其之上,我們也正在與 Foundry 合作建構一個應用程式伺服器,例如我們每一次的平台轉移,都有一個應用程式伺服器,你如何將所有服務打包起來,你知道,搜尋、記憶體,或者安全性,所有這些都是某人或評估所需的服務,這些都是每個開發者都試圖去做的事情。所以如果你將它們全部包裝在框架中,為它們提供工具,呃,我認為這是核心。然後另一個是我們非常專注於 GitHub Copilot 作為工具。呃,我們對它所取得的進展感到興奮。所以,優秀的工具、優秀的應用程式伺服器和優秀的基礎設施的組合,對我們來說,是我認為加速應用程式開發所需要的。

AI 與開發者生產力

是的。那麼,嗯,你提到了代理程式(agents)和提高生產力,這顯然是整個生態系統和社群的一個巨大主題。我很好奇你如何看待這在 Microsoft 內部發生的情況,然後你也如何看待,嗯,你看到的開發中最有趣的例子有哪些?

是的,我的意思是,我認為對我們來說,顯然最有幫助的事情是軟體開發領域發生的變化,對吧?我的意思是,有幾件事,如果你看看 GitHub Copilot 的演進,你從程式碼補全開始,然後你說讓我們加入聊天功能,這樣你就不用去 Reddit 或 Stack Overflow,可以保持在工作流程中。所以這很好。然後是代理式工作流程(agentic workflow),所以你可以直接指派任務。嗯,所以這三件事,如果我看看我們任何人使用它的情況,你一直在同時使用這三者,對吧?所以並不是一個取代另一個,現在你甚至有了一個原型代理程式(proto agent),嗯,所以你可以字面上進行高層次的提示,或者你可以直接將一個 PR 指派給一個套件代理程式(suite agent)。所以所有這四個,以及生產力的提升,從中學到的最大教訓是,Mark,你必須將所有這些與你目前的儲存庫(repo)和你目前的開發者工作流程整合起來,對吧?我的意思是,建立一個全新的綠地應用程式是一回事,但我們沒有人總是有機會從事完全的綠地專案,對吧?所以,你是在一個大型程式碼庫中工作,有著大量的工作流程,所以你必須整合工具鏈,這就是系統工作,呃,我認為任何工程團隊都必須做,然後你才會看到生產力的提升。

AI 對知識工作的影響

坦白說,這同樣適用於其餘的知識工作。所以,在我們使用 Copilot 部署於知識工作的情況下,嗯,你知道,如果你以銷售為例,你知道,我總是描述的一件事是,呃,假設我正在為客戶會議做準備,我為企業客戶會議做準備的工作流程自 1992 年我加入 Microsoft 以來就沒有改變過,對吧?基本上,會有人寫一份報告,透過電子郵件發送,或者在文件中共享,我會在前一天晚上閱讀它。現在我只要去 Researcher 和 Copilot,我就能得到結合了網路上、內部資訊,甚至是我 CRM 中所有內容的即時資訊,對吧?但這是一個改變,不需要有人準備任何東西,因為所有東西都唾手可得。所以它要求你改變工作成果(work artifact)和工作流程,這就是很多改變的地方。嗯,一開始它發生得很慢,然後突然之間,對吧?我在個人電腦上看到了這一點,對吧?我想想在電子郵件和 Excel 出現之前,世界是如何做預測的,你知道,傳真到處傳。是的。我想你從未經歷過那個世界。我那時還在念中學。是的。我知道,但曾經有一個世界,人們到處傳真,人們互傳辦公室備忘錄,然後有人說,嘿,我用電子郵件傳送試算表,人們輸入數字,這改變了人們做預測的方式。我認為我們正處於這個階段的開端,你在客戶服務中看到它,我認為在行銷資料創建、內容創建中也看到它。所以我們正處於這個階段,你正在看到實質的進展和實質的生產力提升。

Microsoft 內部 AI 生成程式碼的比例

是的,很有趣。嗯,在程式碼編寫以及它如何改進這方面,你是否知道在 Microsoft 內部,有多少比例的程式碼是由 AI 編寫的,而不是由工程師編寫的?

是的,所以我們正在追蹤兩類事情,一個是接受率本身,對吧,大約是 30%、40%,並且持續單調上升。呃,這取決於情況,例如我們長期以來面臨的一大挑戰是,我們大量的程式碼仍然是 C++。嗯,C 和 C# 相當不錯,但 C++ 並不是那麼好。Python 非常棒。所以我們現在在這方面做得更好了。因此,隨著語言支援的增加,程式碼補全也變得更好。在代理式程式碼(agentic code)方面,它仍然非常,可以說是 nascent,對於新的綠地專案來說,它非常非常高。呃,但正如我所說,很多情況下並非綠地專案,因此我會說,目前 PR,喔,順帶一提,程式碼審查(code reviews)非常高,事實上,我們用於審查程式碼的代理程式,呃,其使用量增加了。所以我會說,在我們目前的一些專案中,我們儲存庫中大約 20% 到 30% 的程式碼可能都是由軟體編寫的。你們呢?

嗯,我手邊其實沒有確切的數字,但我……而且它是……嗯,我想,你知道,我想很多人說的統計數據,實際上仍然是這種像是自動完成(autocomplete)的形式。是的。但我們有一些團隊正在進行……嗯,基本上是進行動態消息排序實驗(feed ranking experiments)和廣告排序,以及像是在非常受限的領域,你可以研究所有已做變更的歷史,然後……然後做出改變。我認為這對我們來說是一個有趣的領域。但我們關注的重點是……嗯,建立一個 AI 和機器學習工程師來推動 Llama 本身的發展。對吧?因為我的意思是,我們的賭注是,在接下來的一年裡,可能,你知道,我不知道,也許一半的開發將由 AI 完成,而不是由人完成,然後這個比例會從那裡開始增加。所以我只是好奇你是否看到了不同的情況。

是的。我的意思是,對我來說,軟體代理程式(SW agent)是某種初步的嘗試。所以對我們來說,問題是在接下來的一年裡,我們是否能做到,嗯,比如說核心最佳化(kernel optimization),對吧,我們是否能達到類似那樣的程度,我認為這更有可能。至於它是否會提出一個新穎的模型架構變革,可能不會。所以問題在於是哪個任務。是的。

是的。你知道,最佳化、安全性改進,諸如此類的事情。我認為這似乎是很有機會的。嗯,是的,不,我們也在嘗試解決一個不同的問題,因為我的意思是,你們服務於很多開發者和工程師,那是你們的核心業務。嗯,而對我們來說,我們更多地將其視為改善我們內部開發和改進 Llama 模型的事物,其他人可以使用這些模型,但這並不是我們像你們那樣進行端到端工作流程的事情。所以,聽聽你們如何思考這個問題總是很有趣。

開發者工具的未來:為代理程式設計的 AI

是的。對我們來說,另一件事是,是的,正如你所說,我們的核心業務,事實上,你知道,Bill 創立公司時就是一家工具公司。所以對我們來說,呃,我現在思考的有趣之處在於,也許我們應該重新概念化我們的工具,坦白說,還有基礎設施,它們是供代理程式(agents)使用的工具和基礎設施,因為即使是三個代理程式也需要一堆工具,它們應該是什麼樣子,呃,它們的基礎設施應該是什麼,它們的沙箱(sandboxes)應該是什麼。所以我們將要做的很多事情,呃,基本上是進化,甚至包括 GitHub repo 的結構對於 sui agent 來說應該是什麼樣子。

不,那是一個非常有趣的概念,我的意思是,我傾向於認為,就像每個工程師未來實際上都會更像是一個技術主管(tech lead),擁有自己的一小群工程代理人(engineering agents)與他們一起工作。但是,是的。

個人 AI 工作流程與應用的未來

嗯,所以考慮到這一切,我的意思是,我想,嗯,我的意思是,有幾個方向可以探討。我的意思是,我很好奇,我的意思是,你提到了你個人使用 AI 的工作流程。我很好奇那是如何改變的。嗯,我,我,我也很好奇,因為你談到 Microsoft 是如何開始這方面的,以及那裡的傳統,但我的意思是,我想總是有這樣一個問題,如果你今天作為一個開發者開始建構一些東西,你會如何思考你會使用哪些工具?

而且,嗯,是的,我想其中一個,最大的,我稱之為,我不知道,夢想、追求、問題,是 Bill 灌輸給我們所有人的,那就是,嗯,他過去常常這樣談論,文件、應用程式和網站之間有什麼區別?現在,如果你使用 Meta ChatGPT Copilot 之類的東西。我不清楚聊天會話,嗯,和,然後我轉到 Pages,在我們的例子中,就像字面上,甚至在下來的路上,你知道,我正在閱讀關於 Llama 4 的所有內容,所有的模型,就像字面上,我只是在進行一堆聊天會話,有效地將它們添加到 Pages 中的一個文件中,持久化它,呃,然後你可以給它,我的意思是,既然你有程式碼補全功能,你可以去,你知道,把它變成一個應用程式或諸如此類的。所以這個想法,你可以從一個高層次的意圖開始,最終得到一個你過去稱之為應用程式的活的產物(living artifact),我認為將對工作流程產生深遠的影響,我認為我們正處於這個開端,呃,這就是我的夢想。所以如果我說,作為基礎設施和工具的建構者,以及作為它的使用者,這些人為的類別界限,不是人為的,或者說這些類別界限的產生,主要是由於我們軟體運作方式的限制,也許,也許你會超越。嗯,事實上,我們過去常常思考的另一件事是,為什麼 Word、Excel、PowerPoint 是不同的,為什麼它們不是一回事?我們已經嘗試過多次,呃,但現在你可以設想它了,對吧,你可以從 Word 開始,你可以像 Excel 那樣視覺化事物並呈現它,它們都可以作為一個資料結構或諸如此類的被持久化。所以對我來說,那種以前不那麼穩健的可塑性(malleability)現在存在了。

AI 對 GDP 和生產力的影響

是的。很有趣。有道理。所以,在我們這些年來的對話中,有一件事一直讓我印象深刻。我覺得你對科技趨勢的發展方式有一種非常,嗯,這是一種非常理性的看法,圍繞著 AI 有各種各樣的炒作,我覺得你能夠看透這些,並在每一步都做出非常理性的投資。你提出的觀點之一是,好吧,是有很多炒作,但說到底,如果這真的要帶來生產力的大幅提升,那就需要在 GDP 的大幅增長中得到體現,而且這需要好幾年,很多年才能實現。我很好奇你現在對我們應該關注什麼來了解這方面進展的看法,以及你預期在三、五、七年內會達到什麼程度。

對我來說,我認為那是對的。我的意思是,因為對我們來說,我會說這是一個相當攸關存亡的優先事項。坦白說,世界需要一種新的生產要素和投入,讓我們能夠應對我們面臨的許多挑戰。嗯,呃,思考這個問題的最佳方式是,嘿,比如說,已開發國家要以 10% 的速度增長,需要什麼條件?嗯,對吧,這可能是工業革命或其他時期的一些高峰數字。嗯,要做到這一點,你就必須在每個職能部門都實現生產力提升,對吧,在醫療保健、零售、廣泛的知識工作、任何行業都是如此。要做到這一點,我認為 AI 有這個潛力,但你現在必須真正讓它帶來生產力的實際改變,這需要軟體,也需要管理上的改變,對吧?因為在某種程度上,人們必須以不同的方式與它合作。呃,你知道,人們總是引用電力發生的事情,對吧,它存在了 50 年,人們才弄清楚,嘿,我們必須真正改變工廠才能以不同的方式使用電力,對吧?這就是著名的 Ford 案例研究。所以對我來說,我們正處於某個中間階段,我希望我們不要花 50 年的時間,嗯,但我確實覺得,僅僅把這看作是無論什麼無馬馬車,呃,也不會是我們到達另一邊的方式。所以這不僅僅是科技。科技必須進步。呃,你必須把它們放入能夠真正交付新的工作成果和工作流程的系統中。

是的。嗯,我們都在投資,好像這不會花 50 年。所以我希望它不會花 50 年。嗯,好吧。

「蒸餾工廠」:結合不同的 AI 模型

所以,所以我們一直在,你知道,我們先談論更多技術性的問題,然後再談到大局,但我意識到我們忘了深入探討「蒸餾工廠」(distillation factory)的事情,以及你基本上如何結合所有不同的,嗯,所有正在為開源建構出來的不同 AI 模型,以及你認為建構這些模型所必需的基礎設施是什麼。我的意思是,這是你談論過的事情,而且我認為你對此有一個……

是的。對我來說,我認為那,那對我來說是我認為開源最大的作用之一,對吧,就是能夠拿取,比如說,嗯,你的一些,甚至是在 Llama 家族內部,拿一個大型模型,然後能夠,呃,將它蒸餾(distill)成一個更小的模型,甚至具有相同的模型形狀,呃,我認為這是一個很大的使用案例。嗯,所以能夠為此建構工具作為一種服務,嗯,並降低門檻,就像,我的意思是,就像你說的,建立一些這樣的大型模型需要很多基礎設施,不是每個人都需要做,但如果你把它作為一種雲端服務來做,然後圍繞它提供工具,結果是一個蒸餾後的模型,在我們的例子中,假設 Microsoft 365 的每個租戶,如果他們可以擁有一個蒸餾後的任務特定模型,他們可以將其創建為一個代理程式或工作流程,然後可以從 Copilot 內部調用。對我來說,這是一個突破性的場景,人們已經在做很多這樣的事情了,我們希望讓它變得更容易。所以當我說「蒸餾工廠」時,呃,這就是我想要在一個大型模型和這些蒸餾模型之間建立的多對多類型或一對多的關係,然後這些蒸餾模型會與像 GitHub Copilot 或 Copilot 這樣的產品內部許多其他工作流程組合起來,因為它們現在都支援透過 MCP 伺服器等方式調用這些其他代理程式。

是的。不,這,這,我一直對此著迷。我的意思是,我認為蒸餾(distillation)是開源最強大的部分之一。而且我想,僅僅因為我們在這裡所做的事情的各自部分,你知道,我們正在訓練最初的 Llama 模型,但我們自己並沒有建構大部分的開發者基礎設施。我認為擁有像你們這樣的公司,基本上會建構出這種複雜的基礎設施。我們有一些模型,像是我們正在開發的那個 behemoth 模型,我,我,我認為除非將其蒸餾成更合理的形式,否則真的不清楚該如何使用它。是的。所以我的意思是,即使是我們自己要使用它,我們也必須在內部建構大量的基礎設施,即使只是為了能夠進行後續訓練(post-train),而且,你知道,我們不可能執行 infra Maverick,你說的是蒸餾後的,是的,很多 Maverick,我的意思是,我們基本上讓 Maverick 的性能達到現在的水平,對吧,它基本上是多模態的,對吧?所以它在多模態方面領先,在文本性能方面,它基本上,你知道,與其他領先的文本模型相當,但它更小,對吧?所以我的意思是,DeepSeek 是一個比它更大的模型,但在文本方面,它基本上是相當的,然後在圖像和多模態方面,它存在,而其他的,你知道,則沒有。所以,嗯,所以是的,我的意思是,我們基本上如何做到這一點,你知道,我們已經完成了 behemoth 的預訓練,我們正在進行後續訓練,但即使只是讓它,我的意思是,蒸餾,它就像,它就像魔法一樣。你基本上可以讓一個體積大 20 倍的東西,以一種便宜得多、使用效率高得多的形式,獲得其 90% 或 95% 的智能。所以問題是,好吧,你如何讓那些不那麼,你知道,沒有能力建立自己基礎設施,技術上不那麼成熟的人也能做到這一點?因為現在我認為世界上能夠進行那種,嗯,蒸餾,甚至操作那種規模模型的實驗室相對較少。我想等到你所設想的這個願景建成,並且世界上大多數開發者都能夠不僅從單一模型進行蒸餾,而且希望隨著時間的推移,能夠混合搭配,從不同模型中提取它們更強的智能方面。嗯,這似乎是我認為將會被建構出來最酷的事情之一。

是的。不,我認為那是對的。因此,稍微談談,如果你有多個模型要進行蒸餾,那麼圍繞這個蒸餾後的模型,你可以進行怎樣的評估來使其合格。我認為這就是我們可以做很多工具開發、基礎設施工作的地方,降低人們擁有這種靈活性的門檻。呃,好消息是,嗯,這已經開始了。已經有了所有這些的實證。問題只是你是否能降低建構所有這些的門檻。另一件事是人們行動的速度。迄今為止的一個挑戰是,呃,我用一個模型做了一些事情,我對它進行了微調,一個新的樣本出現了,我需要快速轉移到新的樣本。所以這是我們必須擅長的另一件事,呃,因為你不能被你過去所做的事情所束縛。呃,因為世界變化太快了。

是的。是的。而且我的意思是,開發者只是需要不同形狀的東西。我的意思是,Llama 4 每個專家 170 億參數的形狀,是因為 Meta 的原子單元是 H100,對吧?所以我們希望能夠在上面非常有效地運行這些東西。嗯,這就是其中一件事,我的意思是,你看看其他一些已經發布的模型,其他一些開源模型,它們的智能不錯,但由於規模的原因,推斷起來有點尷尬,也許它們針對的是不同種類的基礎設施。嗯,但我們基本上是為伺服器生產而建構的,但很多開源社群想要更小的模型。所以,能夠,你知道,建構,你知道,最受歡迎的 Llama 3 模型是 8B,我們會開發一個更小的版本。我之前談到過。我們內部稱之為 little Llama,但我們會看看我們實際上會發布什麼。嗯,但是能夠基本上從更大的模型中獲取任何智能,並將它們蒸餾成你想要的任何外形尺寸,以便能夠在你的筆記型電腦、手機上運行,無論是什麼東西,我認為這只是,我不知道。我的意思是,對我來說,這是最重要的事情之一。

是的。而且我認為你們顯然正在做這件事,嗯,而且我認為這很好,就是,嗯,如果我們能達到這些混合模型,嗯,你知道,無論是,你知道,密集模型加上思考模型結合起來,然後你能夠得到你想要的延遲,呃,或者你想要的思考時間,呃,而且它是靈活的,呃,我認為這就是我們都希望最終達到的目標。

開發者的樂觀與行動呼籲

好吧。嗯,也許一個好的結束點是,就是,當你看到所有正在發生的事情時,我的意思是,我很好奇,在接下來的時期,對於開發者在未來幾年將要做的事情,什麼最讓你感到樂觀,或者你最興奮的是什麼?

是的,我的意思是,看,我的意思是,你知道,我總是從 Bob Dylan 的那句歌詞中汲取靈感,對吧,那就是你要么忙著出生,要么忙著死去。忙著出生更好。尤其是在這樣的時候,嗯,我認為讓我感到樂觀的是,即使有各種各樣的限制,事實證明,軟體以這種新形式的 AI,仍然是我們擁有的最具可塑性的資源,可以用來解決這些難題。嗯,所以這就是讓我感到樂觀的原因,而且我也會說,這就是對在座各位和我們所有人的行動呼籲,就是要抓住機會,投入其中,呃,然後也要建構解決方案。當我看到,無論是公司裡的 IT 積壓工作,還是現實世界中未解決的問題,兩者都需要新的東西,呃,為了處理這些,我認為這就是所有這些技術的最大益處所在,而這最終只會歸結於,你知道,特別是開發者,呃,能夠無所畏懼地去嘗試。

太棒了。好吧。嗯,謝謝你,Satya,也謝謝大家出席。今天真是令人興奮的一天,我對我們大家正在建構的一切感到非常興奮。所以,[音樂]