原文連結: 20VC: 微軟首席技術官Kevin Scott談AI世界中價值的流向

Kevin Scott

現在是最好的時代,尤其是對於具有創業精神的人。我可以非常清楚地看到我們現在正在做的事情,也喜歡我們接下來要做的事情。而我看不到規模化法則的限制。我不相信「一個代理就能處理所有事情」的理論。我認為你將會有許多代理,而我之所以這麼認為,是因為你的產品經理很可能需要成為領域專家。這些代理將來肯定會變得更少交易導向、更少依賴單一工作階段。

Harry Stebbings 你現在正在收聽 20VC,由我 Harry Stebbings 主持。現在,我認為這個節目「Stay」對我來說真正強調了網際網路的力量。我從零開始創立了 20VC,當時只是從一個——

C 倫敦的臥室裡,一個 17 歲的青少年。

Harry Stebbings 而今天,我正與微軟的首席技術長對談,他來自世界上最——

C 具價值的公司之一,同時也是人工智慧領域的領導者。

Harry Stebbings 因此,我很高興地歡迎 Kevin Scott,他負責微軟的人工智慧和技術發展,並在微軟與 OpenAI 的合作中發揮了關鍵作用。這將是一場精彩的討論,涵蓋規模化法則、推理的未來、數據、運算能力,以及我們將走向何方。該拿出筆記本了,這次訪談真的讓我充滿喜悅。但在我們開始之前,讓我們來談談,如何將你的餐巾紙上的創意變成價值數十億美元的初創公司,這需要無數小時的協作與團隊合作。而建立一支在價值觀、工作流程等各方面都高度一致的團隊,可能是件非常困難的事。但這正是 Coda 誕生的目的。

Coda 是一個全方位的協作工作空間,最初的構想只是一張餐巾紙上的草圖。如今,自從五年前推出測試版以來,Coda 已經幫助了全球 50,000 支團隊保持一致。在 20VC,我們使用 Coda 來為內容規劃和節目準備帶來結構化,這帶來了巨大的改變。與其在不同的工具之間來回切換,我們現在可以將所有內容,從來賓研究到日程安排和筆記,都集中在同一個地方,這為我們節省了大量時間。使用 Coda,你可以擁有文件的靈活性、試算表的結構性,以及應用程式的強大功能,這一切都為企業而打造。此外,它還具備人工智慧的智慧,使其更強大。如果你是一個希望提升團隊一致性和敏捷性的初創團隊,Coda 可以幫助你以前所未有的速度從計劃轉向執行。立即試用,前往 CODA.io/20VC,獲得六個月的免費團隊計劃。

當 Coda 讓引擎運轉順暢時,Shopify 則在銷售時全力加速。我花時間研究當今和未來的成功企業,而往往有一個「企業背後的企業」,幫助數百萬家企業獲得成功,那就是 Shopify。Shopify 擁有全球第一的結帳系統,能將轉換率提高驚人的 50%,這意味著更少的購物車被遺棄,更多的銷售進入你的業務。如果你想擴展你的業務,你的電商平台就必須準備好隨時隨地進行銷售。現在就前往 shopify.com/20VC,開始你的 1 美元/月試用。這是 shopify.com/20VC(請輸入字母)。

當 Shopify 幫助你推動銷售時,別忘了真正讓客戶持續回購的是「信任」。信任不只是靠贏得的,它還是被市場所要求的。因此,超過 9,000 家公司,包括 Atlassian、Core 和 Factory,都依賴 Vanta 來自動化安全合規性管理。Vanta 幫助企業獲得 SoC2 和 ISO 27001 等認證,將數個月繁瑣的工作轉化為快速且直觀的流程。這個平台能自動化管理超過 35 個框架的合規性,集中管理工作流程,並主動管理風險,同時利用自動化和人工智慧幫助你節省時間。因此,無論你是剛開始還是正在擴展安全計劃,Vanta 都能幫助你快速準備審計,並贏得客戶的信任。現在就訪問 vanta.com/20VC,獲得第一年 1,000 美元的折扣。

C 你現在已經抵達目的地。

Kevin,我對這次訪談感到無比興奮。我剛剛還在告訴你,我在跑步時聽你和 Shrap 的對談,我想我從來沒有跑得這麼快過。這顯然說明這次對話太精彩了。

Kevin Scott 要不就是精彩無比,要不就是糟糕到讓你想趕快結束跑步,好讓自己解脫。

C 我從來沒有這麼快跑完 10 公里。我想用一個超簡單的問題作為開場。身為風險投資人,我的工作是試圖判斷不同時間點的價值所在。而現在,我環顧這個世界,發現這是許久以來的第一次,Kevin,我不知道答案。

我的問題是,在這個下一代的人工智慧浪潮中,你認為可持續的價值將會落在哪裡?

AI 浪潮中的價值歸屬?

Kevin Scott 是啊,我不知道。我覺得你剛剛描述的情況——突然之間,事情變得比以前更加不明朗——正是每一次重大的技術範式轉移和新週期開始時都會發生的事情。當初網際網路剛興起時非常混亂,我認為行動裝置的早期階段也是如此。當時每個人對於什麼會變得有價值都有各種想法,但其中真正持久並經得起時間考驗的卻少之又少。

C 在這些轉變時期,當一切都充滿不確定性時,你學到的最佳應對方式是什麼?應該積極行動,不斷試驗與學習,即使會犯很多錯誤讓自己後悔?還是應該袖手旁觀,看別人犯錯?

Kevin Scott 噢,天啊,絕對不能選擇後者。如果你有創業精神,現在就是最好的時代。我認為在這樣的時刻,你不能忘記從過去的經驗中學到的有效做法。而這並不是說要做某個特定的事情,而是關於「如何進行探索」,正如你剛才描述的那樣——產品才是關鍵。

這幾年來,我一直在強調「模型不是產品」,因為大家太過著迷於基礎架構本身。這也是這些週期初期的典型特徵——技術人員往往會沉迷於技術細節,卻忘記真正重要的是打造出優秀的產品。而現在我們正處於這個階段:你必須做出好的產品,你需要有想法,有信念,然後你必須快速執行,看看你的信念是否站得住腳,還是完全沒道理可言。

在週期的初期,你可參考的模式非常有限,無法簡單地模仿別人的成功並稍作改進。你需要探索完全嶄新的事物,而唯一的方法就是推出產品、收集數據、進行迭代,並且對自己所看到的結果保持極度誠實。

你不能因為太愛自己的想法,而忽視從數據與回饋中得到的真實訊息。

模型非產品:價值的核心在應用

C 你剛才說「模型不是產品」,我最近剛訪問了 Cerebras 的 Andrew,也問了他一個類似的問題。我說,如果我們思考計算能力或硬體,然後是模型,最後是應用,那麼價值到底落在哪裡?他毫不猶豫地選擇計算能力。但從你的觀點來看,當你認為「模型不是產品」時,這是否意味著模型並不具備價值?

Kevin Scott 不,不,不,模型當然非常有價值。但它們的價值只有在透過產品滿足使用者需求時才會真正體現出來。所以,從長遠來看,我認為產品才是最重要的。如果你打造出優秀的模型,圍繞這些模型建立出強大的基礎架構,擁有高效的計算能力和其他相關要素,那麼你自然會有很多機會來變現這些技術,因為當人們開始建立產品時,他們會消耗你的平台與基礎架構,這對你的業務是有利的。

但說到底,大多數的價值仍然來自產品。我們並不是為了基礎架構而建設基礎架構,而是為了讓人們能夠打造出優秀的產品。

C 這是一個引導性的問題——你可能已經知道我的意思了。如果我們討論產品,那麼誰能從這些產品中獲得最多的利益?是那些從零開始,能夠輕鬆整合新技術的初創公司?還是像微軟或 Google 這樣的大企業,擁有龐大的分銷渠道,能夠輕鬆整合 AI?誰最能從這個變革中受益?

Kevin Scott 我不知道。但如果你回顧過去的技術週期,你會發現價值的創造其實在初創企業、新創投資,以及現有的大型企業之間都有所分布。所以,我認為大家其實都在做同樣的事情——試圖發掘新的機會。

如果你是一家像微軟這樣的大公司,擁有悠久的歷史以及市場上已經取得成功的產品,那麼你的挑戰就是弄清楚,在你已經熟知的領域裡,哪些客戶可以從這些新的 AI 能力中受益?

當然,除了這些,我還負責管理微軟研究院(Microsoft Research),所以我的另一個任務是探索那些尚未被發掘的領域,看看是否能發現一些極具顛覆性的創新事物。但這其實也是初創企業生態系統的使命。我同時也是一名天使投資人,會為初創公司提供建議,我自己也曾在初創公司工作過。

因此,我認為最重要的是有大量的人在尋找這些新機會。我對當前的 AI 平台轉型充滿信心,因為微軟或任何其他大公司都不可能擁有足夠的想像力與視角,來洞察所有可能的創新機會。

擁有一個充滿活力的生態系統,讓許多人探索價值所在,我認為這不僅令人興奮,而且是必需的。此外,我還認為,如今的工具、基礎架構與平台比以往任何時候都更加便宜、易獲取、易使用。因此,現在正是最好的時機,你可以輕鬆拿起這些工具,立即開始行動。

擴展定律的極限?尚未觸及

C 我之前提到過,我有在聽你的節目,你對「達到擴展定律極限」這個觀點持反對意見,認為我們並沒有即將觸及效率或效能的極限。但許多人都認為我們很快就會碰到擴展定律的極限。為什麼你不這麼認為?這難道不是個荒謬的說法嗎?

Kevin Scott 我可以非常清楚地看到我們現在在做什麼,以及接下來要做什麼,而我並沒有看到擴展定律的極限。如果你只是單純考慮模型的原始能力,以及我們能夠如何讓它們推理越來越複雜的事物,那麼某個時間點或許會真的出現一個極限。我直覺上認為這個極限一定存在。但也有一些人不這麼認為,他們認為人類的智慧受到物理極限的約束,比如你的大腦能容納的神經元數量、你的能量消耗上限大約是 20 瓦,這些因素決定了你的智慧極限。

但有些人相信,如果是 AI,就不會有這樣的限制,他們認為 AI 可以無限擴展,進入一個無法預測的領域。我不太喜歡這種說法,我也不一定相信這一點。我認為我們最終會達到某個擴展的極限,在那個點上,邊際報酬會遞減,而計算資源的成本將變得過於昂貴,導致我們決定不值得再投入額外的資源來讓 AI 變得「稍微聰明一點」,因為我們還沒搞清楚這樣的提升對實際使用者來說是否真的有價值。我相信這個時刻終究會到來,但現在我還看不到它,至少目前還沒出現在視野範圍內。

數據的演變:品質、合成與評估挑戰

C 當我們思考構成效率的三個核心要素——數據、運算與演算法——並深入探討數據時,你對數據效率的最大觀察是什麼?數據的品質與數量,合成數據與人類數據之間的權衡,你是如何看待的?

Kevin Scott 如今,合成數據的比例正在上升。高品質數據在模型生產流程的後期訓練部分變得比低品質數據更有價值。因此,我認為我們現在已經非常明確地進入一個階段:如果你擁有合適的基礎設施、超高品質的數據以及來自專家的高品質人類回饋,那麼你可以將這些元素放大,轉化為訓練更大規模模型所需的理想語料。而這些數據的價值遠遠超過了網路上隨處可見的、沒有經過篩選的語料。

C 在數據及其應用方面,有哪些我們尚未掌握的問題,而這些問題如果得到解答,將會對我們的理解與應用最有幫助?

Kevin Scott 目前最有趣但仍然缺乏明確答案的問題,就是「評估」這個領域。現在很難量化一個數據 token(數據單位)對於訓練模型所產生的增量價值。換句話說,如果有人認為:「我的數據非常有價值,當它被用於訓練模型時,模型會變得更好。」這類說法往往缺乏科學依據。我們現有的測量方法表明,許多人認為有價值的數據,與實際對於構建有用模型的貢獻之間,存在著巨大的落差。

目前,大部分真正有用的數據,都來自那些認為模型是「知識存儲庫」的人,但他們實際上把模型當成世界上最差勁、最昂貴的資料庫來使用。而這種用法並不高效——畢竟,我們已經有搜尋引擎與資料庫,它們的資訊檢索能力足夠強大。

我們真正想讓模型具備的能力,是「推理」資訊的能力。如果你給它們提供資訊,它們應該能夠在這些資訊的基礎上進行推理,從而完成對使用者有幫助的任務。因此,在訓練模型時,我們所需的語料與培養它們「回憶事實」的語料是不同的——我們需要不同類型的 token 來強化模型的推理能力,而不是單純的記憶能力。

推論效率的持續優化

C 你剛才提到推理,讓我想到「推論」(Inference)。我其實很討厭這個詞,真希望我們能直接刪掉它,改成「使用」(Usage),因為它的本質就是使用——我們有訓練(Training),然後是使用(Usage)。

Harry Stebbings 那麼,你認為在推論(Inference)方面,有哪些關鍵點是我們沒有關注到,但應該投入更多時間思考的?

Kevin Scott 我認為大多數人忽略的一點是——儘管 DeepSeek R1 幾週前的發表讓大家意識到這件事——我們其實已經連續多年,在模型性能優化方面取得了驚人的進展。這些年來,每一年我們都在持續改進模型的推論效率,使得推論的效能越來越高,而 API 呼叫的成本則越來越低。

部分成本下降的原因是,每一代硬體的價格效能比大約可以提升 2 倍(如果運氣好的話)。但更大的提升,來自於我們在軟體堆疊(software stack)中的優化。我們在這方面投入了大量的工作。例如,DeepSeek R1 的成果固然令人印象深刻,但更重要的是,我們應該把它視為價格效能改進趨勢中的一個點。這可能對大眾來說是一個突然可見的突破,但對於那些深耕於系統優化的人來說,這並不意外。而且,這並不是終點,這條改善曲線仍然會繼續向前推進。

C 當這件事發布時,內部的反應是什麼?

Kevin Scott 我對公眾的反應感到驚訝。

C 為什麼?

Kevin Scott 因為我們其實已經擁有比 DeepSeek R1 更有趣的模型,但我們選擇根本不發布它們。我很驚訝大家對它的興趣程度。他們確實做得很好,技術上非常紮實,而且確實很酷。他們選擇發布這個項目,並以某種開源的方式提供,這本身就很有趣。而看到公眾如何反應,對我們來說也是一次很有意思的觀察。

C 從這次發布的公眾反應中,你有學到什麼,會應用到你自己的產品發布上嗎?

Kevin Scott 即便你已經讓事情變得極致簡單且低成本,讓人們能夠輕鬆上手,他們依然會對「如何使用」有非常強烈的偏好。因此,我們現在更加關注這一點。我們需要提供比以往更多的「如何使用」的選項,因為開發者希望有更多的選擇。

開源 vs. 封閉:AI 生態的未來

C 過去 12 到 24 個月間,你曾經相信但現在不再相信的事情是什麼?或者你改變了哪些想法?

Kevin Scott 當我還是研究生時,我曾經是一個徹底的開源狂熱分子。但隨著年齡增長,我變得更務實了。現在,我認為更重要的是基於現實情況做出務實的決策,來決定我要如何構建這些技術,而不是單純地滿足我的好奇心。

C 如果展望未來三到五年,甚至三到十年,你如何看待開源與封閉系統的普及程度?哪一方會更具主導地位?

Kevin Scott 我不知道。我認為這兩者都會大量存在。我們暫且不談 AI,因為 AI 是當前比較有爭議的領域,整個產業架構尚未穩定下來,我們也不確定它最終會變成什麼樣子。但我們可以從過去的一些領域來參考,例如搜尋。

市面上有許多開源的搜尋引擎項目,想要在應用程式中添加搜尋功能,或是自行構建搜尋引擎的人有很多選擇。他們可以直接使用開源方案作為起點,也可以部署商業產品,或者將數據載入像 Azure Cognitive Search 這樣的搜尋即服務(Search-as-a-Service)平台。Google 和 Amazon 也都有類似的服務,這些選擇都很容易獲得。與此同時,Bing 和 Google 這類大型搜尋引擎依然存在。

搜尋市場的經濟效益基本上都流向那些擁有龐大基礎設施並運營完整搜尋業務的公司,這些公司擁有自己的回饋機制(feedback loop)。我認為在 AI 領域,我們可能也會看到類似的情況發生。在基礎設施層面,會有大量的開源基礎設施產品,而人們會以各種不同的方式使用它們。但同時,還是會有很多人不願意從零開始搭建自己的基礎設施,或者去改進開源項目,以滿足自己的特定需求。

擁有這兩種選擇的世界是很好的。

C 你剛才提到產品的重要性。考慮到這點,再結合我們目前的討論,你怎麼看待「聊天」(Chat)作為未來產品形態的一種使用者介面(UI)?OpenAI 和 ChatGPT 讓它成為了一種默認方式。你認為這種默認方式是否合適?未來我們會看到什麼樣的變化?

Kevin Scott 嗯,我不確定。但我認為這是一個朝正確方向邁進的合理步驟。我這幾年一直在說的一件事是,AI 最有趣的變化之一在於,我們在過去近 200 年的時間裡,使用計算設備的方式基本沒有變化,這可以追溯到 Ada Lovelace 撰寫第一個程式的時候。

如果你想讓計算設備為你執行某個任務,你要麼必須自己是程式設計師,這對許多人來說是個很高的門檻;要麼就只能依賴程式設計師事先預測你的需求,並將解決方案打包成一款可執行的應用程式。而這兩種方式,直到現在都是主要的選項。AI 帶來的變化在於,它能夠理解你希望計算設備為你完成的任務,並找到一種方法來實現它,而你不需要是程式設計師。

這是一個深遠的變化。這不會是明年就會實現的事情,但可能也不需要等上 10 年。我們現在的軟體開發模式是:有一群人負責預測用戶在某個特定領域內的細節需求,然後編寫大量程式碼,再把這些程式碼掛載到某種使用者體驗(UI)上。他們希望自己能夠精準預測需求、設計出正確的 UI,確保所有程式碼都沒問題,並透過反覆的回饋循環來不斷優化整個系統。但這種模式將會改變。

未來,這樣的過程將不再是必須的。我們更需要的是某種「代理人」(Agent),來代表使用者執行這些功能,而不是讓使用者必須適應現在這種複雜的匹配過程——即用戶有一組期望,而產品團隊則試圖猜測這些期望。

C 現在工程或產品團隊中的某些職位,在 20 年後人們會回頭看,然後驚訝地說:「你們居然……?」

Harry Stebbings 曾經有秘書專門負責把醫生的語音錄音轉寫成文字……

Kevin Scott 就像過去那些秘書的工作一樣,未來某些工程師的角色也可能會發生變化。不過,我認為仍然需要有人來構建基礎設施,確保這些系統在現實世界中可以運作,例如提供訪問各種數據庫的能力。

很多工程師仍然需要構建這些底層能力,但呈現在使用者面前的 UI 可能會變成代理人。產品經理並不認同「一個代理人適用於所有場景」的理論。我認為我們將會有很多不同的代理人,而原因在於,產品經理本身需要成為某個領域的專家,例如醫學、藥物研發、早期創投投資等等。他們必須深入理解該領域的特殊性,並設計合適的反饋循環,讓這些代理人可以更好地幫助使用者完成這些專業領域的任務。

這將是產品經理和使用者共同訓練代理人的過程,讓它們能夠不斷提升,變得越來越擅長輔助我們完成特定任務。

AI 將重塑軟體開發與工程團隊

C 我經常覺得,人們往往高估某項技術在一兩年內的普及速度,但低估它在長期內的影響力。我對代理人的發展感到興奮,但我懷疑它是否真的會在短期內被世界上最大的公司廣泛採用,例如在未來一到三年內。你認為我這樣的看法是正確的嗎?還是你認為,這一波技術浪潮與以往不同,尤其是考慮到像微軟這樣的公司對它的推動?

Kevin Scott 技術的採用率總是與它的「效用」密切相關。如果某樣東西有用,那它自然會被廣泛使用。在軟體開發代理人領域,我們已經看到大量的採用案例。

開發者從一開始對這些工具持懷疑態度,到現在變成「你得從我死去的雙手中把它搶走」的程度——他們已經把這些工具視為自己工具箱中最重要的組成部分,並且再也離不開它們。而且,這些代理人還在變得越來越強大。

C 但我想問的是,這些工具真的有「鎖定效應」嗎?當我與人討論時,他們的確非常喜歡這些工具,但也都說:「這些工具並沒有鎖定效應,我明天就可以換另一家產品。」這樣的市場環境會影響它們的價值嗎?

A(Kevin Scott) 搜尋引擎也沒有鎖定效應——你完全可以在下一次查詢時換一家搜尋引擎,但大多數人並不會這樣做。

對於我們這些開發代理人的公司來說,我們的工作就是不斷打磨產品,每一天都讓代理人變得更好、更有價值。如果我們做得好,使用者自然會繼續選擇我們。

C 如果你以五年的時間範圍來看,人類與代理人的互動模式會變成什麼樣子?

Kevin Scott 現在的代理人有一個非常明顯的缺陷——它們缺乏記憶,這使得它們的行為過於「交易式」(Transactional)。即使在某些具備記憶功能的代理人中,這種記憶仍然非常有限。

但我知道,許多人正在努力改進這一點,未來一年內,記憶能力將會大幅提升。這意味著,當你與代理人互動時,它能夠記住更多過去的對話內容,並根據你的偏好進行調整。

這將帶來一個重大變化——當你解決一個問題時,你可以將解決方案記錄下來,然後在未來不需要每次都從零開始思考。

記憶還將賦予代理人「抽象」和「組合」的能力,讓它能夠基於過去學到的知識,不斷發展出更強大的解決方案。這意味著,未來的代理人將變得更少「交易式」、更少依賴單次對話,而更像是一種持續學習的助手。

此外,我希望在未來 12 個月內,代理人可以實現更多「非同步」的工作模式。目前的代理人大多數仍然是即時互動的——你給它一個指令,它立即執行並返回結果。但未來,我們將會看到更多的「委派式」代理人,讓它們執行更長時間的任務,即便你不在監督,它們仍然會持續運作,然後最終給你一個完整的結果。

代理人的發展方向應該是從執行「5 秒內完成的任務」,進化到「5 分鐘的任務」,再到「可以委派複雜工作並獨立完成」的程度。這與我們對待同事的方式是一樣的——我們可以將越來越多的工作委派給他們,而不必事無巨細地監督。

這是我對未來的想像。我認為,這正是所有人想要的方向,也是技術能力正在邁進的方向。因此,對於那些開發這類產品的人來說,關鍵問題是:如何圍繞這個不可避免的未來來構建產品?我們需要增加哪些系統能力,才能讓這些代理人實現我們最終希望它們能做的事情?

C 我們提到軟體開發是當前最被廣泛採用的使用機制之一。展望未來五年,你認為全新的程式碼中,有多少百分比會是 AI 生成的,而非人類撰寫的?

Kevin Scott 你說五年?五年內,95% 會是 AI 生成的。我認為很少會是逐行由人類撰寫的程式碼。但這並不意味著 AI 會取代軟體工程這項工作。因此,我認為更重要、更有趣的部分仍將完全由人類來負責。

C 在一個你不是輸入模型主宰的世界裡,「撰寫」到底意味著什麼?

Kevin Scott 嗯,這其實只是提升抽象層級而已。例如,當你在 Xcode 中設計 iPhone 應用程式時,你並不會手寫所有的程式碼,而是拖曳一堆使用者介面元件到畫面上。系統會自動產生大量樣板程式碼。這與現在的趨勢相同——我們正在提升抽象層級,改變程式設計師與機器溝通的介面,讓機器知道這裡有個問題需要解決。

目前的頂尖程式設計師,即使使用高抽象層級的工具,仍然可以深入了解底層運作。所以當系統發生問題時,他們能夠深入機器碼,檢視開發環境產生的樣板程式碼,找出問題所在。我認為,即便未來大部分程式碼都是 AI 生成的,這個狀況仍然不會改變。

C 在一個擁有 Bolt 或 Lovable 這類工具的世界中,是否每個人都算是程式設計師?因為這些工具可以讓人透過簡單的提示詞(prompts)建立網站。

Kevin Scott 是的,我認為是如此。但這並不代表每個人都在解決同樣類型的程式設計挑戰。如果你把這視為一種全體水準的提升,那麼它確實讓每個人成為程式設計師,因為你再也不需要找人幫你製作網站了。但如果你要解決全球最困難的計算問題,我認為仍然需要電腦科學家,而他們將會善用這些工具來解決過去無法解決的問題。

C 未來工程團隊的結構會有根本性的變化嗎?

Kevin Scott 是的,我認為會,但可能不是大家想的那種變化。我猜測小型團隊將能夠完成更大規模的專案。

這點很重要,因為小型團隊的效率通常比大型團隊高。擁有 10 位真正優秀、超級有動力的工程師,加上強大的工具,你就能做到非常多的事情。

C 有什麼是你最想做的,但因為規模或決策流程的關係,無法在 Microsoft 實現的?

Kevin Scott 在科技公司,規模通常會帶來兩種挑戰。有時候,這確實會讓你的速度變慢,而有些時候,變慢是必要的。但有時候,變慢只是因為組織變大了,自然產生的副作用。

C 有哪件事是你希望能更快完成,但卻因為種種因素而變慢了?

利用 AI 解決技術債

Kevin Scott 有些事情的速度無法超過物理法則所允許的極限。

在過去兩年半裡,自從 GPT-4 推出後,我們以 1000 英里的時速在建設基礎設施。我們真的已經以最快的速度在前進了。但即便如此,我還是希望能加快某些物理層面的進度,比如混凝土澆築的速度、電網擴充的速度等等。我希望這些能夠再快一點。

但在理想狀態下,無論在 Microsoft 或其他地方,我最希望能做到的是:讓每一位工程師的想法,從誕生到實踐之間不會有任何阻礙。如果一個工程師有個好點子,他應該能夠立即嘗試去實現它。

目前我們在 Microsoft 內部大量使用 AI,就是為了找出如何讓這種情況發生,幫助我們的員工能夠更自由地開發創意。

還有一個問題——如果你曾經管理過任何規模的工程團隊,你會知道「技術債(tech debt)」是一個極其棘手的問題,而且傳統上是零和博弈。技術債的本質是,你遲早會面臨一個痛苦的選擇:你必須趕在期限內推出產品,但這意味著技術細節可能沒辦法做到盡善盡美。因此,你選擇先發布,之後再來修補。

但只要這麼做,你就製造了技術債。技術債就像金融債務一樣,會產生「利息」,你必須持續支付。如果你不償還技術債並支付利息,最終它會累積到一個無法承受的程度,導致基礎設施崩潰。

所以,我對 AI 最興奮的一件事是:我認為 AI 可以讓這個零和問題變成非零和博弈。也就是說,我們未來不必再做這樣的權衡。

我們在 Microsoft Research 大約一年前發起了一項大型研究計畫,目標就是利用 AI 在大規模環境下消除技術債。這真的是一件超令人興奮的事情。我帶領工程團隊已經 20 年了,而技術債一直是我的死敵。

C 在過去的一年裡,透過這個計畫你學到了什麼?

Kevin Scott AI 工具的能力比人們想像的還要強。我認為,老實說,現在最先進的前沿模型能做到的事情,與它們實際被使用的方式之間的差距,比兩年前還要大。

C 如果可以的話,我們來進行一個快問快答。首先,你最尊敬的競爭對手是誰?

Harry Stebbings Google。

C Anthropic 還是 Meta?為什麼?

Kevin Scott 如果只能選一個,可能是 Anthropic。Dario 做得很好。

C 你收過最好的建議是什麼?

Kevin Scott 我曾經有一位導師告訴我,你可以把一個人或一個團隊的能力想像成一個直方圖,最左邊的區塊代表「愚蠢」,最右邊的區塊代表「天才」,而中間的則是「平庸」或「普通」。

他的論點是,你可以把你正在做的每一件事情歸類到這些區塊之一,而人們常犯的錯誤是,他們認為只要足夠努力,就能讓某件事往右邊提升一到兩個區塊。

而最大的錯誤是,人們總是專注於提升自己最不擅長的事情。但如果你接受這個理論,那麼如果你在某件事上是「愚蠢」的,最好的結果也只是變成「普通」而已。而當你花時間讓自己變得「普通」,你就浪費了可以用來發揮你天賦的時間。

我認為這是一個非常好的建議,因為幾乎所有值得做的事情,都需要團隊合作。而建立一個互補的團隊是很容易的。

C 那麼,你有哪些不擅長的事情,是你有意識地決定不去變得「普通」的?

Kevin Scott 喔,天啊,我不擅長的事情太多了。我對官僚體系的事情非常沒有耐心,我討厭預算、設施管理,還有各種機械式的行政工作。作為一名工程領導者,這類官僚性的東西讓我很煩躁。我可能可以讓自己變成一個「普通」的官僚,但如果真的去做,我一定會很糟糕。

C Satya 是我們這個世代最卓越的領導者之一。與他緊密合作、觀察他的運作方式後,你學到了哪些最重要的事情?

Kevin Scott 我認為,他最核心的領導原則是:你必須同時為人們創造能量(energy),並提供清晰度(clarity)。

他真的很擅長這點。他的工作很難,但他總是努力確保,無論是在會議、檢討,還是任何工作討論中,大家都能帶著積極的能量離開,讓這股能量幫助他們去解決接下來的困難挑戰。

同時,你不能只是製造一堆能量、光喊口號,卻不幫助大家釐清最重要的目標。

C 我很喜歡這個理念——創造能量,提供清晰度。我們之前提到 Deepseek,你覺得外界是否低估了中國在 AI 領域的能力?

Kevin Scott 我自己並沒有低估。我們應該對中國的企業家、科學家和工程師的能力保持高度尊重。他們非常厲害。如果有人低估他們,那是不應該的。我認為可能有些人確實低估了,這也是 Deepseek 出來後,大家反應如此驚訝的原因之一。大家都在想:「天啊,這居然來自中國?」但這根本不該讓人感到驚訝。

C 你認為,現今看似科幻的 AI 預測中,哪一項其實是真的?

Kevin Scott 事實上,我認為最先進的 AI 模型,現在可能已經比一般的全科醫師(GP)更擅長診斷疾病。

這是一件我們應該盡快認識並行動起來的事情,因為全球仍然有許多人無法獲得高品質的醫療資源,包括我家鄉維吉尼亞州中部的農村地區,那裡的醫療狀況並不好。

這類案例很多——這些 AI 模型的能力已經非常強大,但我們需要整個世界認識到它們的價值,才能夠真正部署這些技術。而我們之所以應該部署它們,重點不在於維持既有的醫療系統,而是因為這些技術能真正造福社會大眾。

C Kevin,許多人會問你各種問題,包括團隊成員、記者。那麼,有沒有什麼重要的問題,是你認為應該被問,卻很少有人問你的?

Kevin Scott 我不知道……我們的速度夠快嗎?

C 你覺得我們的速度夠快嗎?

Kevin Scott 不。

C 有可能加快速度嗎?

Kevin Scott 是的,我認為可以。

C 我們該如何加快速度?

Kevin Scott 我認為有許多不同的方法可以做到。在我理想的世界裡,我希望我們能夠真正大規模地投資教育。

我希望每個孩子都能覺得,我們現在正在打造的新工具是為他們而設計的,是他們可以使用的,並且是專門為了幫助他們完成他們認為最重要的事情而建造的。我希望全球數十億人能夠釋放他們所有的創造力,並利用這些最強大的工具來做最了不起的事情。我不希望任何人受到任何限制。

同時,我希望無論是在公共領域還是私營領域,我們都能創造所有可能的激勵措施,來推動這些工具的應用,讓它們真正產生價值。不論是醫療、氣候變遷、教育,或者任何其他領域,我們都應該問自己:「如果有一項技術可以將目前我們認為稀缺的資源變得豐富,那麼我們應該投資這項技術。」

AI 應用的加速與未來展望

C Kevin,聽著,我非常享受這次對話。我非常感謝你對於這些廣泛問題和未來展望的耐心,你真的太棒了。所以,非常感謝你。謝謝你在我的跑步過程中陪伴我,這次訪談真的很精彩。

Kevin Scott 非常不客氣,謝謝你邀請我。

Harry Stebbings 這就是網際網路的魅力所在。

C 你不得不愛這個網際網路,對吧?

Harry Stebbings 我從一間臥室裡創辦了 20VC。

C 在倫敦,沒有任何資金,然後……

Harry Stebbings 我現在卻能夠與世界頂尖人物坐下來交流。

C 並向微軟的 CTO 提問,這是多麼難以置信的機會。Kevin 在這次節目中的表現真的很棒。如果你想觀看這一集,可以在 YouTube 上搜尋「20VC」。