原文連結: Cursor CEO: Going Beyond Code, Superintelligent AI Agents, And Why Taste Still Matters
對我們而言,最終目標是用更好的東西取代程式設計。我認為這將是一個你的建構能力會被極大放大的十年。如果你比其他人更快地推進前沿,你就能獲得巨大的收益。創辦一家公司很困難,所以你不如去做你真正熱愛的事情。所以,是的,我們著手研究程式碼的未來。歡迎回到新一集的《How to Build the Future》,今天我邀請到 Michael Tru,他是 Anyphere 的共同創辦人暨執行長,Anyphere 就是我們都熟悉且喜愛的 AI 程式設計平台 Cursor 背後的公司。他們最近達到了 90 億美元的估值,是有史以來成長最快的新創公司之一,僅在推出後 20 個月就達到了一億美元的年度經常性收入 (ARR)。Michael,感謝你的參與。謝謝你的邀請,很高興來到這裡。
Cursor 的目標:發明新型態的程式設計
你曾說過 Cursor 的目標是實際發明一種新型態的程式設計,你只需要描述你想要什麼,它就能被建構出來。跟我談談這個。 是的,公司的目標是用比程式設計好得多的東西來取代它。我和我的三位共同創辦人長期以來都是程式設計師,這比任何其他身份都更能定義我們。吸引我們進入程式設計領域的是,你可以非常快速地建構事物,完成那些描述起來很簡單的事情。程式設計需要編輯數百萬行深奧的正規程式語言,需要投入大量勞動才能讓那些描述起來很簡單的東西實際出現在螢幕上。我們認為在未來 5 到 10 年內,有可能發明一種更高級別、更具生產力的方式來建構軟體,這仍然歸結於定義你希望軟體如何運作以及你希望軟體看起來如何。因此,我們 Cursor 的目標就是實現這一點,而我們實現這一目標的路徑是,在任何特定時間點,始終成為使用 AI 進行程式設計的最佳方式,然後演進這個過程,你知道,將其從常規程式設計演變成看起來非常不同的東西。
有些人會說,這就是我們今天擁有的,你大致描述你想要的,然後它就出來了。你會怎麼說?我們已經達到了嗎?你真正想去的地方有哪些步驟? 我們正看到事物真正開始改變的最初跡象。我想你們 YC 可能處於最前線,因為我認為在較小的程式碼庫中,由較少的人員群組開發軟體時,你最能感受到這種變化。在那裡,我們看到人們開始超越程式碼,提升到更高的抽象層次,直接要求代理人和 AI 為他們進行所有更改。在專業領域,我認為還有很長的路要走。我認為那種「憑感覺寫程式」或在不真正查看和理解程式碼的情況下進行程式設計的想法,實際上並不可行。有很多連鎖反應,你知道,如果你處理的是數百萬行程式碼,並且有數十或數百人在多年時間裡共同開發某個東西,目前你還無法真正避免思考程式碼。我們的主要重點是幫助專業程式設計師,幫助那些以建構軟體為生的人。在這些環境中,人們越來越多地使用 AI 進行程式設計。你知道,平均而言,我們看到人們使用 AI 撰寫 Cursor 中產生的程式碼行的 40% 到 50%。但這仍然是一個閱讀 AI 產出所有內容的過程。因此,對我們產品而言,一個需要跨越的重要鴻溝是達到一個境界,即我們不再僅僅是一個幫助你查看、閱讀、撰寫、理解程式碼的生產力工具,而是產出物本身發生了改變。我認為對於專業開發者來說,還有很長的路要走。
在你的腦海中,你是否將其視為不同的層級?顯然,新創公司是從零行程式碼開始的,所以這非常容易。你目前是否在追蹤某個點,例如,到了那個點,「憑感覺寫程式」就行不通了,事情就變得真實了? 「憑感覺寫程式」這種方式絕對不是我們推薦的,如果你希望程式碼能長期存在的話。我認為,當你是兩三個人、四個人的新創公司,並且你還在四處摸索,試圖弄清楚自己在做什麼時,軟體開發的一個特點是,程式碼通常只會存在幾個星期。
AI 在程式設計中的演進:從助手到代理人
目前我們正處於一個階段,AI 扮演著你的助手的角色。所以,人們使用 AI 進行程式設計的主要方式,要麼是將任務委派給 AI,說「去幫我做這件事,去幫我回答這個問題」,要麼是讓 AI 在你身後看著,並不時接管鍵盤,這就是所謂的 Tab 鍵自動完成形式。我認為未來 6 個月到一年的重點是讓這兩種方式的實用性都提升一個數量級。程式設計有時極具可預測性,當你只是看著某人的工作時,你能預料到他們接下來 10、15、20 分鐘的工作內容。所以 Tab 鍵自動完成形式可以走得很遠。而將任務委派給另一個人的代理人形式也可以走得很遠。然後,我認為一旦這些開始成熟,並且你知道,對於 25%、30% 的專業開發工作,你可以完全依賴這些端到端的流程而無需真正查看細節,那麼就會出現所有其他需要解決的問題,關於如何在現實世界中讓這些運作起來。
一種看待大型語言模型 (LLM) 的方式是,它們就像人類助手一樣與你互動。另一種看待 LLM 的方式是,它們是一種先進的編譯器或直譯器技術。如果我們是一個幫助人類將腦海中的想法轉化為螢幕上成果的工具,那麼讓使用者能夠控制最細微的細節將始終是有益的。這是我們面臨的產品挑戰之一,你應該始終能夠將某個東西移動幾個像素,你應該始終能夠編輯邏輯中非常具體的某些部分。我認為一個始終有用的使用者介面是將軟體的邏輯寫下來,然後你可以指向邏輯的各個部分並實際編輯它們。但是,如果我們能達到一個你不需要太關注程式碼的境界,那麼軟體邏輯的書面版本就必須變得更高級別。所以,是的,我們很期待,在你讓代理人運作起來之後,在你讓 Tab 鍵自動完成形式非常成熟之後,AI 是否真的會改變編寫和查看程式語言的意義。
AI 程式設計的瓶頸:上下文視窗與持續學習
這是上下文視窗的問題嗎?你知道,這似乎很合理,一旦你超過大約一百萬到兩百萬個 token——即使在我看來,過去 100 天我們才得到一個可用的兩百萬 token 長度——這是否自然而然地成為其中一個地方,一旦你的程式碼庫達到一定規模,你就必須使用 RAG (檢索增強生成),它具有不完整的上下文,然後它就無法做到人類程式設計師能做到的事情? 是的,我認為代理人要達到人類水平存在許多瓶頸。我認為其中之一是上下文視窗方面確實是一個問題。你知道,如果你有 1000 萬行程式碼,那可能就是 1 億個 token。讓模型能夠實際處理這麼多內容,使其具有成本效益,然後不僅僅是讓模型能夠物理上將其納入其權重,而且還要讓模型能夠有效地關注該上下文視窗,這都很棘手。我認為這是該領域需要努力解決的問題。
而且這不僅僅是程式碼庫的問題,它也是一個持續學習的問題,即了解組織的背景、過去嘗試過的事情以及你的同事是誰。而讓模型真正持續學習某種東西的問題,我認為這個領域仍然沒有很好的解決方案。人們一直懷疑,或者很多人一直懷疑,只要讓上下文視窗無限大,問題就能解決。我認為,訓練這些模型的機構缺乏真正優質的長上下文數據,所以我認為這將很棘手。但持續學習和長上下文絕對是達到超人水平的瓶頸。
這有點相關,但能夠在非常長的時間跨度內執行任務並持續取得進展。網路上流傳著一張令人驚嘆的圖表,顯示了過去一兩年 AI 在任務上取得進展的最長時間的進展情況,它已經從幾秒鐘增加到——我想我不知道這些數字是如何實際獲得的細節,但我認為有人聲稱一些最新的模型可以達到一個小時。
然後是不同模態的問題。要成為一名軟體工程師,你多少需要運行程式碼,然後把玩輸出結果。如果你不這樣做,那你就會是超乎常人的,那太瘋狂了。所以,電腦使用對於程式碼的未來將會很重要,能夠運行程式碼,能夠查看 DataDog 日誌並與人類使用的那些工具互動。我們將不得不面對許多已知的困難,以及許多未知的困難,在讓程式設計代理人達到超人水平的任務中。
然後,你知道,我想指出的一點,呼應一下上一個回答,即使你有一個可以與之交談的,在程式設計方面達到人類水平或更快更好,比人類程式設計師更強,你知道,相當於整個工程部門的技能,我認為僅僅透過一個文字框要求更改軟體的用戶介面是不精確的。所以即使在極限情況下,如果你關心人類能夠控制螢幕上顯示的內容,你也需要一種不同的方式讓他們互動。所以一個潛在的用戶介面是,程式語言演變成更高級別的東西。另一個可能是直接操作用戶介面,能夠指向螢幕上的東西說「哦,改變這個」,或者實際上自己調整數值。
是的,我的意思是,這似乎是一堆剛在幕後萌芽的事情,對吧?例如,這些模型似乎對美學沒有非常清晰的概念。所以,這個人類水平的設計師或許實際上需要,你知道,他們需要能夠真正看到。 是的,看到它們在美學方面的進步很有趣,我認為這實際上是一個關於我們如何繞過這些持續學習問題的有趣的具體例子。但我們的理解是,你教這些模型在美學等方面做得更好的方式,與教人類的方式不同。它是通過,你知道,基本上收集大量數據,對它們進行強化學習 (RL),這就是你教它完成那項任務的方式。那是一個足夠多的人關心的任務,所以你可以支付成本來完成所有這些,你可以進行訓練,並將其融入基礎模型中。這有點像是繞過持續學習問題的權宜之計。
未來軟體工程師的必備特質:品味
鑑於大家都在努力打造的這個未來,而你無疑是站在最前沿的領導者,你認為未來軟體工程師不可或缺的,或者說最核心的部分會是什麼? 我們認為有一件事是不可取代的,那就是品味。也就是定義你真正想打造什麼。人們通常在思考軟體的視覺方面時會想到這一點。我認為軟體的非視覺方面,關於邏輯如何運作,也存在品味成分。目前,程式設計的行為將你弄清楚你究竟希望事物如何運作——你用你編寫的邏輯真正定義了什麼產品,以及實現細節如何對應到實體電腦的高層次品味——捆綁在一起。但目前,許多程式設計更像是一種人類編譯,你大致知道你想要什麼,你可以告訴另一個人,但你必須非常詳細地向電腦說明,因為你必須用來向電腦描述事物的語言,對於常規程式設計來說,就是迴圈、條件判斷、變數和方法,你真的必須非常詳細地說明。所以我認為,那種人類編譯的步驟會越來越少,電腦將能夠填補空白,填補細節。但既然我們是一個幫助你實現事物、幫助你建構事物的工具,那種對於什麼對你想要建構的東西真正有用的品味,我認為永遠不會消失。
這很有道理。有句話說,好的人會幫助你達到某個標準,但真正偉大、真正精通的人,他們會達到一個你甚至看不到的標準。 是的,而那需要品味。你曾稱之為,人們需要成為邏輯設計師。就意圖驅動的程式設計而言,隨著這項技術越來越成熟,這意味著什麼?
AI 對軟體開發的深遠影響
隨著我們越來越接近一個程式設計可以被自動化並被更好的軟體建構方式所取代的世界,我認為會產生許多影響。我認為其中之一是,專業開發人員的生產力將會大幅提升。擁有上千人參與的軟體專案,以及百人參與的軟體專案,以及真正專業的軟體專案,其進展速度之慢令人難以置信。其中很多原因在於現有邏輯的重負讓你難以應付。當你在一個新的程式碼庫中,你可以從頭開始,你可以非常快速地完成事情。當你更改某些東西時,不會有一堆其他東西因此損壞而需要你修復。
我認為它的影響之一將是,下一個分散式訓練框架,或者下一個資料庫,或者下一個視覺設計工具,建構起來將會快得多。下一個 AI 模型,如果你和實驗室的人聊聊,他們很大程度上受限於工程能力。我認為所有這些都將大幅改善。
我認為,第二個次級效應將是,會出現更多利基軟體。我的第一份工作之一其實是在一家生物科技公司。那是一家由濕實驗室科學家組成的公司,他們正在開發治療疾病的藥物。我是他們聘請的第一位軟體工程師。他們產生了大量的化學物質,然後將這些化學物質進行生物實驗,之後他們需要一個讀取結果來判斷哪些化學物質值得進一步研究。為此,他們需要大量的內部軟體開發。令人驚訝的是,現有的現成工具非常糟糕。同時,想到這家軟體並非其核心競爭力的公司,卻必須去做僱用真正軟體工程團隊、培訓他們、讓他們進行內部產品開發這樣繁瑣的事情,也讓人覺得不可思議。對於像那家公司這樣的企業,未來將會有更多的選擇。數位空間的物理特性已經非常棒了,但我認為未來這將會更上一層樓。你希望在電腦上發生的事情,到時候就能輕易發生。
Cursor 的早期歲月與轉捩點
換個話題,我想聽聽 Cursor 早期的故事。你在 MIT 認識了你的共同創辦人 Swale、Arvid 和 Aman。這家公司始於 2022 年。是什麼讓你們聚在一起?你們什麼時候意識到這是一個可以共同打造真正宏大事業的團隊? 我想我們當時有很多年輕人的天真,當時可能並無根據。所以從一開始,我們就非常有野心。Cursor 其實是我們四個人一次雄心勃勃的創意發想練習的產物。我們都很早就接觸了程式設計,然後我們一些最早的工程專案實際上與 AI 有關。我們其中一人致力於提高機器人強化學習的數據效率,也就是快速教會機器人學習新任務,那是我們早期的 AI 專案之一。我們另一人則致力於打造一個 Google 的競爭對手,使用神經網路,試圖快速建構一個出色的網路搜尋引擎。其他人則在 AI 領域從事學術研究。
但在 2021 年有兩個時刻讓我們對創辦一家專注於 AI 的公司感到非常興奮。其中之一是使用了第一個真正以 AI 為核心的實用 AI 產品,而 GitHub Copilot 老實說就是那個讓我們深切感受到,現在用 AI 創造真正有用的東西是可能的時刻,我們不應該去實驗室裡,在學術實驗室裡研究這些東西,而是時候讓這些東西走向真實世界了。另一件讓我們非常興奮的事情是,看到 OpenAI 和其他地方發表的研究表明,存在一些非常可預測的自然法則,顯示如果你擴大數據規模和投入模型的運算能力,它們就會變得更好。所以這意味著即使我們想不出如何讓 AI 變得更好的點子,也還有幾個數量級的提升空間可以努力。
從一開始,我們就想選擇一個知識工作的領域,然後研究隨著 AI 越來越成熟,那個知識工作會變成什麼樣子。我們對一家公司的形態非常感興趣,你為那個知識工作領域打造一個產品,因為那能讓你做幾件事。第一,隨著底層技術越來越成熟,你可以演進做那件事的形式。第二,即使在當時,也很清楚你可能需要的不仅仅是擴大語言模型的規模,你知道,達到 GPDN (泛指 GPT-N) 的程度。而持續推進底層機器學習進展的一種方法是,獲取產品數據,了解人們喜歡哪些建議,不喜歡哪些建議,AI 仍然無法真正觸及的人類工作的難點是什麼。你只有在知識工作發生的那個「玻璃窗」之後才能得到這些。
所以最初,我們著手為一個我們其實不太了解的知識工作領域做這件事,那就是機械工程。我們為電腦輔助設計 (CAD) 開發了一個協作工具。所以我們在訓練 3D 自動完成模型,幫助那些在像 Solid Works 或 Fusion 360 這樣的軟體中進行零件 3D 建模的人,試圖預測他們接下來會對幾何形狀做的更改。這是一個有趣的問題,學術界也研究過,DeepMind 其實也做過一些。這些並非嚴格意義上的大型語言模型,你可以完全用 3D 方式處理,或者你可以做的是——我們曾研究過一段時間的一個方向——將其轉化為語言問題,你把某人在 CAD 系統中執行的步驟,轉化為方法呼叫。所以如果他們畫一個圓,你就把它變成一個方法呼叫,它就像一個方法呼叫的列表,不完全是程式設計,但看起來有點像。問題是,如果你要完全基於文本來做,你是在要求模型做一件非常棘手的事情,不僅要預測使用者接下來要做什麼,還要在大腦中模擬幾何形狀,因為 CAD 核心,也就是這些 CAD 應用程式底層的軟體,相當複雜,僅僅從使用者採取的一系列動作來看,很難想像出最終的樣子。這非常棘手。
但我們為此努力了一段時間。那裡有大量的數據工作要做,大量的數據抓取,因為公開網路上存在 CAD 數據,我們需要這些數據來讓模型越來越好。然後我們把那個擱置了,原因有幾個。一個是我們對機械工程的熱情遠不如對程式設計的熱情,我們都是程式設計師。另一個是我認為當時的科學技術還沒有為 3D 做好準備,預訓練模型在這方面還不夠好,數據也不多,網路上 CAD 模型的數據比程式碼少好幾個數量級。所以很難做出一個有用的模型,或者說當時很難為那個領域做出一個有用的模型。
你最終有沒有去和那些使用 CAD 的人或機械師以及類似的人坐下來談談? 我們做了大量的用戶訪談,我認為我們本可以做得更好。回想起來,當時我們可能有些年輕天真,每天每週都按小時計畫任務。回顧我們在那上面花的時間,我認為如果一開始就實際去一家僱用機械工程師的公司工作三個星期,去臥底,更好地了解情況,就像去應徵一份繪圖員的工作,那樣會非常有價值。我認為用這種方式取代數百次的用戶訪談會更有意義。
我想與此同時,你們也開始訓練自己的模型來做這件事,你們使用了強化學習 (RL),這非常有用,同時也學習了如何建立大型叢集來實際訓練這些模型。 是的,在那段摸索的時期,我們當時並不知道,但我們在那裡做的一些事情最終對我們很有用。那時做了很多行為複製,比較少強化學習,但你會觀察人類做得好的例子,然後訓練 AI 去做那些事情。但是,訓練數百億參數規模的大型語言模型,在當時並不是很多人在做的事情。儘管我們當時研發的產品和模型的最終成果並不是那麼有用,但那是一次大規模訓練模型和大規模推理的絕佳演練。無論是當時還是現在,訓練超過百億參數規模的大型語言模型、機器學習模型的人都不多。所以基礎設施的狀況非常非常早期。我們當時做的事情像是分叉 (forking) Megatron LM 或 Microsoft Deep Speed,然後把內部結構拆解出來,再部署到訓練上。即使在推理方面也是如此,在那段時期,我們大規模運行過幾樣東西。現在在 Cursor 中,我們每天在自己的推理系統上進行超過 5 億次的模型呼叫。而當時進行推理和訓練的一些經驗,對 Cursor 的體驗來說,無疑是非常寶貴的。
從 CAD 到程式設計的轉向
其中一件,我的意思是,非常勇敢但也極具先見之明的事情是,花點時間說,其實我們對 CAD 不夠了解,我們需要做點別的。從 CAD 訓練、CAD 模型,到意識到規模法則成立,這裡有一個我們可以深入的領域,然後你們意識到其實我們需要做點別的,這是一條直線嗎?實際上轉向到今天的樣子是怎樣的? 這並非一條直線。我們,身為程式設計師,受到像 Copilot 這樣的產品以及像早期 Codex 論文這樣的學術成果的啟發。我記得當時,為了向投資者證明他們應該投資我們瘋狂的 CAD 想法,我們做的一件事是粗略估算了第一個程式設計模型 Codex 的訓練成本。根據我們的計算,我記憶中它只花了大約 9 萬或 10 萬美元。這在當時讓投資者非常驚訝,並且在我們籌集足夠資金來推動 CAD 想法方面有所幫助,因為你必須立即開始訓練。所以我們一直都知道程式設計,一直對此感到興奮,一直對 AI 將如何改變程式設計感到興奮。我們對於進入那個領域工作有點猶豫,因為已經有太多人在做了。而且我們認為 Copilot 非常棒,而且當時還有數十家其他公司也在做類似的事情。
當我們決定擱置 CAD 時——這有點像是一個獨立的想法,當時科學技術還不太成熟,我們對那個領域也不是那麼熱衷——把我們拉回程式設計領域的是我們個人的興趣。而讓我們有信心繼續下去的原因是,第一,看到其他人在大約九個月的時間裡取得的進展,感覺比預期的要慢一些。第二,坐下來思考,如果我們真的堅持我們的信念,五年後所有的程式設計都將通過這些模型進行,程式設計的行為將會完全改變,而且你需要在那過程中實現許多產品層面和模型層面的飛躍。天花板非常非常高,而當時該領域的現有參與者似乎並沒有以一種完全不同類型的程式設計為目標,他們似乎沒有那樣的雄心,也沒有真正準備好去執行。那第一次的經驗教會我們,創辦一家公司很困難,所以你不如去做你真正熱愛的事情。所以,是的,我們著手研究程式設計的未來。
這聽起來格外有先見之明,Sam Altman 大概一年前坐在這張椅子上談到,如果你賭模型不會變得更聰明,那是不好的,你應該總是賭模型會變得更聰明。你知道,12、18、24 個月後,這一點變得越來越真實。而聽起來你甚至在他說這話的整整 12 個月前就已經下了這個賭注了。 我們當時有個說法,叫做「跟隨那條線」(follow the line)。你總是想跟隨那條線,並為那條線的走向做計畫。我的意思是,這呼應了規模法則,即這些東西只會越來越好。
經典的 Peter Thiel 主義是,你相信什麼是別人不相信的?而你相信這個,而且你是如此正確,這才讓你能夠到達趨勢將要發展到的地方。 是的,我想這是其中一件有幫助的事情。現在顯然它變得更流行了,但在當時,2022 年是一個瘋狂的、關鍵的一年。年初的時候,沒有人真正在談論 AI。我的意思是,GBD3 (應為 GPT-3) 在前一年發生了,Copilot 也發生了,Copilot 在 2021 年是測試版,然後可能在 2022 年正式發布。然後它開始興起。我們仍然記得所有那些發布,你知道,InstructGPT 讓 GPT-3 好了一點,它是基於指令的微調。然後是夏天的 DALL-E,我記得那是一個讓很多不關注這個領域的人開始多加關注的深刻時刻。但後來有了 Palm 和 Stable Diffusion,然後你開始接觸到 RHF (應為 RLHF),你開始接觸到 3.5 (GPT-3.5),這些模型在訓練成本沒有大幅增加的情況下變得好得多,這是一個有趣的發展。
聽說從 GPT-3(已經存在一段時間,並沒有給一些人留下深刻印象,但肯定不是像 ChatGPT 那樣的突破性時刻)到 ChatGPT,訓練成本只增加了大約 1%。 哦,我的天啊,那是因為對指令進行了微調,RLHF,還有一些其他的細節。
產品決策與 Cursor 的崛起
你還記得嗎?有沒有一些特定的功能或產品選擇,是因為你知道模型不僅會變得更聰明一點,而是會顯著變得更聰明,從而改變了特定的產品或路線圖,最終讓你勝出?因為你提到,當時肯定有大約十幾家其他相當優秀的公司也在這個領域。 我們早期做出的一個非顯而易見的產品決策,源於對更激進未來的興奮,那就是不開發擴充功能,而是開發一個編輯器。這在當時對人們來說並不顯而易見。是的,這源於一種想法,即所有程式設計都將通過這些模型進行,未來它看起來會非常不同,你需要一個控制使用者介面。這也源於我們知道的一些有趣的軼事。我們對建構 GitHub Copilot 第一個版本的內部情況略知一二。據我所知,建構 GitHub Copilot 的整個故事——我沒有第一手資料,所以有些細節可能不對——非常有趣。它始於一個非常「解決方案尋找問題」的階段,即對採用 GPT-3 並使其對程式設計師有用感興趣。我想這來自領導層,來自當時 GitHub 的執行長,他只是說我們需要做這件事,然後他派了一個精銳小組去研究。
是當時的 Matt Friedman 嗎? 是的,我的理解是來自 Matt。我想他們花了將近一年的時間在沙漠中徘徊,嘗試不同的產品創意。當然,這些人對 AI 的未來非常興奮,他們立刻想到,我們能不能在它成熟之前就自動化 PR 的意圖,或者類似的事情。他們為此努力了一段時間,然後決定那是不可能的。他們嘗試了所有其他古怪的產品創意,直到他們偶然發現了自動完成這個簡單的東西。但即使在他們讓自動完成運作起來之後,他們也需要在編輯器層面進行更改,他們無法完全作為一個擴充功能來實現,他們必須去修改 VS Code 的主線程式碼,並公開不同的編輯器 API,才能顯示那個幽靈文本。然後,據我所知,如果你需要為像幽靈文本自動完成這麼簡單的事情更改編輯器,這在組織上其實是很難做到的。我們知道我們將不得不做很多次,所以那是不言而喻的,我們為此受到了很多批評。我們最初是從頭開始建構自己的編輯器,顯然使用了大量開源技術,但並非基於 VS Code,有點像瀏覽器基於 Chromium 那樣。它更像是從頭開始建構瀏覽器的所有內部渲染。我們用那個版本發布了,然後我們轉而基於 VS Code。但是,編輯器這件事是不言而喻的。
Cursor 推出了,你們做出了一系列後來證明是正確的決定。你們什麼時候知道它會成功? 這花了一點時間。如果你還記得,最初大約有一年在荒野中摸索,你知道,致力於 Cursor 前身的某個東西,以及機械工程方面的事情。然後,在我們向公眾發布第一個版本之前,Cursor 的初始開發期相當短。我想從開始寫程式碼到第一個公開測試版發布,花了三個月。但隨後是一年時間在非常小的規模下公開迭代,當時我們還沒有抓住成功的關鍵。它在成長,但你知道,數字很小。在那時調整產品細節可能花了一年時間,才把所有細節都做好。然後,只有在 Cursor 推出 9 個月到一年,致力於底層產品,建立團隊,不僅僅是產品方面,還開始獲得 Cursor 背後客製化模型的第一個版本來驅動 Cursor 之後,事情才開始步入正軌。然後,成長開始加速。然後,是的,從那以後,我們就有點像騎虎難下了。如果我們要成功,未來還有很多事情需要我們繼續執行。我認為我們和許多平行領域的其他公司面臨的挑戰之一是,我們建立公司的速度必須非常快。我認為關於員工人數每年增長不超過 50% 的經驗法則,或者說鐵律,必須被打破。
衡量成功與團隊建設
嗯,有沒有像是「北極星指標」或你和你的共同創辦人一直在監控的東西,來判斷這是否有效?是每週的留存率、開啟率,還是什麼?這如何影響你們在特定一週的工作內容? 我們關注所有常規指標,像是留存率。對我們來說,我們關注的主要活躍度指標,或者說,是的,我們關注的主要頂層指標是營收。我們關注付費的重度使用者,衡量標準是你是否在一週七天中有四到五天使用 AI。這是我們試圖提高的數字。
為什麼是付費的? 我認為我們是一個服務專業人士的工具,而且我也認為,提供這個工具本身就有實際成本。所以我們關心你是否能升級到付費層級,那才是可持續發展的模式。付費的重度使用者,這就是我們關注的,你知道,不是日活躍用戶 (DAU) 或月活躍用戶 (MAU) 之類的,而是你是否每天都在工作中使用這個工具。這就是我們試圖提升的。
然後,一旦確定了這個指標,你們是否從這個指標反向推導?比如,我們知道我們想發展的用戶群體,然後他們想要什麼?或者什麼會阻止人們成為那樣的用戶? 我認為在很多領域,為自己打造產品是行不通的。但對我們來說,它確實有效,而且我認為這實際上 clarifying (澄清/明確化) 了,因為打造 AI 產品時的一個誘惑是為展示而優化。我們非常擔心為展示而優化,因為有了 AI,很容易就能拿出幾個例子,製作一個影片,看起來你就有了一個革命性的產品。然後我認為,從能夠產生那個看起來很棒的展示版本,到一個有用的 AI 產品之間,還有很長的路要走,你知道,還有很多工作要做,這意味著要調整速度、可靠性、智慧程度、產品體驗等方面。對我們來說,我們真正採取的行動主要是,我們重新載入編輯器。我們早期的產品開發流程非常實驗性,非常專注於我們理解的 Apple 那樣,非常專注於內部測試和可用的展示版本,也就是我們可以在編輯器內部立即開始使用的東西。然後我們會查看這些指標,以確保我們每週、每月都走在正確的道路上。
所以,你之前說,有時候你必須打破這些關於招聘的鐵律。你們什麼時候決定打破它?我的意思是,在達到某個營收目標之前,是不是只有共同創辦人和幾個人?你們是如何考慮踩油門的時機?是先輕輕試探,然後一旦明確達到目標,就全力踩下油門嗎? 在很長一段時間裡,都只有共同創辦人。然後是共同創辦人和幾個人,直到我們真正把事情調整好並開始起飛。
早期招聘與駭客精神的維持
最初的一些招聘對象是誰?我想是更多的工程師,但是你知道的。 我們為最初的招聘費盡心思。我認為,如果你想在幾年的時間尺度上快速發展,那麼在六個月的時間尺度上放慢腳步實際上非常有幫助。因為如果你真的把最初進入公司的 10 個人選對了,他們未來既能加速你的發展,因為當第 N 個考慮與你共事的人進來和團隊相處時,他們會被人才密度震驚,然後非常興奮地想在那裡工作。他們能幫助你未來更快發展的另一個原因是,如果有人進來卻不太合適,這些人會像免疫系統一樣抵制這種情況,他們會成為堅守高標準的守護者。所以我們一開始招聘非常非常緩慢。我們能夠做到這一點,部分原因也是因為我們有一個龐大的創始團隊,而且所有共同創辦人都是技術出身。但是,是的,我們招到的人非常出色,是公司今天的核心力量,他們是跨領域的人才。我們公司需要介於基礎模型實驗室和常規軟體公司之間,模型和產品必須在同一個屋簷下協同工作。所以我們有一些非常優秀的人,他們既有產品思維和商業頭腦,又實際大規模訓練過模型。
通才型博學家在最初的十人階段真的非常非常棒。 是的,並且能快速建構事物。是的,並且快速交付生產程式碼。
這些日子,我的意思是,每個人都在試圖弄清楚如何應對這個問題,但你知道,僅僅因為 AI 工具如此出色,有時甚至更難弄清楚如何評估優秀的工程師。隨著你們自己的產品變得越來越普遍,這對你們來說是否隨著時間的推移而改變?你們是選擇那些非常擅長使用 AI 工具的人,還是說,真的只是,你知道,讓我們堅持經典,任何人都可以學會如何使用 AI 工具? 在面試方面,我們實際上仍然在不允許應聘者使用 AI(自動完成除外)的情況下進行面試,用於我們的初步技術篩選。不使用 AI 進行程式設計仍然是一個非常好的、有時間限制的技能和智力測試,以及你總是希望團隊中的程式設計師擁有的那些特質。但另一個原因是,我們僱用了許多非常出色的程式設計師,他們實際上沒有使用 AI 工具的經驗,我們不想不公平地讓他們處於劣勢,因為這些工具非常有用。所以我們更願意僱用那些人,然後在工作中教他們使用這些東西,同時也從他們第一次使用工具的初學者心態中挖掘產品見解。
Cursor 現在價值 90 億美元,你們如何保持團隊擴張過程中的駭客精神?你現在還寫程式碼嗎? 我確實還寫。這是我們經常思考的問題,因為我認為未來的 Cursor 必須與今天的 Cursor 非常不同。第一,我認為你可以通過招聘合適的人來做到這一點。我們招聘流程的最後一步是為期兩天的現場考察,你來和我們一起做一個專案。這是在初步的技術篩選之後,你在辦公室裡,有點像團隊的一員,和我們一起吃飯,一起做點什麼,然後在結束時展示你的成果,我們會問你一些問題,這些問題能看出你的活力、興奮感以及對問題領域的熱情。通常情況下,如果你只是把這看作一份工作,並且同時在申請一堆科技公司,你可能不會那麼願意這樣做。所以我認為一個重要的方法是通過招聘流程吸引到充滿熱情的人。有些大型專案需要大量的人員協調,需要自上而下的統一。我認為我們始終希望成為一個也能進行大量自下而上實驗的地方。所以我們非常鼓勵這一點,既鼓勵人們利用業餘時間去做,也明確地將工程師團隊從公司其他部門中劃分出來,給他們充分的自主權去實驗他們想做的事情。
Cursor 的護城河與未來展望
我認為所有新創公司,或許現在所有的企業,甚至都在試圖弄清楚,面對世界上一些最令人印象深刻和難以置信的模型,哪些護城河才是真正持久和可用的。你們是如何思考這個問題的? 嗯,我認為我們所處的市場以及其他公司所處的市場,類似於你過去見過的那些實際上並非企業軟體市場的市場。所以我認為很多企業軟體市場的特點是,產品能提供的核心價值上限不高,而且有很多鎖定效應。而我們所處的市場則類似於 90 年代末的搜尋引擎市場,產品的天花板非常高,搜尋引擎在很長一段時間內都可以做得更好。對我們而言,最終目標是用更好的東西取代程式設計並自動化程式設計,我認為在這方面還有很長很長的路要走。
搜尋引擎市場的一個特點,我認為也是我們市場的一個特點是,用戶分佈對於改進產品非常有幫助。所以如果你有很多人使用你的東西,你有一個規模化的業務,你就能了解產品在哪裡出了問題,在哪裡做得好。所以在搜尋引擎領域,那就是看人們點擊了什麼,他們從什麼地方跳出了,什麼是好的搜尋結果,什麼是壞的搜尋結果,這些反饋會進入研發環節,幫助他們做出更好的搜尋引擎。對我們來說,就是看人們在哪裡接受了建議,在哪裡拒絕了建議,在他們接受建議然後稍後又更正的地方,發生了什麼,我們如何能做得更好。我認為這將是未來改進產品和底層模型的一個非常非常重要的驅動因素。
另一個可以借鑒的市場是 2000 年代初的消費電子產品市場。當時的關鍵是抓住 iPod 時刻,然後是 iPhone 時刻。我認為 ChatGPT 時刻有點像我們這個時代的 iPod 或 iPhone 時刻。如果你比其他人更快地推進前沿,你就能獲得巨大的收益。我認為在我們的領域還存在幾個這樣的時刻。所以這很難做到,但我們非常專注於努力成為最快衝向那些目標的人。
現在是 2025 年,我覺得我們實際上正處於這個智慧時代的開端,一場革命。你個人目前最興奮的是什麼? 我認為這將是一個你的建構能力會被極大放大的十年,無論是對那些以此為生、以此為業的人們,還是我認為它也將為更多的人所用。
真是個生逢其時的年代。感謝你今天的參與。 謝謝你,謝謝你的邀請。