原文連結: 與 Anthropic 對話:AI 如何塑造新創公司的未來
與 Anthropic 對話:AI 如何塑造新創公司的未來
[音樂] 大家早安,歡迎來到嗯 Google Next 的第二天 嗯 我是 Francis Duza,Google Cloud 的首席營運長,我對今天早上的會議感到非常興奮。今天和我在一起的是 Matt Bell,他是 Anthropic 的產品研究副總裁。嗯 歡迎 Matt。謝謝你,很高興來到這裡,我很期待和大家聊天。太棒了,好吧,或許我們先從請你稍微介紹一下 Anthropic 開始,公司的使命以及你們在那裡主要關注什麼。
好的。Anthropic 成立的使命是創造強大且安全的大型語言模型。嗯,我們相信社會將在未來幾年內過渡到 AI 時代,這具有巨大的潛力可以增進人類福祉、加速研究、延長人類健康壽命、嗯,消除苦差事。所以創造強大的 AI 系統有巨大的潛在上行空間。嗯,但下行風險也很顯著,所以我們希望確保這種轉變以一種對全人類都安全且有益的方式發生。為此,我們從第一天開始就將可控性、可解釋性和安全性作為核心原則來設計我們的大型語言模型。
太好了。嗯,我想說我們正處於一個相當根本性的新時代的開端,這點並不誇張,你知道,嗯,大多數人相信 AI 將改變我們的生活方式、工作方式、娛樂方式,嗯,其中很大一部分將由新創公司驅動。所以,你知道,在 Google Cloud,我們非常關注新創社群,嗯,我們看到很多 AI 新創公司,也看到很多公司選擇 Google Cloud,你知道,為這些新創公司提供動力。事實上,我看到一個統計數據,你知道,90% 的生成式 AI 獨角獸企業都在 Google Cloud 上,60% 的生成式 AI 新創公司都在 Google Cloud 上。你知道,他們告訴我們選擇我們的其中一個原因,除了平台,嗯,以及我們創建的模型之外,是他們喜歡我們開放的事實,我們有一個模型花園 (Model Garden),並且我們允許新創公司訪問各種不同的模型。我知道很多新創公司對你們圍繞你們的模型 Claude 所做的工作非常感興趣,嗯,所以或許你可以和我們談談一些非常令人興奮的新創公司,像是嗯,像是 Replet,是如何在 Google Cloud 上使用你們的模型來為他們的兩千萬開發者提供服務的。
樂意之至。嗯,所以 Replet 是一個嗯,一個程式設計平台,它最初是作為一個適合行動裝置的程式設計入門平台,讓那些對軟體開發相對陌生的人能夠快速上手。在過去幾年中,他們非常側重於利用 AI 加速開發。所以他們現在有一個由 Claude 驅動、並在 Google Cloud 的 Vertex AI 上運行的系統,讓那些對軟體開發完全陌生的人能夠在幾分鐘內創建小型應用程式。嗯,他們也有加速資深開發者生產力的功能。所以基本上,無論你處於軟體開發旅程的哪個階段,你都能透過 Replet 加速你的工作。嗯,你知道,他們現在有兩千萬用戶,嗯,流量巨大,所以他們相當成功。而且 Replet 的 agent 功能,嗯,在它所提供的功能方面令人印象深刻。
舉另一個例子,有一家叫做 Augment Code 的公司,在 Vertex AI 上使用 Claude。嗯,Augment Code 的目標是擁有大型程式碼庫的專業開發者,基本上,嗯,他們得到一個 AI agent,能夠爬取並理解整個程式碼庫,然後根據開發者的要求進行複雜的多文件編輯。嗯,Anthropic 與 Augment Code 進行了一項研究,基本上發現,你知道,在一個案例中,一個公司預計需要幾個月才能完成的專案,使用 AI 加速軟體開發後,僅需幾週就能完成。另外,員工熟悉程式碼庫的時間從幾週縮短到了幾天。所以你可以想像,作為一個全新的開發者進入一個大型程式碼庫,嗯,你知道,通常會有一種不知所措的感覺,像是面對成百上千個文件需要快速掌握,而 Claude 能夠在幾分鐘內讀取所有這些文件,然後能夠引導開發者熟悉程式碼庫,並扮演一個,基本上是開發者的快速入門夥伴。
再舉第三個例子,嗯,有一家叫做 Brain Logic 的公司,創建了一個嗯,基於 WhatsApp 的購物助手,嗯,叫做 Zapia,它主要在拉丁美洲。嗯,他們在第一年就擁有了大約兩百五十萬用戶,這一切都是由在 Vertex AI 上的 Claude 提供支持,Claude 協助用戶處理他們的購物請求,幫助他們找到需要的產品,然後也為這些產品找到最優惠的價格。所以這是一個複雜的 agentic 系統,它與網路互動,同樣,完全由在 Vertex AI 上的 Claude 提供支持。
非常令人興奮。新創公司在使用 AI 時必須應對的挑戰之一,是關於安全性的整個問題。一方面,你知道,你創辦一家 AI 新創公司的原因,想必是你對世界的未來有一個大膽的願景,並且你在能力方面不斷突破界限。但同時,你必須確保你部署 AI 模型和應用程式的方式是安全的,而且安全性本身也正在被 AI 深刻地改變,無論是在攻擊端還是防禦端。所以,你知道,公司必須思考如何將安全性內建到他們的應用程式中,如何保護他們部署的模型,以及如何對未來可能對其模型構成的威脅保持前瞻性的思維。那麼 Anthropic 是如何平衡這種關係的呢?你們擁有最大膽的願景之一,並且從一開始就圍繞著對齊 (alignment) 和安全性建立了非常強烈的理念,你們是如何平衡這兩者的?
是的,很樂意談談這個。所以我認為這裡需要快速區分一下數據安全和模型安全。對於數據安全,你知道,我們選擇了透過 Vertex AI 與 GCP 合作,這樣你就能獲得所有來自 GCP 的卓越安全保障。嗯,基本上,嗯,我們永遠不會看到你的數據,而且,嗯,你知道,你可以在 GCP 基礎設施內完全運作。嗯,在模型安全方面,嗯,我們做了很多事情來確保 Claude 能夠負責任地處理你交給它的任務。嗯,打個比方,你可以把引入 Claude 到你的業務中,想像成雇佣了一整批員工來為你的公司做關鍵工作。同樣地,如果你引入一批員工,並信任這些員工處理你的客戶數據、與你的用戶進行客戶服務互動,你會希望確保這些員工能很好地代表你的公司,他們能負責任地處理資訊,他們不會洩露數據,而且他們不容易被惡意用戶欺騙或誤導。所以,你知道,你也希望模型具備所有這些能力。你知道,為此,我們認為模型能力和模型安全是相輔相成的,為了創建一個在,嗯,在你賦予它的任務中有用的模型,它需要能夠遵循指令,它需要能夠待在自己的領域內,做正確的事情,對你的數據負責。我們為 Claude 做的微調從第一天起就內建了這些能力,這樣你就可以相信模型會有較低的幻覺率,它相對能抵抗越獄 (jailbreaks),並且非常擅長遵循指示,嗯,基本上能很好地代表你的品牌。
好吧,讓我們稍微深入探討一下這個話題。根據你在 Anthropic 以及與你合作的公司所看到的,公司在建構應用程式時,從概念驗證到生產階段,應該遵循哪些技術和組織上的最佳實踐?
是的,我多次見過這個過程,而且在很多情況下都進行得相當順利。所以我想帶你了解一下哪些步驟,嗯,往往能帶來非常好的結果。嗯,所以我想說,首先要做的是選擇正確的問題來應用 AI。嗯,所以你會想要選擇一個真正的用戶問題或新功能的機會。嗯,在某些情況下,這是一個內部的痛點。所以你可能有一些昂貴的、嗯,繁瑣的,嗯,內部數據處理目前是由人工完成的。嗯,你可能有顯著的客戶支持負擔,像是類似的問題一再重複。任何相當繁瑣且,嗯,就像不是過於困難但需要正確完成,並且目前是由公司內部員工完成的事情,通常是使用 Claude 實現自動化的好目標。嗯,另外,在面向客戶方面,嗯,你可以做很多事情來,嗯,簡化用戶流程,並透過 LLM 介面提供更友好的用戶體驗。嗯,所以第一步,識別一個真正的問題,某個能帶來顯著成本節省,嗯,或顯著機會來轉變用戶體驗的事情。嗯,其次,你會想確保這從成本或收入的角度來看具有高影響力,以確保投入這個 AI 系統是值得的。嗯,接下來,你會想確保它符合模型當前的能力。嗯,所以模型能力一直是一個快速變化的目標,像是,你知道,兩年前、一年前甚至六個月前的模型,與今天的模型有顯著不同。因此,一年前成立的假設通常不再適用。嗯,為此,快速進行原型設計並嘗試你想要實現的功能是有意義的。如果你在幾天內獲得了相當不錯的性能,那麼你很有可能可以透過提示工程 (prompt engineering) 或 agent 編排 (agent orchestration) 來,嗯,將性能提升到你需要的水平。嗯,接下來,擁有評估 (eval) 非常重要。我們有時會看到客戶進行基於感覺的評估 (vibes based eval),他們玩一會兒,然後宣布它很好,這就像,這對於第一輪來說通常還不錯,當效果的躍升很明顯,你從無到有。但是當新模型出現,或者你想調整提示或添加新功能時,擁有一個量化的指標來讓你看到 Claude 在任務上的表現如何,就非常重要了。你知道,這些評估可以由人工評分,也可以自動評分,你可以使用很多不同的方法,但重要的是要有一個大家都同意的指標,嗯,你可以針對它進行迭代。因為基本上,有一個提示工程的過程,你在嘗試不同的方法,嘗試不同的模型,嘗試不同的工作流程,不同類型的 agent,你需要一種評分方式。基本上,如果你遵循這個過程,然後你有,嗯,良好的操作技術來監控模型在實際應用中的表現如何,它如何與用戶互動,嗯,如果是面向用戶的模型,用戶對它的滿意度如何,這將真正讓你走向成功。
太棒了,Matt。好吧,所以絕對不要基於感覺的評估,那是不行的。
它們在第一輪還可以,就像,基本上如果你的效果規模很大,你可以做粗糙的科學研究,但你應該盡快擺脫那個階段。
當然。所以或許讓我們把視角拉遠一點,試著把這個時刻放在歷史背景中來看。你知道,讓我著迷的是,在我們看到的所有科技大趨勢和所有發生的重大轉變中,感覺這次比我們以前見過的任何事情都發生得更快。生成式 AI 進入我們的意識中真的沒過多久。一年前,如果你在 Google Next,你會聽到很多公司在做試點,嗯,AI 試點,但很少有投入生產的。而現在一年後,我們有一些非常大的公司,你知道,Verizon 正在使用,嗯,我們的 CCAI 產品作為他們客服中心的一部分,嗯,實際處理即時通話,作為客戶的第一線。我們有 Toyota,他們在生產車間使用生成式 AI 模型,嗯,每年節省,你知道,超過一萬小時,嗯,在節省成本方面。所以我們很快地從,你知道,去年看到的試點,發展到許許多多的公司投入生產。我的意思是,Seattle Children's Hospital 使用生成式 AI 為腫瘤科醫生提供指南幫助。所以,你知道,我們開始思考,我們現在處於什麼位置,你知道,我們在這個生成式 AI 的時刻處於什麼位置。嗯,我來打個小廣告,你知道,我們 Google 實際上剛剛發布了《AI 的未來:來自新創公司的視角》,這份報告,嗯,你知道,嗯,實際上採訪了這個領域的一些關鍵意見領袖和思想領袖,試圖將我們所處的位置置於背景之中。那麼,基於此,或許我把問題交給你,來說說,你知道,你認為我們在這波 AI 大浪潮中處於什麼位置?你認為 AI 的下一個大事件會是什麼?
是的,所以我認為,就像摩爾定律 (Moore's law) 預測微處理器的能力已經有,我想大概 45 年了吧,嗯,縮放定律 (scaling laws),嗯,我相信關於它的論文是在 2020 或 2021 年發表的,在預測模型能力的持續改進方面做得非常好。嗯,我認為我們在接下來一年左右將看到的轉變是,agent 在更開放的領域中運作。嗯,所以人們在談論 agent 時,意思可能相當不同,很多被稱為 agent 的東西實際上是像這些緊密構建的工作流程,像是一個提示輸入到另一個提示,再輸入到下一個提示,這很好,像這種方法有很多優點。嗯,但隨著模型變得更強大,我們認為我們會看到更少的工作流程和更多開放式的 agent,它們能夠非常好地遵循指令,以至於你不需要那些工作流程,你可以簡單地給它問題描述,然後讓它去執行。我認為這最有影響力的地方在於,你可以從過去我們看到的更像是有限領域的,嗯,agent,比如說它可以訪問零到一個信息來源,轉變為 agent 被賦予,嗯,比如說 10 個不同企業 SaaS 服務的 API 金鑰,然後被要求執行一個涉及,你知道,從其中幾個讀取數據並向其中幾個寫入數據的任務。所以這開始看起來像是中等規模的任務,可能需要人類花費數小時來完成,並且,嗯,反映了員工,嗯,你知道,在日常工作中做的那種工作。所以我們認為我們會看到工作中更多繁瑣的方面開始外包給,嗯,AI 系統。這非常令人興奮,像是我認為幾乎每個工作,無論多麼光鮮亮麗,都有這個,嗯,顯著的苦差事成分,我們認為很多那樣的苦差事將會,嗯,得以被外包給 AI 系統。
嗯,看起來 agent 確實是個大主題,當然在會議中聽到了很多相關內容。嗯,你已經看到了,嗯,我們圍繞我們的 agent 開發者工具包和 agent space 所做的發布。嗯,我們也聽到了很多關於 agent 之間互操作性重要性的討論,對吧?以及正在出現的不同協議,以確保我們擁有那種互操作性。當你觀察你的客戶時,嗯,他們告訴你為什麼 agent 對他們很重要?他們在開發 agent 方面感到興奮的是什麼?
所以 agent 在任務靈活性方面非常棒。嗯,基本上,agent 能夠承擔那些完成任務所需的信息不一定在提示中已知的任務。因此,模型需要走出去獲取那些信息。嗯,或者另外,嗯,系統可能需要做出改變或採取行動,這些改變或行動太大而無法一次完成。所以你在程式設計 agent 中經常看到這種情況,嗯,基本上它會對幾個文件做一些更改,它會查看那些更改,它會決定做更多的更改,你知道,它可能會編寫一些單元測試並運行它們。所以這是那種,像是一年前用大型語言模型做這種事情是不可能的,嗯,但現在可以了。因此,這開啟了一整類以前不存在的任務。嗯,我們注意到的另一件事是,搜索 agent 已經變得非常強大。嗯,總的來說,我認為這些 AI 系統不是獨立存在的,而是像人類和 AI 之間的夥伴關係。幾乎就像這個半人馬 (centaur),一個人機混合體。你如何讓那個半人馬盡可能地,嗯,有能力?所以這讓我想到了人類相對於像 Claude 這樣的 LLM 的獨特優勢。一件真正突出的事情是,Claude 閱讀、回憶和綜合信息的能力遠超於我。所以 Claude 的閱讀速度比我快 100 倍,然後能提取相關事實,並以結構化的方式呈現給我,這種方式對於我正在做的任何任務都是最優的。所以,嗯,另一方面,人類更擅長長期規劃,更擅長策略,而且,嗯,仍然有更多的常識,像是我們通常能弄清楚什麼時候某件事是不相關的或超出範圍的。因此,當我們考慮讓 agent,嗯,盡可能有效時,我們不僅僅考慮 agent 的技能,還考慮 agent 和用戶之間的介面。
好吧,Matt,房間裡有很多創業者。嗯,即使對於大型企業來說,一方面每個人都能看到在那片開放空間中有多少可能性,那片空白地帶 (white space)。但另一方面,他們也看到了快速的進展,你知道,像 Claude 這樣的 LLM 在每次發布時其功能都在改進。所以,如果你要給一個創業者或一個希望開發 AI 應用的企業團隊提供建議,嗯,你會建議他們關注哪些方面,以便他們實際上在創造,你知道,價值,但不一定是在模型未來發展的路徑上?
是的,這很有趣。是的,這裡有這樣一個「滑向冰球將要去的地方」的方面,像是,如果你距離你的產品發布還有 6 到 12 個月,你會想要瞄準模型在 6 到 12 個月後將具備的能力。嗯,這需要特別敏捷,並進行大量實驗,來看看什麼是可能的,什麼是不可能的,以及什麼處於可能性的邊緣。因為總的來說,事情在它們變得,嗯,足夠穩健以供大規模企業採用之前大約一年,會處於可能性的邊緣。嗯,所以在新創建議方面,我會給,嗯,AI 原生 (AI native) 的新創公司與那些專注於不同領域並希望整合 AI 的新創公司不同的建議。嗯,對於 AI 原生的新創公司,你知道,很多歸結為找到一種方式,讓,嗯,AI 能夠成為驅動巨大價值的核心。因為基本上這些新創公司是把他們的整個生存都押注在模型的能力上,而不是僅僅使用模型來加速他們業務的某個方面或改善用戶體驗。可能我們看到的最成功的 AI 原生新創公司,要麼是在普及某個專業領域,例如,大多數人請不起律師,嗯,大多數人負擔不起與治療師的定期會面,但透過一個 AI 原生新創公司,以遠低於人類成本提供這些服務,嗯,他們能夠服務一個目前,嗯,該領域人類專家無法服務的市場。你知道,它不會像人類專家那麼好,但它將 7x24 小時可用,它會給出非常快速的答案,並且相比完全無法接觸到這位專家,它將提供顯著的價值提升。我想說,在另一方面,嗯,我們看到了很多成功的新創公司正在加速這些專家的工作。所以如果某人是,比如說,嗯,律師或,嗯,軟體工程師,嗯,或者說在網路安全領域工作,嗯,Claude 可以做大量的工作來,嗯,收集和綜合信息,以幫助那個人更快地完成任務。所以這兩類,像是普及專業知識的獲取,以及幫助專家更好更快地完成工作,透過創建這種人機混合體,嗯,這兩種模式都非常成功。嗯,所以那是 AI 原生新創公司。嗯,對於那些希望將 AI 整合到現有產品中的新創公司,我認為這歸結為我之前談到的,要麼是,嗯,你知道,降低內部成本或內部業務摩擦點,所以自動化,嗯,自動化工作流程,嗯,部分自動化客戶服務,嗯,或者是用戶體驗透過 AI 前端被轉變的情況。
太好了。如果我讓你現場回答,說出你認為最讓你興奮、希望看到新創公司出現的領域是哪些?你認為哪些領域會有最大的顛覆或創造最大的價值?
是的,所以我認為最大的領域之一將是充分利用,嗯,模型可以獲得的知識。所以模型擁有很棒的世界知識,你知道,你可以和它們談論伯羅奔尼撒戰爭或量子物理學,它們擁有像,你知道,非常詳細的百科全書式的知識。但模型的優劣取決於它們能獲取的知識。所以如果模型正在執行一個涉及大型私有知識庫的任務,例如,如果它正在為,嗯,訴訟律師進行法律證據搜集 (legal discovery),或者為風險投資家進行盡職調查 (due diligence),任何存在大型私有知識庫,其中包含用戶所需信息的情況,模型在,嗯,組織這些知識並利用它來執行任務方面可以做得很好。所以我們開始看到這種非常好的搜索 agent 和某些情況下的多 agent 系統的出現。我實際上認為搜索是多 agent 系統第一個實現大規模,嗯,產品市場契合 (product market fit) 的應用。你知道,所以我們看到市場上有一些系統,它們能夠,嗯,在幾分鐘內消化一個大型知識庫,並生成一份高質量的報告。我認為這是一種非常高槓桿的能力,目前只有少數新創公司在利用。
好吧。所以你找到了一個你感興趣的領域,這個類別有被 AI 顛覆的潛力。另一個大問題是,好吧,基礎模型正變得越來越強大,而且每個人都可以使用它們。透過,你知道,像我們這樣的工具和其他工具,構建 agent 變得越來越容易。那麼問題就變成了,好吧,作為一家新創公司,你如何創建一個競爭護城河 (competitive moat)?因為模型越來越強,構建 agent 越來越容易。嗯,你知道,你認為新創公司應該考慮哪些因素來創建他們的競爭護城河?
是的,所以我認為很多歷史上被指為是偉大競爭護城河的領域,仍然是偉大的競爭護城河。嗯,所以任何圍繞網絡效應 (network effects) 的東西,你知道,如果你有某種雙邊市場 (two-sided marketplace),嗯,或其他類似的模式,其中擁有一大群用戶會持續加強你的競爭優勢,那仍然非常有效。嗯,非常了解你的用戶仍然是一個極好的競爭護城河。你知道,我們看到那些真正知道如何應用 AI 來滿足其用戶群需求的新創公司持續表現良好。嗯,數據仍然是一個很棒的護城河。你知道,鑑於仍然存在這些巨大的私有數據池,使你能夠,嗯,根據用戶需求定制產品,你知道,那仍然是一個極好的護城河。
是的,我認為我們,我和很多新創公司交流,嗯,你知道,有幾個主題浮現出來。一個是,如果一家新創公司能夠接觸到專有數據集 (proprietary data sets),這可能是,你知道,透過與那些,你知道,有點老派但擁有這些私有數據集的公司合作,這是一個,你知道,強大的競爭優勢。我聽到的另一件很多的事情是,你知道,如果你有專有的分銷渠道 (proprietary distribution),如果你能以專有的方式接觸到一個客戶群體,正如你所說,那一向是一個好的競爭優勢,而且未來也將繼續是一個強大的競爭優勢。
所以,如果你正在基於專有數據進行構建,並且這是你競爭優勢的一部分,那麼新創公司應該如何思考保護那些敏感數據,並確保在使用那些敏感數據的同時,他們不會意外地將自己的專有敏感數據或客戶數據洩露到模型中?
是的,那是個很好的問題,而且當人們正在走向 agent 的世界時,這個問題實際上非常相關。嗯,所以有一些標準的數據安全最佳實踐仍然適用。嗯,你知道,無論你使用的是,你知道,傳統的軟體系統還是 LLM。嗯,圍繞 LLM 你可以做一些額外的事情。例如,在將數據提供給模型之前進行,嗯,數據匿名化 (data anonymization)。嗯,需要澄清的是,Anthropic 和 Google 從不對你的數據進行訓練,你的數據就是你的數據,而且有,你知道,零數據保留 (zero data retention) 等選項,你知道,這些都很有意義。嗯,但是當你開始進入模型是一個可以訪問許多不同系統的 agent 的情況時,嗯,數據匿名化就變得相當重要。嗯,如果你考慮一個與用戶交談、瀏覽網頁、可能向網站輸入數據,並且同時可以訪問專有系統的 agent,這一點尤其真實。你管理這些信息流就顯得尤為重要。因此,例如,在與用戶的客戶支持互動中,嗯,模型應該只擁有對該用戶數據的 API 訪問權限。你知道,在與該用戶交談時,你不希望給模型完全的權力去搜索任何東西。你知道,那是應用於 LLM 的標準數據安全。另外,你會想確保,嗯,如果模型也可以訪問網路,專有數據不會意外地被洩露出去。這就是,嗯,數據匿名化有意義的地方,或者有一個護欄 (guardrail) 來檢查任何流向網路的數據,以確保比如說專有代碼或,嗯,個人身份信息 (PII) 用戶信息不會洩露到網路。你知道,我們,嗯,在模型層面做了很多工作來確保,嗯,如果被指示,模型會在這方面做正確的事情。嗯,但是在應用程式層面擁有額外的安全性是很重要的,而且有很多架構可以,嗯,幫助確保額外的安全層級。
太好了。我們已經涵蓋了很多關於,你知道,給新創公司的建議,但,但或許我給你一個開放式問題,圍繞著我們已經談過的安全性,我們談過的對新創公司來說可能有趣的領域,你還有其他建議要給那些希望創辦 AI 新創公司的創業者或創業團隊嗎?
是的,所以我只想說,這是一個非常令人興奮的時刻。像我,我職業生涯的大部分時間都在創辦新創公司。嗯,之前我創建並經營了這家叫做 Matterport 的公司,它做物理空間的 3D 重建。所以我非常熟悉新創的旅程。你知道,Matterport 最終是成功的,但那是一個長達八年的艱苦奮鬥,才把這項技術推向市場並讓它被採用。我想說,與像是 2010 年代的世界相比,你現在可以行動得快得多。你知道,有了 AI 加速的程式設計,你可以在,你知道,幾個月或幾週內構建完整的應用程式。這在能夠保持敏捷,嗯,能夠進行大量實驗,嗯,以及,嗯,非常快速地迭代產品市場契合度方面,是令人興奮的。嗯,它也使你能夠透過大量利用 AI 作為你開發的一部分,用更少的資源來構建大型項目。嗯,此外,我們已經看到,嗯,你可以加速,嗯,其他類型的員工。嗯,所以,你知道,無論他們是營運、行銷還是業務開發人員,都可以使用 AI。所以每個人都可以更快地完成他們的工作。我認為那些懂得如何用 AI 加速其組織的新創公司會比那些不懂的做得好得多。所以這裡有很多層面的優勢,你現在可以利用。嗯,無論是內部,在你的公司營運方面,還是,嗯,在你的產品方面。嗯,這也是一個你有機會透過更了解你的用戶,以及更懂得如何在你的產品中使用 AI,來超越現有企業的事情。所以老實說,這是一個創辦新創公司極其令人興奮的時刻。
太棒了。我們已經談了很多關於現在正在發生的事情,有哪些機會,你知道,今天存在於新創公司面前。但現在讓我們看得更遠一點,你知道,在 3 到 5 年的時間框架內。你如何看待,而且,你知道,考慮到事情發展的速度,很難,嗯,想像。但你認為我們在 3 到 5 年後會在哪裡?會出現哪些大主題,嗯,將定義 AI 未來 3 到 5 年的走向?
是的,五年是很長的時間。我記得在大概 2020 年 1 月得到一個 GPT-2 的演示,而且,你知道,那與我們現在擁有的相去甚遠。嗯,所以預測那麼遠是有點困難。嗯,我認為我們將擁有更強大的 AI 系統,可以被賦予更通用的任務。所以我回到這個,這個整體問題,你如何最大化人機混合體的性能。我認為我們將開始看到人類員工變得更像是在一個 CEO 的角色,每個獨立的員工都有一整個由專業 AI agent 組成的團隊為他們工作。嗯,我也認為我們會看到組織,嗯,從根本上以不同的方式建立起來。所以打個比方,我像,我設想 1975 年的工作場所在組織和信息共享方面是截然不同的,像是你不能只是寫一個 Google 文件然後分享給你的同事,你你需要像是,你知道,用打字機打出來,然後拿到油印機那裡,複印一堆,然後親手遞送。我認為從像是 1975 年到比如說 2020 年的轉變,嗯,與從比如說 2020 年到 2030 年的轉變規模大致相同。鑑於 AI 系統在消化海量信息方面已經具備的超人能力,你知道,想像一下一個組織會是什麼樣子,當一個 AI 系統閱讀了公司幾乎所有的公開文件,知道每個員工做什麼,知道整個程式碼庫,知道所有的行銷活動,並且那個系統可以優化組織。所以我認為這是一件事,你知道,組織理論家談論像鄧巴數 (Dunbar's number) 這樣的事情,像是,哦,一旦你的組織超過 150 人,你就會失去信任,你會出現信息孤島 (siloing),你會出現,嗯,協調失敗 (coordination failures)。我認為很多那樣的問題會隨著強大的 AI 系統的出現而消失,這些系統可以幫助保持更大的群體有組織性。所以我認為這些是我預計在未來三到五年內會發生的一些大趨勢。
明白了。好吧,如果那是我們前進的方向,嗯,如果你看看人們今天在談論什麼,你認為什麼是今天討論中最被過度炒作 (overhyped) 的,什麼又是最被低估 (underhyped) 的?
有趣。嗯,我,嗯,我實際上要思考一下這個。嗯,我會說在被低估的方面,嗯,我認為,嗯,知識庫 (knowledge bases) 的高級應用是被低估的。因為再次強調,你知道,獲取,嗯,你知道,獲取更多信息會解鎖額外的能力。你知道,就我們內部開發來加速我們員工效率的事情而言,我感覺 70% 的成功僅僅是將 Claude 連接到員工用來完成工作的每一個新的信息來源。嗯,我認為 MCP (模型上下文協議,Model Context Protocol) 的一個方面是被低估的。嗯,所以給一點,嗯,背景知識,MCP,你可以把它看作一個低級標準,用來,嗯,標準化 LLM 與,嗯,任何類型的外部 API 或任何類型的工具對話的方式。MCP 的優點在於,你知道,實際上為一個複雜的 API 編寫工具描述,所以,你知道,假設你,嗯,正在連接到像是,嗯,Google Workspace API,要把它做好需要做大量工作。而現在開發者每次都必須自己弄清楚。MCP 創建了一個標準,據此,一家公司,無論是,你知道,Google 還是 Anthropic,只需編寫一次 MCP 伺服器,然後每個人都可以使用那個高質量的 API 來有效地與,嗯,Google Drive 互動。所以我認為 MCP 的完全下游影響是,每個標準的企業 SaaS 應用程式都將能夠被大型語言模型輕鬆訪問。所以我認為我們將看到人們給一個 agent 加載像是訪問 10 或 20 個不同的,嗯,MCP 伺服器,這將使模型能夠執行更複雜的任務,以及員工每天做的那種任務。而在被過度炒作的方面,我將,我將不得不思考一下。我,嗯,我通常對很多領域都非常樂觀。
是的,你說得對。我的意思是,很難想到什麼是被過度炒作的,因為我們面前將會發生如此根本性的轉變,幾乎每個領域,當然在企業方面,幾乎企業 IT 的每個領域都將以 AI,你知道,AI 優先的方式重做。所以你說得對,考慮到我們面前的巨大浪潮,很難思考是否有任何事情真的被過度炒作了,或者是否最終都會實現。嗯,我認為我們會看到,你知道,單人公司迅速壯大的時代。嗯,我認為,你知道,每個企業都將是 AI 優先的,我認為這就是事情將要發展的方式。
所以,嗯。好吧,那麼我想感謝你,這是一次引人入勝的對話。我真的很感激你抽出時間和我們在一起。我想感謝大家今天早上花時間和我們在一起。如果你想聽到關於 AI 未來以及這對新創公司意味著什麼的其他觀點,我想再次推薦這本剛剛出版的刊物。嗯,所以謝謝你,祝你今天過得愉快。謝謝你,Matt。