原文連結: AI 產品的迷霧:模型之外的策略與差異化難題

嗨,我是 Toni Karen Brown。

我是 Benedict Evans。我們終於在同一個時間、同一個地點,可以錄製一集節目了。

是的,時區對了,背後沒有一級方程式賽車引擎的聲音,沒有商務艙貴賓室。

說這話的人明天就要去摩納哥了。

嗯,對啊,我知道。去給一家大型生產力公司做簡報。這就是我大部分時間在做的事。

是的,讓我來解釋 AI。

AI 產品策略的困惑開端

所以,我們有一陣子沒做 podcast 了,我有點輾轉反側,思考著其中的一些問題。我也有段時間沒寫太多關於 AI 的文章了。我似乎覺得,我最感興趣也最擅長談論,或者說我覺得最適合談論的事情之一,就是去思考不同的產品,然後想,嗯,你可以看看 20 年前的 eBay 和 Amazon 和 Barnes & Noble 和 Walmart,或者你可以看看 iPhone 和 Android 和 BlackBerry 和 Windows Phone 和 Series 60 和 Mimo 和 Margo 以及所有當時發生的事情,然後去想,嗯,他們試圖做這個,這個產品試圖做這個,那個產品試圖做那個。它有這個問題、這個優勢和這個策略。你可以看看,你知道的,Facebook 和 MySpace 和 Instagram 和 TikTok,你可以看看,你可以思考產品策略。是的。以及建立在底層技術之上的產品。

而我現在看生成式 AI 的一個困惑是,一方面,我們有所有這些所謂的科學的東西。也就是說,有越來越多的模型,越來越多的模型,越來越多的模型,以及,你知道的,越來越多的縮寫和越來越多種級聯的複雜性。你看… 變得更好,變得更快。你看 Jensen Huang 做他那,你知道的,兩個小時、一個半小時的主題演講,然後有這個 NCP 那個紫外線。感覺有點像在看摩爾定律,但如果有 10 個 Intel 的話。就像,計算變得更快。我的意思是,顯然有一個完整的科學問題,關於它是否會持續變得更快,像是擴展問題。但就目前而言,更多的模型變得更快、更便宜、更商品化。但一方面是越來越多、越來越多的技術複雜性。

模型技術 vs. 產品應用:斷裂的兩端?

另一方面,看看 Y Combinator,90% 的新創公司基本上都在做 AI 即企業 SaaS。所以我們正在經歷像典型的平台轉移:這裡有這個新技術。這裡有數百家公司將嘗試用這個來解決大公司內部的一些問題,從 Excel、Salesforce、電子郵件、Oracle 等等中拆分出一些東西,解決一些點狀方案。所以我剛做了些關於這個的投影片,我的一張投影片是,嗯,有這家公司正在使用 LLM 來自動化重新配置複雜的電信計費系統。還有另一家正在使用 LLM 來讓將舊的大型主機代碼轉換為 Java 變得更容易。這些就像,那是 AI 公司嗎?或者那更像是一個,不完全是,它是別的東西。它是一家電信軟體公司。所以你看到一邊有所有這些 SaaS 活動在發生,另一邊有所有科學研究的東西,研究實驗室在發生。

聊天機器人:紫色閃光下的同質化

然後你還有一堆公司結構和融資活動在進行,你知道的,在這裡、那裡、到處都在募集數十億美元。然後就是那種聊天機器人,就像產品即產品,是給我們這些不是試圖將 COBOL 轉換成 Java 的其他人使用的。就像你得到一個 chat GPT,你去 Anthropic 等等。我和其他幾個人不久前指出,基本上 chat GPT 中唯一的用戶介面是一個下拉選單,上面寫著,你想用 01、01 mini、03、03 flash、03 flash Gemini 嗎?像什麼?就像這種模型描述的大雜燴。而我,你知道的,我整天都在看這些東西,我看著那個然後想,嗯,我怎麼會知道哪個問題最適合用這些模型中的哪一個來解決?

回過頭來看,讓我印象深刻的是,我的手機裡有一個叫做 AI 的資料夾,裡面有八、九個應用程式。它們之間有什麼區別?圖形設計。有些圖示是線條畫,有些圖示是像藍紫色漩渦。有些有扁平化 UI,有些有紫色閃光。而且大多數 AI 都有紫色閃光。就像是工會規定一樣,如果你有 AI,就必須有紫色閃光。

而且有時候,其中一個可以做出明顯更好的東西。所以像是,你知道的,chat GPT 推出了明顯更好的圖像生成功能,比 Midjourney 好得多,因為你可以要求它更改那張圖片,而不是像拉動提示老虎機的拉桿一樣,只得到不同的東西。這似乎是現在佔據很多頭條新聞的東西,就像是它更快、更好、更簡潔、更容易使用。但偶爾會有實質性的東西,你可以說這是不同的。OpenAI 最新的模型生成器與 Mid Journey 不同,因為它知道圖片是什麼。你可以說,在這上面加點東西,它就會把東西加到那張圖片上。

模型升級的體感:真有區別嗎?

就像我一兩個月前寫的,你拿到新模型,很難真正分辨出它為什麼更好,除非你有一些裝滿奇怪邏輯謎題的文字檔,你試試看,然後發現,哦,這個答對了,那個沒答對。幾年前,我想美國有一個週六晚間電視節目,深夜脫口秀主持人曾經做過一個橋段,他會上街做街訪,在新款 iPhone 剛上市後採訪人們。他會向他們展示新款 iPhone,然後說,這是新款 iPhone,很棒吧?他們會看著它說,哇,哇,這個好多了。當然,笑點在於他給他們看的是去年的 iPhone,因為沒有人真的能分辨出來。這就是拿到新模型的感覺。是的,隨著時間的推移,它們變得更快,現在比一年前好兩倍。

但我有點繞回來的重點是,一方面,你有所有的科學、模型建構,這基本上是商品化的。另一方面,你有人在建構個別的、非常具體的垂直軟體,你可以將其評估為垂直軟體。使用 LLM 來幫助你將 COBOL 轉換為 Java 會是一家好公司嗎?

核心難題:通用模型的差異化策略何在?

嗯,你需要問一個非常了解 COBOL 和 Java 的人,但這裡沒有更廣泛的問題。但很難說為什麼 Anthropic 會擊敗 ChatGPT?如果你試圖回答這個問題,那將會與非常非常深奧的科學方法有關,或者與募資有關。但這不會等同於說為什麼 Amazon 會擊敗 eBay?因為他們正在做一些根本不同的事情,會更好。或者他們有不同的營運模式,讓他們能夠做 eBay 做不到的事情。這不像看著 iPhone 和 Android 然後說,嗯,他們對於想做什麼以及如何建構產品有著根本不同的方法。作為消費者,這就是你為什麼會選擇那個,以及為什麼你會選擇另一個。這就是為什麼 Windows Phone 無法獲得任何開發者,因為 X 和 Y。很難把 Mistral 和 Meta AI 和 Anthropic 和 Gemini 放在一起說,啊哈,這個會贏,那個不會贏。並且去思考在這其中實際的產品策略會是什麼。

我會說,我們要聽聽評論並停止獨白了,但在我看來,我們之前談過這個。

公司策略 vs. 產品策略:Meta 與 Amazon 的佈局

你可以談論公司策略。Meta 試圖將 LLM 變成通用的商品基礎設施,以邊際成本出售,因為他們想在頂層的功能上進行差異化。而 Amazon 也有點想要這樣,因為他們以邊際成本出售通用的商品基礎設施。那是 AWS 的業務。然而 Microsoft 和 Amazon 有點不同的策略,因為他們也試圖讓它成為一個功能,而且他們不希望它是通用的。你可以繼續探討他們作為公司在建構模型方面試圖做什麼。但是你得到的模型是完全沒有差異化的,除了我說的,圖示是什麼顏色?這或許是一個具挑戰性、挑釁性的說法。是的,我肯定如果你每天都使用所有這些東西,你會說,哦,但是 Anthropic 在程式碼方面好得多,而 ChatGPT 在多階段推理方面好得多。嗯,是的,但是把這個交給街上的隨機一個人,說你想比較兩個抵押貸款。你會用哪一個?你怎麼會知道?

那你是在說... 你看著這個是在想,嗯,所有這些工具的產品策略是什麼?或者你看著這個是在想,在現在這個時代,我們是否應該用不同的方式來思考什麼是產品?相較於我們過去看待它的方式。

所以這是一個難題,我的意思是,我應該說 OpenAI 聘請了 Kevin Weil,而 Anthropic 聘請了 Mike Krieger,他們倆都... Mike Krieger 我的問題是,OpenAI 是一家科技公司還是一家品牌公司?

太對了。這永遠是,你知道的,就像不懂產品差異化的人對 Apple 的愚蠢批評。有一群人看著 Apple 說,嗯,它做不到我想做的事。因此,它是一個爛產品。然後人們只會因為被行銷手法欺騙了才會買。而那些不懂的人,就像,不,這是一個不同的主張。OpenAI,我為什麼要用 OpenAI 而不是 Anthropic、不是 Mistral、不是 DeepSea、不是 ChatGPT、不是 MetaAI?是因為其中一個產生了明顯更清晰、更顯著更好的結果嗎?是因為他們有更好的產品嗎?而且這也可能隨著你,你知道的,規劃而每週都在變化。

是的,完全正確。

嗯,這就是問題所在。所以,你知道,你去 LM Arena,現在 Gemini 2.5 是最好的模型,分數大概是多少?就像下一個最好的,Gemini 的分數大概是 1440,下一個最好的分數像是,Grok 是 1405,然後像是 ChatGPT 某某某是,無論他們現在是哪個版本,大概是 1404。就像,沒有消費者會去看那些東西。 所以你有這種,我的意思是,我想到的一件事,這可能有點刻薄,是這裡有點 Metaverse 的影子。

好,在哪方面?

嗯,在某種意義上…

因為你對 Metaverse 非常批判。

嗯,我批判的是那個詞。

好,包羅萬象。 因為我覺得我可以坐下來,我們可以坐下來談論 AR 和 VR。我可以談論遊戲。我可以談論社交網路。我可以談論加密貨幣和 NFT。這些都是有趣的對話。你知道,我對 NFT 沒有太多好感,但就像,你知道,有具體的、有形的技術和使用案例,以及你可能想做的事情的想法。但如果有人說 Metaverse,你根本不知道他們是什麼意思。他們是在說,他們的意思是你可以使用 NFT 在遊戲之間無縫轉移資產嗎?這對我來說沒什麼意義,但也許吧。他們的意思是每個人都會戴一副 AR 眼鏡嗎?他們的意思是別的什麼,而你不知道?

是啊,每個人對於那個 Metaverse 會是什麼樣子都有自己的視覺想像。

你根本不知道。你無法真正知道某人說 Metaverse 時是什麼意思。因為儘管,是的,理論上,像是 Bruce Sterling 或其他人在 30 年前的書中使用過它,但那不是,不,你不知道任何人在說它的時候是什麼意思。

我們現在有點處於這樣一個點,人們會說,你對 AI 有什麼看法?然後我想… 哪個部分?哪一方面?你在問我什麼?我的意思是,幾天前我跟一位政治記者談話,他說,嗯,我們難道不應該規範 AI 以確保它遵循我們的價值觀嗎?我舉了我配置電信計費系統的例子。你認為布魯塞爾需要通過一項法律,來確保那家幫助大型電信公司重新配置其計費系統以納入不同定價方案的公司,需要反映我們的民主價值觀嗎?就像,你在說什麼?那是什麼意思?如果你實際的意思是人們建立會決定誰能獲得假釋的系統,那好,那我們就來談談那個。

順帶一提,有趣的事實是,我收到了一份電子報,裡面有你和一位記者的那段交流,標題好像是,AI 法案批評者排隊等候。Benedict Evans。科技大師猛烈抨擊歐盟的… 我發給你。

哦,真的嗎?我還沒看到。

我現在正在看,但是科技大師猛烈抨擊歐盟的 AI 規則。有人發給我問,這是你的共同主持人嗎?我說,是的。

哦,這只是歐洲保護他們的東西。我認為這是一個特定的挑戰。他們的法規。這就是我的觀點,當你說 AI 時你指的是什麼?這裡正確的抽象層次是什麼?你應該談論規範 AI,還是應該談論我們不希望人們使用臉部辨識來決定誰可以進入會議廳,這不是一個 AI 問題,那是別的東西。

這裡就有這樣一種情況,就像,你在通用目的模型之間存在這種張力,圍繞著通用性,你如何區分?這真的是,我想,我正在摸索的是,對於一個其全部概念就是它能做所有事情的東西,擁有不同的產品策略到底意味著什麼?你如何擁有不同種類的「所有事情」?

品牌與行銷:AI 時代的決勝點?

這聽起來像是所有這些公司和所有這些產品都將不得不… 我們開玩笑說過這個,但這將會是一個巨大的行銷活動,關於你的受眾是誰?你的終端使用者是誰?我們如何將這個產品置於他們日常生活的中心?這如何讓他們的工作、他們的生活好上 10 倍?它如何變得有黏性?但這其中一部分是產品,但很大一部分也是行銷方面。

嗯,有一個行銷,我會說這裡有兩個稍微不同的事情。有一個行銷問題,像是,你如何去做?我最近和其中幾家公司的人談過,關於我們如何去告訴人們為什麼這個很棒,以及為什麼他們應該使用它?但我現在有點在想一個稍微獨立的點是,這與「我為什麼應該使用 ChatGPT 而不是 Anthropic」是不同的問題,因為其核心思想是,如果模型能做所有事情,那你怎麼能區分它呢?因為它們都會做所有事情。我的意思是,是的。

我的意思是,我唯一能想到的就像是,這很奇怪,但就像是速食連鎖店。你如何區分麥當勞和漢堡王和…

嗯,我會說,基本上,就像,我會說,你知道的,品牌廣告。這是廣告,嗯,你並不是真的試圖傳達關於產品的任何不同之處。

我正要說,這是情感銷售的方面。就像,Apple 一直做得很好,就像,你想要成為一個 Apple 使用者,你就,你知道,Adji 有…

是的,除了 Apple 實際上,有一些有形的方式讓它與眾不同,這反映在它的品牌中。而且,你知道,我很久以前在一家品牌公司工作過。你會認為每個人都會爭辯,但是,是的,我們的產品在某方面是不同的。或者你是在說,對於現在這些工具來說,要說你的產品是不同的,幾乎是不可能的?

我會說這裡有一個終點,就是看看像啤酒廣告這樣的東西。好的。那裡真的沒有任何,你知道,味道上有差異,但真的沒有區別。這是個人選擇。或者像某些汽車廣告,你廣告的是都市代步車。它們基本上,它們之間沒有有意義的區別。它們都非常可靠。它們都有相同的門和相同的行李空間。這純粹是,你知道,你展示廣告,或者像是,你知道,洗衣粉。

高檔珠寶手錶。

洗衣精。就像是個人的,這是某種,是的。所以挑戰,難題是,模型都在變得更好,但它們都以完全相同的方式、完全相同的速度變得更好。而哪一個嚴格來說在排行榜頂端,部分取決於是哪個排行榜。所以你看的是圖像生成、程式設計還是講故事之類的?但總的來說,它們是 A,商品,B,夢想是模型能做所有事情。那麼,當整個論點是它能做所有事情時,你如何區分一個商品?就像我們的這個能做所有事情,跟那個能做所有事情的不同。嗯,那會是什麼意思?

所以這就讓你想到品牌和行銷的故事。或者當然,這也讓你想到誰募集了最多的錢,能夠繼續建構這種風格的故事。這裡有個問題要問你。你認為所有這些公司在行銷自己方面做得好嗎?或者你認為他們過於專注在產品上?

嗯,所以,你知道,Sam Altman 他整天在做什麼,花時間做什麼?你知道,我有時覺得他大部分時間都在遊說、談話和推廣 OpenAI。他在做什麼?他做的很多事情是與政策制定者和意見領袖交談。讓他們首先想到你。並試圖定位你對這家公司的感覺。Dario Amodi,如果我發音沒錯的話,你知道,他的公眾形象,他走出去試圖傳達的訊息是什麼。Meta 和 Google 走出去試圖傳達的訊息是什麼?可能相當,他們目前對此沒有那麼清晰的公開故事。顯然,Meta 對工程師有一個強大的開源故事。它不一定對其他人有強烈的,所謂的,AI 故事。Apple 顯然把 Apple Intelligence 放在了各處的廣告看板上,並有一套連貫的、個別的、具體的功能。然後,當然,最重要的那個沒能推出。但你有這個,就像我說的,現在我有點在重複自己了。終局是什麼,價值捕獲點在哪裡,市場結構會是什麼樣子,都非常不清楚。如果我們達到一個市場結構,其中你有可以做任何事情的模型,並且有半打這樣的模型,它們將如何相互競爭?其中一個將如何從(對手)那裡獲取更多市場佔有率?

除了價格和品牌之外,他們其中一家要如何從其他家手中奪取更多市場佔有率呢?如果你投資這些東西,這聽起來並不是一個特別令人鼓舞的故事。

Jevons Paradox 的警示:流量不等於利潤

我的意思是,我有一個… 你還記得我在 20… 我想是 2023 年,也許,肯定是 2024 年寫過關於 Jevons Paradox 的文章嗎?

然後今年稍早 Satya Nadella 看到 deep-seek 時說,是的,但是 Jevons Paradox 意味著如果某樣東西變得更便宜,人們會用得更多,而不是更少。我看著那個然後想,去跟電信公司投資者或航空公司投資者說這話吧。所以我做了一張圖表,是 2010 年以來的電信行動數據量,根據 Ericsson 的數據,大約增加了 10 萬倍,以及 2010 年以來的電信公司股票。

我不用說太多,大家也知道它們並沒有上漲 10 萬倍。自 2010 年以來,它們基本上是持平的。

關聯性並不太吻合。

僅僅因為你讓某樣東西變得便宜得多,人們可能會在某種程度上使用得更多。雖然有趣的是,現在關於行動數據流量是否實際上正在放緩存在爭議。但這並不意味著你就能為此收取更多費用。

這就像是那個比喻,可能是因為你建造了它,人們就會來。你仍然需要把它呈現在人們面前。

嗯,你建造了它,人們來了,但那不代表你能從中賺到任何錢。我的意思是,這就是過去 20 年電信公司的故事。是啊,但我不知道這是不是重點。

電信公司,這就是過去 20 年電信公司的故事:5G 網路是這些令人難以置信的驚人事物,它們改變了我們的生活,我們每天都在使用它們。猜猜電信公司從中賺了多少錢,根本沒有。

這是另一個問題,像是他們要如何賺錢,這是另一個問題。

是啊,但我明天要搭飛機從倫敦出發,然後他們會在摩納哥結束行程,然後大概三天後再回來。所以在宏偉的計畫中,這並沒有多少錢。這很驚人。

是啊。航空公司從中賺到錢了嗎?並沒有。

這是現代基礎設施。那你該怎麼做?你在商務艙上做差異化。

行銷公司附帶實驗室?對 AI 巨頭的辛辣提問

是啊。我喜歡你前幾天描述它的方式,而且我認為這是總結它的好方法,就是這一切聽起來像是一家很棒的行銷公司,附帶一個實驗室。

這是對 OpenAI 不公平的描述。

我知道。我正想說這有點悲觀,但是…

他們就在那裡,有 10,000 名工程師在做著令人難以置信的酷炫、性感、令人興奮的事情,但錢從哪裡來?

然後你看著它然後想,哦,這是一家不錯的行銷公司。

是啊,這是一家附帶實驗室的行銷公司。

我喜歡這個說法。

就像我說的,這是一種挑釁、憤世嫉俗且不公平的描述方式,但它也是一個值得提出的有用問題。如果這些東西基本上都是商品,做著基本上相同的事情,價值捕獲點在哪裡?

而且沒有差異化,完全正確。所以你必須用不同的方式來看待它。你必須從不同的角度或用不同的方式來看待它。

我喜歡這個想法。