原文連結: Ramp 如何解決 AI 代理策略中的致命缺陷 ft. Rahul Sengottuvelu

Rahul 在 Ramp 工作,今天他將與各位談談為何代理人會失敗,以及如何避免失敗。Rahul,告訴我們如何才能不失敗,如何才能成功。好的。那麼,首先,這場演講是為誰準備的?接著我們會談到 AI 代理人助理如何失敗。然後我們會討論它們為何失敗以及如何解決。 我只有一個核心觀點想要傳達。所以如果你跟著聽,你可能會領會到。

這場演講適合誰?

所以這場演講是為那些擁有通路的人準備的。也就是那些已經成功、擁有用戶和成熟軟體產品,並且這些產品是隨時間逐步建立起來的人。嗯,或許還有其他人,或者這裡的創業者正在向他們銷售產品,或者顯然地,正在嘗試投資那些創業者。 所以,真的是這裡的每一個人。

AI 代理人助理如何失敗

讓我們看一些成熟公司及其代理人的例子,對吧?它們並非真正的特例成功。我不會詳細說明為什麼每一個都不好。但這裡有一個非常普遍的例子,就像我們所有人都經歷過的一樣。就好比你問這個 AI 代理人助理:「嘿,幫我訂一張機票。」然後它最終幫你訂好了。 然後你試著做任何其他事情,它馬上就失敗了,導致一個非常令人沮喪的體驗。這種情況你一再看到。所以如果我在 Google Slides 裡問,然後你將投影片上所有文字加粗,它就像投影片 AI 一樣說:「抱歉,我做不到。」那你能做什麼?如果你問 Siri 你睡得如何,它會說:「抱歉,我無法幫上忙。」 你只是一再看到這些體驗,而這些都是市面上最大的軟體公司。所以或許我們應該思考一下原因,並且可能不要重複那些錯誤。

所以模式是,人們正在建構這些功能不完整、次等的體驗,這讓他們的用戶感到沮喪,而且似乎每個人都以同樣的方式失敗。

為什麼他們會失敗?

更深入地看,這就是他們的應用程式看起來的樣子,你的應用程式看起來的樣子。通常有一個前端,一個後端,這可能就是你對幕後情況的心智模型。但實際上,你的規模越大,歷史越悠久,你的應用程式就會變得非常複雜且非常廣泛。 因此,會有大量的 API 端點和功能,隨著時間的推移,它會變得非常水平化且相當混亂。所以這就是當你在上面建構工具時最終會發生的情況。所以你實際上被困在這條非常長的道路上,要與你現有的前端達成功能對等。 所以你正在慢慢地建構越來越多的工具,讓大型語言模型(LM)可以使用,以便為你的用戶做事。

所以最終發生的情況是,也許你給了 LM 一個訂機票的工具,但是更改座位的功能卻在功能開發路線圖的非常後面,很難向你的用戶溝通這點不被支援,以及確切的功能集合是什麼。讓這個問題更糟的是,實際上你擁有一支非常強大、精良的前端團隊、產品經理、設計師和使用者體驗人員,他們為人類建構了出色的前端體驗,而你的代理人團隊則像是附加在一旁,試圖追趕並建構相同的工具和每一個推出的新功能。所以,你一開始就已經遠遠落後了,而且你也比那些建構你主要產品的人慢得多或弱得多。

所以,這裡的每個人可能都同意,建構一個代理人前端可能非常容易。關鍵在於你給它什麼工具。所以,你也可以稱它為 MCP 或 ADA 或許多其他術語。但實際上,就像你擁有這些服務,它們很成功,你正在贏,並且你擁有所有這些通路。 你可能想要在你所有的功能之上(而不僅僅是其中一部分)建構一個工具呼叫介面,並將其盡可能多地暴露給代理人,因為代理人——我想 Harrison 稍後會談到代理人經濟——代理人在工作中會呼叫大量的工具,你越早擁有那些涵蓋你完整功能集的工具,你的處境就可能越好。 所以,別把這事搞砸了,對吧?但這也非常困難。

核心洞察:在前端進行自動化操作

所以,這就是核心的洞察。與其逐一檢視每個功能、每個端點,並在後端附加工具,你實際上想要在前端「讓電腦像你一樣操作自己」。所以在你讓別人「電腦操作」你之前,你可以自己「電腦操作」自己,或者你可以在你的前端之上建構啟發式方法和鷹架,讓這件事變得非常容易。

其他挑戰與前端解決方案的優勢

讓我們談談為什麼這件事非常困難的其他各種原因,對吧?這涉及到身份驗證。你希望給予代理人與用戶相同的對功能、文件和工具的存取權限。通常在企業軟體中,會有用戶角色和配置身份驗證。 這也非常令人沮喪且難以支援。如果你最終選擇在前端建構工具,你實際上是在利用所有前端設計師和產品經理的工作成果,而不是與之對抗。所以,不要重新發明輪子。

Ramp 如何實踐

我將向你展示這在 Ramp 中是如何運作的。所以,如果你要求 Ramp 助理更改你的卡片品牌,這實際上是我們產品中一個非常小眾的功能。如果我們只是用傳統方式建構,我們可能永遠不會將其作為工具添加到我們的代理人中。我們實際上最終建構了這個「電腦操作」代理人,它會在背景中使用該用戶的憑證啟動一個瀏覽器,載入頁面,然後導航前端。不過,用戶看不到這些。 用戶當然只看到代理人為他們完成了工作。嗯,透過這種方式,你實際上可以一次性支援你所有的工具,而不是逐一進行,並為用戶建構令人沮喪的體驗。

所以,你不僅擁有功能完整的代理人,你也最終簡化了「電腦操作」代理人的任務。所以,也許幾年後它會成功,也許再過一段時間,但如果你今天就開始使用它,它可能不會可靠。所以,如果你自己建構它,你最終會擁有自己的導航樹。你可以使用 DOM 啟發式方法來簡化,如果你有你的組件庫,你可以將其渲染成一個 CLI。你可以為不可靠的部分搭建鷹架,並專注於損壞的部分,而不是從一無所有開始。

如果你想談論細節,嗯,這是我的電子郵件。嗯,是的,這就是我們在 Ramp 的做法。[掌聲]