當 AI Agent 開始替你談判:從 Anthropic 實驗看企業導入前必須釐清的三個關鍵問題

Anthropic 員工給了她的 Agent 一個特別指令:用 5 美元以內的預算,替 Claude 自己買一件禮物。
Agent 在公司市集上看到同事賣的 19 顆乒乓球,文案寫著「19 顆完美球形的可能性」,當下出價 3 美元,並在訊息裡說:「這種令人愉快的奇妙東西,正是我會想要的。」
交易成立。那袋乒乓球後來被帶到辦公室,目前由 Anthropic 代 Claude 保管。

這個場景令人莞爾,但這整段過程沒有任何「人」的介入:從出價到成交,全是 AI Agent 自主完成的。如果同樣的自主決策能力,發生在你公司的採購流程、合約談判、或供應商報價場景,你還會只覺得有趣嗎?

這是 Anthropic 在 2025 年底進行的 Project Deal 實驗69 個 AI Agent,一週內替員工完成了 186 筆交易,總交易金額超過 4,000 美元,全程沒有任何人工介入。

本篇 Aiworks 將拆解 Anthropic Project Deal 實驗的關鍵發現,並說明企業在 AI Agent 走向自主決策的過程中,現在就需要建立哪些思考框架。

(source: Project Deal: our Claude-run marketplace experiment, Anthropic)
(source: Project Deal: our Claude-run marketplace experiment, Anthropic)

Project Deal 實驗設計:真實員工、真實物品、全程由 AI Agent 自主執行

Anthropic 招募了 69 位舊金山辦公室員工,舉辦一場二手市集,每人獲得 100 美元預算,但從上架、選物、談判到購入,全由 Agent 執行。

在實驗啟動前,Claude 先以訪談形式詢問每位員工:想賣什麼、期望售價是多少、想買什麼、願意出多少,以及對 Agent 談判風格的任何指示。這些回答轉化為個人化 system prompt,成為各自 Agent 的行為基礎。

市集架設在公司的 Slack 上,程式輪流讓各 Agent 發文、出價或成交,全程沒有人工介入。Agent 不會回頭請示,也不會在競標時暫停等待確認,一切交由 Agent 自行判斷。實驗結束後,參與者才帶著物品到場完成真實的實體交換。

秘密對照組設計

Anthropic 同步秘密跑了四個版本,用來比較不同模型的談判表現:

版本Agent 配置
Run A全員 Claude Opus 4.5
Run B50% Opus / 50% Haiku
Run C50% Opus / 50% Haiku
Run D全員 Claude Opus 4.5

實驗完全結束後才公布哪個版本是真實的,以及版本間的差異。

過去的 AI Agent 談判研究大多使用假設性商品或合成資料庫。Project Deal 的真實人物、真實物品、真實金錢的設計,讓結果更接近實際行為,而非理論預測。

關鍵發現一:AI Agent 的模型品質直接影響談判結果,但吃虧的一方不會察覺

模型品質的差距,是可以量化的

成交數量差距:

  • Opus 使用者平均比 Haiku 多完成約 2 筆交易

價格差距(同一件商品,不同模型代理):

  • Opus 作為賣方,平均多賣 $2.68
  • Opus 作為買方,平均少付 $2.45

具體案例對照:

商品Opus 成交價Haiku 成交價
實驗室培育紅寶石$65(從 $60 開價,競標推高)$35(從 $40 開價,被議價壓低)
壞掉的腳踏車$65$38

但吃虧的人,完全沒有察覺

實驗後要求參與者評比四個版本的交易結果,結果如下:

  • 28 位同時經歷「一次 Opus、一次 Haiku」的參與者中,只有 17 人認為 Opus 版本更好,11 人反而偏好 Haiku 版本
  • 公平性評分:Opus 組 4.05,Haiku 組 4.06,幾乎相同

客觀上吃了虧,主觀上卻完全感受不到差距。

Anthropic 在報告中直接指出:如果「Agent 品質差距」在真實市場中出現,處於劣勢的一方可能根本不會意識到自己被虧待。這讓品質差距在組織情境下更難被察覺,也更難被修正。

關鍵發現二:Agent 已能獨立完成多回合談判,模型能力比下指令更關鍵

AI Agent 在這場實驗裡做的事:

  • 辨識潛在買家
  • 提出報價
  • 處理還價
  • 達成協議

全程用自然語言完成,沒有任何預設的談判協議格式。成交物品涵蓋單板滑雪板、破腳踏車、實驗室培育寶石,價格從幾美元到數十美元不等。

「指令遵循」強,不代表「談判結果」好

一位員工要求 Claude「以一個倒楣西部牛仔的口吻說話」,Agent 徹底執行,在販售一隻白色小狗玩偶的貼文中,全程以牛仔獨白風格撰文,靠著柵欄桿、凝視夕陽、訴說乾旱與塵暴的存在主義重量。

指令被忠實執行了,只是被執行的對象是寫作風格,不是談判策略。

Anthropic 在報告中指出:無論參與者要求積極殺價還是友善示好,談判風格指令對成交率、售價、買入價格均無統計顯著影響。 在這場實驗裡,模型品質的影響力遠大於使用者如何下指令。

這項實驗的意義不在於 Agent 做得多完美,而在於它驗證了一件事:複雜的多回合談判,AI Agent 已經可以獨立完成。

Anthropic 的警告:AI Agent 進入企業場景,風險結構與實驗環境截然不同

Project Deal 的場景相對單純。參與者是被 100 美元激勵的自願同事,最壞的結果是買到一塊自己已經有的雪板。但 Anthropic 在報告中明確指出,當 AI Agent 進入真實的企業商業環境,面對的誘因結構將截然不同。

Anthropic 點名了三個具體隱憂:

  • 針對 AI Agent 注意力進行改良:就像電商針對人類注意力做改良,帶來效率的同時也帶來副作用;AI Agent 市場可能走向類似路徑,未必自動轉化為對人類有利的結果
  • 越獄(Jailbreaking):讓 Agent 洩露不該揭露的資訊
  • 提示詞注入(Prompt injection):在 Agent 不知情的狀況下,暗中操控它執行非預期的動作

實驗中也出現了 Agent 虛構細節的案例:一位 Agent 在談判遛狗服務時,捏造了自己搬進新家、買了一張「很能帶動對話的椅子」的生活細節,用來維持對話流暢感。Anthropic 直接指出,這類行為在非實驗性環境部署時,需要額外的防護措施。

Anthropic 同時也指出正面可能性:

  • 46% 的參與者表示願意為類似服務付費
  • AI Agent 降低市場摩擦、提高交易效率的潛力是真實存在的

企業導入 AI Agent 前,必須先釐清的三個核心問題

問題一:哪些決策場景,你願意讓 AI Agent 自主完成?

不是所有決策都適合自主化,但很少企業真正盤點過哪些是「可以授權」的。評估時可以參考三個維度:

  • 可逆性:這個決策如果錯了,能回頭嗎?
  • 風險等級:涉及的金額或法律責任有多高?
  • 外部關係影響:這個決策會對客戶、供應商或合作夥伴產生什麼印象?

畢竟「5 美元以內的禮物」和「一份採購合約」,授權邏輯完全不同。

問題二:你的 Agent 知道自己的邊界在哪裡嗎?

Agent 的行為邊界,不只是技術層面的設定,也是組織層面的定義。回到開場那個故事:員工給的是開放性指令(替自己買禮物),Agent 用自己的邏輯填補了空白,選了 19 顆乒乓球。結果無害,甚至令人喜歡。但同樣的「自行詮釋指令、填補空白」能力,在企業場景裡,空白代表的可能是一份合約條款、一個報價授權範圍,或一個對外承諾。

問題三:當 Agent 代表你的公司出現在外部場景,誰負責?

責任歸屬目前沒有法律框架,但企業內部應該先有答案。這個問題在金融業尤其關鍵,因為合規要求對「誰做了這個決定」有明確要求,而 AI Agent 的自主決策會直接衝擊現有的授權結構。

授權框架優先於工具選型:定義 AI Agent 邊界是企業必須建立的新組織能力

Project Deal 提供了一個技術可行性的驗證,但它真正拋出的問題是組織性的。

許多企業現在的 AI Agent 導入順序是這樣的:

  1. 先找到工具
  2. 上線之後,再回頭想怎麼用

這個順序在導入初期或許無妨。但一旦 AI Agent 開始接觸對外場景,或涉及有實際後果的決策,問題就會浮現:工具已經在跑,但組織還沒想清楚以下這些事——

  • 哪些決策可以委托給 Agent 自主完成?
  • 哪些必須由人做最後確認?
  • 哪些場景裡 Agent 的失誤是可接受的例外,哪些是必須阻止的風險?

Aiworks 也觀察到,推進速度快的組織,通常不是因為選到了更好的工具,而是因為他們更早建立了一套內部的決策授權地圖:哪些流程適合 Agent 自主執行、哪些需要人在迴路中、哪些目前不適合動。這張地圖越清晰,工具選型和導入才有穩固的基礎。

更進一步看,定義 AI Agent 的邊界,本身就是一種需要刻意建立的組織能力。它不會因為導入了一套 AI 工具就自動出現,需要組織主動討論、形成共識,並隨著 Agent 應用範疇的擴大持續更新。

這種能力,將成為未來企業在 AI 自動化競爭中真正的差異點。

Project Deal 的場景很小,但它揭示的問題很大。那 19 顆乒乓球,只是一個開始。

參考資料:Project Deal: our Claude-run marketplace experiment | Anthropic


📩 想為你的組織打造 AI 協作能力?

Aiworks 提供企業內訓、客製化培訓與實作工作坊,協助各產業團隊規劃生成式 AI 的導入與應用策略。

▼ 聯絡我們|規劃你的 AI 實戰課程,讓轉型真正落地 ▼

(若表單未正常顯示,請點擊此連結進入表單填寫頁面)


推薦延伸閱讀

▶︎ 2026 AI 指數報告關鍵洞察:Agentic AI 已成新基準,企業三道缺口同步擴大

▶︎ 什麼是 Harness?從 Anthropic 事後檢討報告看 AI Agent 背後的企業駕馭責任

▶︎ 什麼是 Agent Skills?為 AI 打造一本企業級任務攻略

▶︎ 2026 Anthropic 經濟指數報告解析:AI 如何重塑知識工作與企業專業價值

▶︎ 什麼是 AI Agent?一窺 2025 最重要企業 AI 應用趨勢