當 AI Agent 開始替你談判：從 Anthropic 實驗看企業導入前必須釐清的三個關鍵問題

2026 年 4 月 28 日

Anthropic 員工給了她的 Agent 一個特別指令：用 5 美元以內的預算，替 Claude 自己買一件禮物。
Agent 在公司市集上看到同事賣的 19 顆乒乓球，文案寫著「19 顆完美球形的可能性」，當下出價 3 美元，並在訊息裡說：「這種令人愉快的奇妙東西，正是我會想要的。」
交易成立。那袋乒乓球後來被帶到辦公室，目前由 Anthropic 代 Claude 保管。

這個場景令人莞爾，但這整段過程沒有任何「人」的介入：從出價到成交，全是 AI Agent 自主完成的。如果同樣的自主決策能力，發生在你公司的採購流程、合約談判、或供應商報價場景，你還會只覺得有趣嗎？

這是 Anthropic 在 2025 年底進行的 Project Deal 實驗。69 個 AI Agent，一週內替員工完成了 186 筆交易，總交易金額超過 4,000 美元，全程沒有任何人工介入。

本篇 Aiworks 將拆解 Anthropic Project Deal 實驗的關鍵發現，並說明企業在 AI Agent 走向自主決策的過程中，現在就需要建立哪些思考框架。

(source: Project Deal: our Claude-run marketplace experiment, Anthropic)

Project Deal 實驗設計：真實員工、真實物品、全程由 AI Agent 自主執行

Anthropic 招募了 69 位舊金山辦公室員工，舉辦一場二手市集，每人獲得 100 美元預算，但從上架、選物、談判到購入，全由 Agent 執行。

在實驗啟動前，Claude 先以訪談形式詢問每位員工：想賣什麼、期望售價是多少、想買什麼、願意出多少，以及對 Agent 談判風格的任何指示。這些回答轉化為個人化 system prompt，成為各自 Agent 的行為基礎。

市集架設在公司的 Slack 上，程式輪流讓各 Agent 發文、出價或成交，全程沒有人工介入。Agent 不會回頭請示，也不會在競標時暫停等待確認，一切交由 Agent 自行判斷。實驗結束後，參與者才帶著物品到場完成真實的實體交換。

秘密對照組設計

Anthropic 同步秘密跑了四個版本，用來比較不同模型的談判表現：

版本	Agent 配置
Run A	全員 Claude Opus 4.5
Run B	50% Opus / 50% Haiku
Run C	50% Opus / 50% Haiku
Run D	全員 Claude Opus 4.5

實驗完全結束後才公布哪個版本是真實的，以及版本間的差異。

過去的 AI Agent 談判研究大多使用假設性商品或合成資料庫。Project Deal 的真實人物、真實物品、真實金錢的設計，讓結果更接近實際行為，而非理論預測。

關鍵發現一：AI Agent 的模型品質直接影響談判結果，但吃虧的一方不會察覺

模型品質的差距，是可以量化的

成交數量差距：

Opus 使用者平均比 Haiku 多完成約 2 筆交易

價格差距（同一件商品，不同模型代理）：

Opus 作為賣方，平均多賣 $2.68
Opus 作為買方，平均少付 $2.45

具體案例對照：

商品	Opus 成交價	Haiku 成交價
實驗室培育紅寶石	$65（從 $60 開價，競標推高）	$35（從 $40 開價，被議價壓低）
壞掉的腳踏車	$65	$38

但吃虧的人，完全沒有察覺

實驗後要求參與者評比四個版本的交易結果，結果如下：

28 位同時經歷「一次 Opus、一次 Haiku」的參與者中，只有 17 人認為 Opus 版本更好，11 人反而偏好 Haiku 版本
公平性評分：Opus 組 4.05，Haiku 組 4.06，幾乎相同

客觀上吃了虧，主觀上卻完全感受不到差距。

Anthropic 在報告中直接指出：如果「Agent 品質差距」在真實市場中出現，處於劣勢的一方可能根本不會意識到自己被虧待。這讓品質差距在組織情境下更難被察覺，也更難被修正。

關鍵發現二：Agent 已能獨立完成多回合談判，模型能力比下指令更關鍵

AI Agent 在這場實驗裡做的事：

辨識潛在買家
提出報價
處理還價
達成協議

全程用自然語言完成，沒有任何預設的談判協議格式。成交物品涵蓋單板滑雪板、破腳踏車、實驗室培育寶石，價格從幾美元到數十美元不等。

「指令遵循」強，不代表「談判結果」好

一位員工要求 Claude「以一個倒楣西部牛仔的口吻說話」，Agent 徹底執行，在販售一隻白色小狗玩偶的貼文中，全程以牛仔獨白風格撰文，靠著柵欄桿、凝視夕陽、訴說乾旱與塵暴的存在主義重量。

指令被忠實執行了，只是被執行的對象是寫作風格，不是談判策略。

Anthropic 在報告中指出：無論參與者要求積極殺價還是友善示好，談判風格指令對成交率、售價、買入價格均無統計顯著影響。 在這場實驗裡，模型品質的影響力遠大於使用者如何下指令。

這項實驗的意義不在於 Agent 做得多完美，而在於它驗證了一件事：複雜的多回合談判，AI Agent 已經可以獨立完成。

Anthropic 的警告：AI Agent 進入企業場景，風險結構與實驗環境截然不同

Project Deal 的場景相對單純。參與者是被 100 美元激勵的自願同事，最壞的結果是買到一塊自己已經有的雪板。但 Anthropic 在報告中明確指出，當 AI Agent 進入真實的企業商業環境，面對的誘因結構將截然不同。

Anthropic 點名了三個具體隱憂：

針對 AI Agent 注意力進行改良：就像電商針對人類注意力做改良，帶來效率的同時也帶來副作用；AI Agent 市場可能走向類似路徑，未必自動轉化為對人類有利的結果
越獄（Jailbreaking）：讓 Agent 洩露不該揭露的資訊
提示詞注入（Prompt injection）：在 Agent 不知情的狀況下，暗中操控它執行非預期的動作

實驗中也出現了 Agent 虛構細節的案例：一位 Agent 在談判遛狗服務時，捏造了自己搬進新家、買了一張「很能帶動對話的椅子」的生活細節，用來維持對話流暢感。Anthropic 直接指出，這類行為在非實驗性環境部署時，需要額外的防護措施。

Anthropic 同時也指出正面可能性：

46% 的參與者表示願意為類似服務付費
AI Agent 降低市場摩擦、提高交易效率的潛力是真實存在的

“The policy and legal frameworks around AI models that transact on our behalf simply don’t exist yet. But this experiment shows that such a world is plausible. More than that, it shows that such a world isn’t far away. Society will need to move quickly to reckon with these changes.”

「對應的政策與法律框架目前完全不存在。但這場實驗證明，這樣的世界是可行的，而且距離現實並不遠。社會需要迅速行動，正視這些即將到來的變化。」

企業導入 AI Agent 前，必須先釐清的三個核心問題

問題一：哪些決策場景，你願意讓 AI Agent 自主完成？

不是所有決策都適合自主化，但很少企業真正盤點過哪些是「可以授權」的。評估時可以參考三個維度：

可逆性：這個決策如果錯了，能回頭嗎？
風險等級：涉及的金額或法律責任有多高？
外部關係影響：這個決策會對客戶、供應商或合作夥伴產生什麼印象？

畢竟「5 美元以內的禮物」和「一份採購合約」，授權邏輯完全不同。

問題二：你的 Agent 知道自己的邊界在哪裡嗎？

Agent 的行為邊界，不只是技術層面的設定，也是組織層面的定義。回到開場那個故事：員工給的是開放性指令（替自己買禮物），Agent 用自己的邏輯填補了空白，選了 19 顆乒乓球。結果無害，甚至令人喜歡。但同樣的「自行詮釋指令、填補空白」能力，在企業場景裡，空白代表的可能是一份合約條款、一個報價授權範圍，或一個對外承諾。

問題三：當 Agent 代表你的公司出現在外部場景，誰負責？

責任歸屬目前沒有法律框架，但企業內部應該先有答案。這個問題在金融業尤其關鍵，因為合規要求對「誰做了這個決定」有明確要求，而 AI Agent 的自主決策會直接衝擊現有的授權結構。

授權框架優先於工具選型：定義 AI Agent 邊界是企業必須建立的新組織能力

Project Deal 提供了一個技術可行性的驗證，但它真正拋出的問題是組織性的。

許多企業現在的 AI Agent 導入順序是這樣的：

先找到工具
上線之後，再回頭想怎麼用

這個順序在導入初期或許無妨。但一旦 AI Agent 開始接觸對外場景，或涉及有實際後果的決策，問題就會浮現：工具已經在跑，但組織還沒想清楚以下這些事——

哪些決策可以委托給 Agent 自主完成？
哪些必須由人做最後確認？
哪些場景裡 Agent 的失誤是可接受的例外，哪些是必須阻止的風險？

Aiworks 也觀察到，推進速度快的組織，通常不是因為選到了更好的工具，而是因為他們更早建立了一套內部的決策授權地圖：哪些流程適合 Agent 自主執行、哪些需要人在迴路中、哪些目前不適合動。這張地圖越清晰，工具選型和導入才有穩固的基礎。

更進一步看，定義 AI Agent 的邊界，本身就是一種需要刻意建立的組織能力。它不會因為導入了一套 AI 工具就自動出現，需要組織主動討論、形成共識，並隨著 Agent 應用範疇的擴大持續更新。

這種能力，將成為未來企業在 AI 自動化競爭中真正的差異點。

Project Deal 的場景很小，但它揭示的問題很大。那 19 顆乒乓球，只是一個開始。

參考資料：Project Deal: our Claude-run marketplace experiment | Anthropic

📩 想為你的組織打造 AI 協作能力？

Aiworks 提供企業內訓、客製化培訓與實作工作坊，協助各產業團隊規劃生成式 AI 的導入與應用策略。

▼ 聯絡我們｜規劃你的 AI 實戰課程，讓轉型真正落地 ▼

（若表單未正常顯示，請點擊此連結進入表單填寫頁面）