ChatGPT agent 實測:AI Agent 功能與日常辦公應用

OpenAI 於 2025 年 7 月推出 ChatGPT agent。不同於以往的生成式 AI 模型,ChatGPT agent 不只能提供建議與回覆,更具備「行動能力」,能直接替你執行任務。它結合了推理模型、Deep Research、Operator、ChatGPT Connectors 等多種功能,使 AI 從單純的「思考助手」升級為能夠自主操作的 AI Agent(AI 代理人)。 

延伸閱讀 ▷ 什麼是 AI Agent ?一窺 2025 最重要企業 AI 應用趨勢

那麼,ChatGPT agent 究竟能做什麼?它有哪些功能?能在日常辦公或企業應用中發揮哪些價值? 本文將帶你完整解析 ChatGPT agent 的核心特色、實際應用案例與優缺點,並分享 Aiworks 的實測心得。

ChatGPT agent 是什麼?與原本的 ChatGPT 有何不同?

(source:Introducing ChatGPT agent: bridging research and action|OpenAI)
(source:Introducing ChatGPT agent: bridging research and action|OpenAI

ChatGPT agent 是一個新的 AI 代理應用,進一步整合 Deep Research、Operator 及 ChatGPT Connectors 等多項能力及工具,使 ChatGPT agent 不僅具備對任務進行分析與規劃的能力,更能主動調用多種工具以完成複雜工作流程。

相較於一般 ChatGPT 只能提供文字回覆,ChatGPT agent 能:

  • 主動規劃任務
  • 調用外部工具(API、第三方應用程式、虛擬電腦)
  • 完成跨平台、多步驟的工作流程

ChatGPT agent 的三大核心特色

1. 操作方式簡易,新手也能快速上手

ChatGPT agent 僅需在 ChatGPT 的對話頁面中啟用「代理程式」,並輸入簡單的提示詞(Prompt),agent 便能自動分析情境、規劃任務及選擇合適的工具執行任務。

2. 可控的自動化流程,確保結果符合預期

使用者可以隨時啟用「接管模式」接管、暫停流程,甚至透過對話調整任務。同時,ChatGPT agent 在需要關鍵決策時會主動詢問,避免偏離需求。

3. 安全管控措施,降低 AI 自動化風險

在進行關鍵操作時(如:付款、帳號登入、信件寄送等),ChatGPT agent 會請使用者確認、接手流程,甚至是啟用監督模式,請使用者監督重要操作,降低誤判與錯誤帶來的風險。

ChatGPT agent 能做什麼?整合工具與能力總覽

ChatGPT agent 不再只是單純的對話式 AI,透過整合多種外部工具,能夠應用在更廣泛的場景,涵蓋任務理解、規劃、執行,甚至是除錯。ChatGPT agent 不再只是協助人類進行思考與分析的「大腦」,更獲得了靈巧的「手腳」,成為能夠真正行動的智慧小助手。

以下整理出 ChatGPT agent 主要使用的工具與功能,協助使用者快速了解 ChatGPT agent 的能力:

ChatGPT agent 不再只是協助人類進行思考與分析的「大腦」,更獲得了靈巧的「手腳」,成為能夠真正行動的智慧小助手。 -Aiworks

大腦

  • ChatGPT agent
    ChatGPT agent 此一新模型能夠動態依照情境需求規劃任務,並且選用最合適的工具完成任務。

身體

  • 虛擬電腦
    ChatGPT agent 透過虛擬電腦執行任務,不僅能在推理與行動之間快速切換,還能在不同工具間 共享資訊,讓整體任務執行更一致、更精確。

手腳

  • Deep Research
    ChatGPT agent 融合了 Deep Research 功能,協助使用者進行多步驟的研究及產製高品質報告。
  • 終端工具
    用於執行程式碼、資料分析,甚至自動生成各式文件(如:簡報、試算表等)。
  • ChatGPT Connectors
    透過連接器串接第三方辦公應用程式,使 ChatGPT agent 能即時存取外部資料,支援更廣泛的工作場景。
  • API 存取
    ChatGPT agent 可以透過呼叫 API,獲取外部應用程式的資料,使 AI 自動化應用情境更加貼合使用需求。
  • 網頁瀏覽功能
    ChatGPT agent 具備視覺瀏覽器與文字瀏覽器兩種模式,並且可以自動依情境選擇最適合的方式,提升網頁瀏覽效率:
    • 視覺瀏覽器
      可透過圖形介面模擬使用者操作網站的行為
    • 文字瀏覽器
      能快速處理、解析及推理大量文字內容

如何使用 ChatGPT agent?

步驟一|開啟「代理程式模式(Agent)」

在 ChatGPT 的對話頁面中,開啟功能選單,並選擇「代理程式模式(Agent)」即可啟用 ChatGPT agent。

在 ChatGPT 的對話頁面中,開啟功能選單,並選擇「代理程式模式(Agent)」即可啟用 ChatGPT agent。
使用者在開啟 ChatGPT agent 後,可以點按「資料來源」連接第三方平台,以快速存取個人資料庫中的資訊。
使用者在開啟 ChatGPT agent 後,可以點按「資料來源」連接第三方平台,以快速存取個人資料庫中的資訊。

步驟二|輸入結果導向的提示詞(Prompt)

以「結果導向」撰寫提示詞(Prompt),並點按「上傳」即可開始自動化流程。

ChatGPT agent 具備良好的任務分析、規劃及除錯能力,因此使用者在撰寫提示詞(Prompt)時,無須過多描述逐步的任務細節,關鍵在於清楚地描述「預期結果」,讓 ChatGPT agent 能夠準確理解最終目標,進而自動調整執行策略以達成所需結果。

以「結果導向」撰寫提示詞(Prompt),並點按「上傳」即可開始自動化流程。

步驟三|人機協作

ChatGPT agent 已經可以自動執行許多複雜的操作流程,而透過人機協作,ChatGPT agent 可以更好地達成使用者的任務需求或確保使用安全性。

機敏操作

ChatGPT agent 在面對機敏(如:帳號輸入、購買商品)或關鍵性操作時,會請求使用者的介入或同意,避免 AI 自動化工具直接對現實生活中造成負面影響。

ChatGPT agent 在面對機敏(如:帳號輸入、購買商品)或關鍵性操作時,會請求使用者的介入或同意,避免 AI 自動化工具直接對現實生活中造成負面影響。
ChatGPT agent 在面對機敏(如:帳號輸入、購買商品)或關鍵性操作時,會請求使用者的介入或同意,避免 AI 自動化工具直接對現實生活中造成負面影響。

調整任務執行方向

使用者也可以在 ChatGPT agent 運作的過程中,透過輸入 Prompt 或者是主動接管流程兩種方式,調整 ChatGPT agent 的任務執行方向。

方式一|輸入 Prompt 修改任務流程

使用者可以直接在 ChatGPT agent 對話框中輸入欲修改的提示詞(Prompt),並點按「上傳」鍵即可修改任務執行方向。

使用者可以直接在 ChatGPT agent 對話框中輸入欲修改的提示詞(Prompt),並點按「上傳」鍵即可修改任務執行方向。
使用者可以直接在 ChatGPT agent 對話框中輸入欲修改的提示詞(Prompt),並點按「上傳」鍵即可修改任務執行方向。

方式二|接管瀏覽器操作任務流程

使用者可以透過直接接管,自行操作瀏覽器畫面。

使用者可以透過點按虛擬電腦右上方的「接管瀏覽器」,直接接管工作流程
使用者可以透過點按虛擬電腦右上方的「接管瀏覽器」,直接接管工作流程

檢驗 ChatGPT agent 的運作過程

透過查看螢幕操作過程或是思路步驟,檢驗是否符合使用者的需求。

可以透過點按運作介面右上方的「設置」按鍵,切換 ChatGPT agent 的操作顯示方式
可以透過點按運作介面右上方的「設置」按鍵,切換 ChatGPT agent 的操作顯示方式
可以透過點按運作介面右上方的「設置」按鍵,切換 ChatGPT agent 的操作顯示方式

實測範例:Google Docs 報告產製與指定用戶分享 

接下來,Aiworks 將透過實測範例,展示 ChatGPT agent 如何自主規劃並執行使用者所提出的任務。

實測場景

任務目標

  • 搜尋並蒐集 2025 年企業生成式 AI 的應用案例
  • 將案例資訊整理成專業化的報告
  • 將報告彙整至 Google Docs
  • 透過電子郵件將 Google Docs 文件分享給指定用戶

實際表現

  • 完成資料整理後,先請使用者確認內容,確保正確無誤再進入下一步流程
  • 因 Google Docs 需使用者登入帳號,ChatGPT agent 將引導並交由使用者完成登入動作
  • 將整理後的資料上傳至 Google Docs,並設定共享權限至指定 Google 帳號

ChatGPT agent 操作流程

Step1. 理解與規劃任務

ChatGPT agent 在接收使用者提示詞(Prompt)後,會自主規劃任務步驟,並選擇合適的方法與工具加以執行。

ChatGPT agent 在接收使用者提示詞(Prompt)後,會自主規劃任務步驟,並選擇合適的方法與工具加以執行。
ChatGPT agent 會將完整的思考過程與執行步驟清晰呈現

Step2. 搜尋並瀏覽相關報告

ChatGPT agent 使用「虛擬電腦」執行任務,並啟用「網頁瀏覽」以關鍵文句搜尋,從中篩選可信來源後快速瀏覽與提取重點資訊,作為資訊分析的基礎。

ChatGPT agent 使用「視覺瀏覽器」進行點按與輸入等操作 / 使用「文字瀏覽器」進行網頁文字的理解
ChatGPT agent 使用「視覺瀏覽器」進行點按與輸入等操作 / 使用「文字瀏覽器」進行網頁文字的理解

Step3. 撰寫報告內容

ChatGPT agent 使用「終端機工具」以 markdown 格式撰寫報告的內文。

ChatGPT agent 使用「終端機工具」以 markdown 格式撰寫報告的內文。

Step4. 使用者接管流程

確認生成文件內容

在此次實測中,ChatGPT agent 為確保輸出更符合使用者需求,會暫停自動化流程,並請使用者確認報告內容。

ChatGPT agent 為確保輸出更符合使用者需求,會暫停自動化流程,並請使用者確認報告內容。

接管機敏操作流程

由於使用 Google Docs 需要登入 Google 帳戶,因此為確保機敏資料外洩問題,agent 進一步請使用者接管並登入Google 帳戶。

點按「接管」啟用接管模式
點按「接管」啟用接管模式
點按「結束控制」中止接管模式
點按「結束控制」中止接管模式

Step5. 創建 Google Docs 文件

ChatGPT agent 自動創建 Google Docs 文件,並且將其整理好的文字檔上傳。

ChatGPT agent 自動創建 Google Docs 文件,並且將其整理好的文字檔上傳。
ChatGPT agent 自動創建 Google Docs 文件,並且將其整理好的文字檔上傳。

Step6. 分享 Google Docs 文件

ChatGPT agent 將電子郵件輸入分享視窗中,將 Google Docs 分享給指定用戶。

ChatGPT agent 將電子郵件輸入分享視窗中,將 Google Docs 分享給指定用戶。
ChatGPT agent 將電子郵件輸入分享視窗中,將 Google Docs 分享給指定用戶。

ChatGPT agent 實測心得

Aiworks 經過多次實測 ChatGPT agent,除了應用於文件彙整與寄送外,更進一步測試 agent 在表單填寫、簡報製作以及聯絡資訊爬蟲等情境中,發現 agent 具有以下操作特性(截至 2025 年 8 月):

1. 自主除錯能力較佳

ChatGPT agent 具備自主除錯的功能,能夠自主推理出電腦操作或是資料擷取的錯誤原因,並且進行除錯或者是嘗試以其他方式達成使用者的最終目標。

2. 部分操作速度仍較緩慢

在資訊處理上,ChatGPT agent 表現迅速,但當牽涉到按鍵操作或文件製作(如:簡報製作等)時,執行速度會較為緩慢。因此,使用者在使用時可以先評估該流程是否具有相當的急迫性,避免交由 ChatGPT agent 執行反而導致任務延遲交付。

3. 機敏操作仍需人為介入

雖然 ChatGPT agent 已具備良好的執行能力,但是在面對機敏性操作(如:付款、帳號登入、重要資訊傳送)時,ChatGPT 仍會需要使用者的監督以及操作介入,避免 agent 的錯誤操作為使用者帶來負面影響。因此,使用者可以先評估該自動化需求是否有涵蓋過多的機敏性操作,避免人為介入需求過多造成自動化效益下降。

從 Operator 到 ChatGPT agent

隨著 ChatGPT agent 上線,OpenAI 也宣布於 2025 年 8 月 31 日結束 1 月先行推出 AI Agent 概念助理 Operator 服務,將其整併至 ChatGPT agent 中。然而兩者之間究竟具有什麼樣的差異呢?新推出的 ChatGPT agent 又有什麼樣的擴展呢?

Aiworks 整理出以下表格,讓你更快速了解兩者之間的核心差異:(截至 2025 年 8 月)

ChatGPT vs Operator 比較表格 -Aiworks

延伸閱讀 ▷ 從 ChatGPT 到 Operator — 讓 AI 從思考走向行動

Aiworks 觀點:企業應如何看待 ChatGPT agent?

ChatGPT agent 作為新一代 Agentic AI(代理型 AI),展現出更完整的「理解 → 規劃 → 執行」能力。它能有效處理文件產製、報告撰寫、資料蒐集等重複性任務,替使用者節省大量時間。

然而,Aiworks 認為 如何設計人機協作模式 才是關鍵:

  • AI:適合進行數據處理、快速分析與重複任務
  • 人類:專注於決策、風險控管與策略思考

當人與 AI 各自發揮優勢,才能建立安全、高效的工作流程,真正發揮 ChatGPT agent 的價值。


📩 想為你的組織打造 AI 協作能力?

Aiworks 提供企業內訓、客製化培訓與實作工作坊,協助各產業團隊規劃生成式 AI 的導入與應用策略。

▼ 聯絡我們|規劃你的 AI 實戰課程,讓轉型真正落地 ▼

(若表單未正常顯示,請點擊此連結進入表單填寫頁面)


探索更多⋯⋯

企業培訓真實回饋 ▶︎ 新聞媒體工作者如何與生成式 AI 協作?從內訓實例看應用場景與思維挑戰

企業智能轉型案例 ▶︎ AI 人才轉型怎麼做?企業打造持續進化團隊的 4 大實戰策略(含台灣大哥大案例)

.AI 自動化趨勢洞察 ▶︎ 2025 GEO 實戰守則:讓 ChatGPT、Gemini 主動引用你的內容

AI 自動化學習資源 ▶︎ Make 自動化工具教學:介面操作、功能亮點與 Zapier、n8n 比較一次看懂


FAQ

1. 誰可以使用 ChatGPT agent?

截至 2025 年 8 月,agent 已開放給 Pro、Plus、Team 及 Enetrprise 用戶使用,以下整理出不同權限的使用者用量:

  • Pro:400 則訊息 / 月
  • Plus / Team / Enterprise:40 則訊息 / 月

只有由使用者主動上傳的請求才會計算於每月的訊息次數上限中,於自動化流程中詢問的問題並不會納入使用次數的計算中。

2. 是否能夠安排 ChatGPT agent 在指定時間啟用流程?

可以。使用者可以透過點按「排程」按鍵,設定任務執行時間及頻率。使用者也可以進一步調整使用指令及自動化流程名稱。

使用者可以透過點按「排程」按鍵,設定任務執行時間及頻率。使用者也可以進一步調整使用指令及自動化流程名稱。

參考連結