過去一年,多數人已經把 AI 用在圖片與文案生成、知識與資訊彙整這類單點任務,但只要碰上跨工具、多步驟、需要等待結果的工作流程,AI 就會卡住。使用者最後還是得把對話內容貼來貼去、重新組裝。
2026 年 5 月 19 日剛結束的 Google I/O 大會帶來一個核心訊息:「Welcome to the agentic Gemini era」,而 Google 端出的所有產品幾乎都在呼應一件事:Agent 時代 AI 將從「協助回答」變成「代為執行」。
AI 在工作場景中的角色正在改變,這個改變會直接觸及流程、權限與責任的設計。
本篇 Aiworks 將從這次 Google I/O 的 4 個關鍵亮點切入,整理出企業在 Agent 時代真正該關注的訊號,以及在 AI Agent 真正落地之前,組織內部應該先盤點並建立的治理機制。

文章大綱
Google I/O 2026 主軸:AI 從助理進化為真實協作夥伴
一個真正能稱為協作夥伴的 AI,需要同時滿足兩個條件:能執行任務、能用自然的方式對話。而本次 Google I/O 大會主軸正貼合這兩個方向。
Google 在這次 I/O 大會公告中宣告「Welcome to the agentic Gemini era」,從 Search、Gemini app、Workspace、Shopping,到 Android、XR(Extended Reality,延展實境)與開發者工具,這次大會幾乎所有產品線都圍繞 agentic 體驗展開。換句話說,Google 不只是在某一條產品線加上 Agent 功能,而是把整個 Gemini 生態系都往「自主執行」推進。
Google 同時在「人怎麼跟 AI 互動」也做了大幅改版。Gemini app 採用新的設計語言 Neural Expressive,包含流暢動畫、新配色、新字型與觸覺回饋;Gemini Live 對話體驗整合進主介面,文字與語音之間可以自由切換;麥克風重新設計,允許使用者邊想邊說,不會被打斷;回應形式也從大段文字,變為包含圖片、互動時間軸、旁白影片與動態圖表的動態呈現,未來還會提供地區方言聲音。
對企業而言,這代表使用者與 AI 之間的接觸面正在變寬,文字介面不再是唯一的入口,因此導入規劃要連同操作習慣、溝通介面、權限介面一起重新檢視。
Gemini 3.5:結合行動能力的新一代前沿模型

Gemini 3.5 是新一代模型家族,首發版本為 Gemini 3.5 Flash,Pro 版本預計將在下個月推出。Google 將這一代模型明確定位為結合行動能力的前沿智慧(frontier intelligence with action),專為長時段、多步驟的 agentic 工作流與程式碼任務而設計。換句話說,Gemini 3.5 從規格設計階段,就是為了支撐 AI Agent 真正去跑完一整段流程。
性能數據可以直接對照來看。Gemini 3.5 Flash 在多項基準測試上超越前一代的 Gemini 3.1 Pro:
- Terminal-Bench 2.1:76.2%
- GDPval-AA:1656 Elo
- MCP Atlas:83.6%
- CharXiv Reasoning:84.2%
速度方面,它每秒輸出 token 的數量約為其他前沿模型的 4 倍,價格則約為其他前沿模型的一半以下。由此可見,Flash 等級的模型就已經能在 agentic 與程式碼任務上拿到前沿水準,直接拉低了把 AI 放進工作流程的速度與成本門檻。

(source: Gemini 3.5: frontier intelligence with action, Google)
Gemini 3.5 Flash 發佈即同步上線,在 Gemini app、Google Search 的 AI Mode、Google Antigravity、Gemini API(Google AI Studio 與 Android Studio)、Gemini Enterprise Agent Platform 與 Gemini Enterprise 已可使用。
安全機制方面,Gemini 3.5 依循前沿安全框架開發,強化網路安全與 CBRN(Chemical, Biological, Radiological, Nuclear,化學、生物、放射性、核子)防護,並導入可解釋性工具(interpretability tools),讓研究者可以看到模型內部的決策依據。
Gemini Omni:用任何輸入創造任何內容的多模態生成模型
Gemini Omni 是 Google 最新的多模態生成模型家族,能力定位為「可以透過任何輸入創造任何東西」(create anything from any input),它能從文字、影像、音訊、影片任一類型的輸入來生成內容,首波支援影片輸出,未來輸出將會擴及影像與音訊。
Google 也將 Gemini Omni 以「影片版的 Nano Banana」做宣傳。在目前的影片輸出上可以看到幾個亮點:
- 對話式編輯可以跨多輪維持角色一致與物理合理性
- 結合 Gemini 的世界知識,產出內容具備物理感與敘事邏輯
- 可以同時接收影像、文字、影片、音訊作為參考素材(音訊目前先支援語音參考)
- 建立個人 AI Avatar,看起來與聲音都像本人。
而所有透過 Gemini Omni 生成的影片皆內嵌 SynthID 浮水印,使用者現在可透過 Gemini app、Gemini in Chrome、Google Search 驗證影像內容是否為 AI 生成。
目前 Gemini Omni 已可在 Gemini app 與 Google Flow 中使用,對 Google AI Plus、Pro、Ultra 全球訂閱者開放,同時免費進駐 YouTube Shorts 與 YouTube Create App,API 將於未來幾週對開發者與企業客戶釋出。
Google Flow:從生成工具升級為完整影音生產流水線
隨著 Gemini Omni 推出,Google 的多媒體生成平台 Flow 也迎來大幅度更新,將 Gemini Omni 的能力收攏成一條完整的影音內容生產流水線。
- Gemini Omni 進駐 Flow:可從文字、影像、影片等多模態輸入開始,用對話方式生成與精準編輯影片,並在不同場景中維持角色身分與聲音的一致性
- Flow Agent(創作夥伴):早期構思階段協助腦力激盪、討論角色對白、提出劇情建議。進入製作階段後,能一次產出多個變體、對多個素材批次編輯;素材完成後協助整理成集合並重新命名
- Flow Tools(自訂工具):使用者可用自然語言建立專屬工具與工作流程,例如影像編輯器、影片尺寸調整工具、自訂著色器,不需要程式開發經驗,並可分享給其他 Flow 使用者 remix 成自己的版本
- Flow Music(音樂創作):支援歌曲段落編輯,能選取任何片段修改而不影響其他部分;整首歌曲的風格轉換可保留原始旋律與結構;並可透過 Gemini Omni 製作音樂影片
- 行動 App:Flow App 在 Android 以 Beta 形式提供,iOS 版本即將推出。Flow Music App 已在 iOS 上線,Android 版本即將推出
Gemini Spark:24/7 全天候運作的個人 AI Agent

Gemini Spark 是在 Gemini App 上運行的個人 AI Agent,由 Gemini 3.5 加上 Antigravity 執行框架(harness)驅動。Spark 在 Google Cloud 虛擬機上運行,即使使用者鎖屏或關閉筆電,仍會在背景持續執行任務,也因此 Google 主打 Spark 是 「24/7 全天候運行的 Agent」 。
Gemini Spark 串接 Gmail、Docs、Slides 等 Google Workspace 工具,並透過 MCP 連接 Canva、OpenTable、Instacart 等第三方服務。
Google 給出了幾個非常貼合日常使用情境的範例:
- 解析信用卡帳單:自動標出每月新增或隱藏的訂閱費用
- 追蹤學校通知:抽出重要截止日期,每天寄一份整合摘要給使用者與伴侶
- 整理會議筆記:彙整電子郵件與聊天訊息中的原始筆記,產出整理後的 Google Docs,並草擬專案啟動信
這些情境的共通點是,AI 不再只是在使用者打開應用程式時被動回應,而是在背景代為觀察、整理與行動。
未來 Google 也規劃加入以簡訊與電子郵件聯繫 Spark 的能力、支援建立自訂子代理(sub-agents)、開放操作本機瀏覽器的能力。
因應 Agent 的延伸執行能力,Google 推出了 AP2(Agent Payments Protocol,Agent 付款協定),將首先應用在 Gemini Spark 中。AP2 讓 Spark 在使用者授權範圍內安全付款,建立可驗證、可追溯的數位授權紀錄,同時也保留了關鍵的人為節點:使用者決定要連接哪些 app,遇到高風險動作(如付款、寄送電子郵件)時,Spark 會先停下來詢問。
目前 Gemini Spark 已對信任測試者開放,下一步將在美國對 Google AI Ultra 訂閱者開放 Beta 版本,預計今年(2026)夏天將會發布至 Gemini App。
Antigravity 2.0:從 agent-powered IDE 轉型為獨立 Agent 工作臺

Antigravity 2.0 是這次 I/O 的開發者工具核心更新,顯示出 Google 開始加入 Codex 與 Claude Code 的 coding Agent 賽道。
為什麼是 2.0:把 Agent Manager 從 IDE 拆出來,重新架構為獨立的 agent-first 應用
Antigravity 於 2025 年 11 月以 agent-powered IDE 推出,當時 Google 已在 IDE 內加入 Agent Manager 介面,讓使用者聚焦在 Agent 對話本身。Antigravity 2.0 則進一步把 Agent Manager 拆出來,從根本上重新架構成獨立的桌面應用程式,不再附帶 IDE 介面,也擺脫了儲存庫(repository)等開發專屬概念,讓使用者直接以同步或非同步方式與多個 Agent 互動。
Antigravity 支援 macOS、Linux、Windows 三大平台。Antigravity IDE 仍然保留,但未來 Agent 管理介面會從 IDE 中移除,IDE 會回到由 Agent 驅動的純粹 IDE 角色。同時,產品改用「專案(project)」取代「工作區(workspace)」,專案可以涵蓋多個資料夾或 repository ,並擁有自己的 Agent 設定與權限邊界。
對標 Codex 與 Claude Code,Google 也擴展了 Antigravity 的使用情境,將適用範圍從程式開發擴展到知識工作,將目標使用族群從工程師延伸到一般知識工作者,包含需要深度研究、多步驟任務、跨資料夾工作與多 Agent 協作的情境。
Antigravity 2.0 的多 Agent 協作核心:動態子代理、非同步任務、排程
多 Agent 協作能力是這次升級的另一個重點:
- 動態子代理(dynamic subagents):主 Agent 可動態定義並呼叫子代理,平行處理子任務,避免污染主 Agent 的脈絡視窗(context window)
- 非同步任務管理(asynchronous task management):任務與命令可以非同步執行,不阻塞主 Agent 繼續處理其他工作
- 排程任務:支援 cron 排程或一次性計時器,在指定時間觸發 Antigravity Agent
換句話說,Antigravity 2.0 把過去「使用者開著 IDE 等 Agent 跑完」的工作模式,改成「使用者隨時可以丟新任務,Agent 在背景排隊跑」。
Antigravity 2.0 的開放生態系:CLI、SDK 與企業整合
開放生態系上,Antigravity 也補齊了過去缺的部分:
- Antigravity CLI:開放給偏好終端機的開發者使用,原 Gemini CLI 使用者建議遷移
- Antigravity SDK:開放程式化存取 Agent harness,可自訂行為與自架部署
- Gemini Enterprise Agent Platform 整合:Google Cloud 客戶可以直接連接到 Google Cloud 專案
Aiworks 觀點:當 Agent 成為協作夥伴,企業需要先建立的治理機制
回顧 Google I/O 大會的所有更新,會看到一個明顯的主軸:Agent 不再只活在某一個工具裡,它進入了個人工作(Gemini Spark)、進入了內容生產(Gemini Omni、Google Flow)、進入了開發流程(Antigravity)、進入了企業 IT 整合(Gemini Enterprise Agent Platform)、進入了瀏覽器(Gemini in Chrome),也進入了裝置(Android Halo、Googlebook、Android XR)。AI 從某個應用程式裡的功能,變成貫穿每個人每天生活與工作場景的常駐角色。
而當 AI 從一個被動回應的工具,變成一個會持續觀察、整理、行動的協作夥伴,企業就必須把它當作協作夥伴來看待,並建立相應的治理機制。
Aiworks 建議企業可以從三個問題開始盤點:
- 誰來授權 Agent 在哪些範圍內行動:哪些資料夾、哪些系統、哪些對外溝通動作,可以交給 Agent 處理,哪些必須保留人為節點。
- 誰來審核 Agent 的產出:Agent 寫出來的草稿、產出的報告、發出的訊息,是直接送出去,還是需要部門主管或法務先過目。
- 誰來承擔 Agent 執行錯誤的後果:當 Agent 寄錯一封信、付錯一筆款、刪錯一個檔案,責任歸屬是使用者本人、所屬部門,還是公司整體。
從這三個問題延伸,企業則需要在 Agent 真正普及之前,把組織內的工作流程、決策權限、協作機制三件事先盤點清楚:工作流程的盤點,是釐清人與 Agent 該怎麼接力;決策權限的盤點,是把哪些動作可以由 Agent 自行完成、哪些必須有人簽核標清楚;協作機制的盤點,則是讓不同部門、不同職能、不同 Agent 之間的協作邊界與分工方式變得清楚,避免出現重複作業或互相干擾。
Google I/O 大會提出的「Welcome to the agentic Gemini era」,印證了 Agent 時代已經來臨,當 Agent 成為協作夥伴,企業就需要為其提供明確的權限、清楚的分工、可檢視的責任,而這些是企業現在就應該開始準備的事。
📩 想為你的組織打造 AI 協作能力?
Aiworks 提供企業內訓、客製化培訓與實作工作坊,協助各產業團隊規劃生成式 AI 的導入與應用策略。
▼ 聯絡我們|規劃你的 AI 實戰課程,讓轉型真正落地 ▼
(若表單未正常顯示,請點擊此連結進入表單填寫頁面)
推薦延伸閱讀
▶︎ AI 資安攻防戰升級:從 OpenAI Daybreak 與 Anthropic Project Glasswing 看企業防禦應對策略
▶︎ 金融業 AI 採用率 81%、轉型影響僅 14%:《2026 全球金融服務業 AI 報告》拆解企業導入落差
▶︎ AI 競爭重心從模型移向基礎設施:三大服務商的運算佈局與企業採用視角
▶︎ Tokenmaxxing:當燒 token 變成競賽,企業衡量的是 AI 生產力還是幻覺?
▶︎ 2026 AI 指數報告關鍵洞察:Agentic AI 已成新基準,企業三道缺口同步擴大
參考來源
- Google I/O 2026: News and announcements|Google
- I/O 2026: Welcome to the agentic Gemini era|Google
- 100 things we announced at I/O 2026|Google
- Gemini 3.5: frontier intelligence with action|Google
- Introducing Gemini Omni|Google
- New agents, mobile apps and Gemini Omni for Google Flow and Google Flow Music|Google
- The Gemini app becomes more agentic, delivering proactive, 24/7 help|Google
- I/O 2026 developer highlights: Antigravity, Gemini API, AI Studio|Google
- Google Antigravity Blog: google-io-2026|Google Antigravity
- Introducing Google Antigravity 2.0|Google Antigravity