最專業 AI 工具、VPN 評測網站,幫助你快速找到最適合選擇

Operator

OpenAI 推出的 AI 代理功能,所有自動化操作都在雲端完成。

Operator 是 OpenAI 開發的一款 AI 代理工具,它能夠像真人一樣操作網頁瀏覽器,自動化執行各種線上任務具,於 2025 年 1 月 23 日首次亮相。

核心技術是透過一個名為「電腦使用代理」(Computer-Using Agent, CUA)的新模型,這模型結合 GPT-4o 的視覺理解能力,以及透過強化學習訓練出的高級推理能力。

CUA 能夠「看見」網頁的畫面截圖,並使用滑鼠和鍵盤的各種操作,如點擊、滾動、輸入文字等,來跟網頁互動,意味著無需為每個網站或應用程式開發專門的 API 接口,即可執行任務。

這個工具的目標是讓使用者能將繁瑣、重複性的網路操作交給 AI,從而節省大量時間,提升生產力。

Operator 主要功能

  • 網頁自動化操作:AI 能自動完成填寫表單、線上購物、預訂機票和餐廳、安排會議等日常任務。
  • 跨平台操作:可在不同的網站和應用程式之間切換,執行更複雜的工作流程。
  • 自然語言指令:你只需要使用日常語言描述想要完成的任務,Operator 就能理解並執行。
  • 協同工作與干預控制:在遇到需要登入、付款或解決驗證碼等環節時,Operator 會暫停並請求你接管,確保你永遠都處於主導地位。
  • 自我修正與學習:當遇到錯誤或網頁變化時,Operator 會利用其推理能力嘗試自我修正,以順利完成任務。
  • 客製化與偏好設定:你可以為特定網站設定偏好,如:在預訂機票時設定偏好的航空公司,或在訂購外送時常用的地址。
  • 儲存常用指令:可將常用的任務指令儲存起來,方便以後一鍵執行,如:每週固定的生鮮採購。

Operator 是免費的嗎

目前 Operator 不是獨立的工具,而是包含在 ChatGPT Pro 的訂閱服務中,因此,你需要訂閱 ChatGPT Pro 才能使用 Operator,價格不便宜,

未來 OpenAI 計畫擴展到 Plus、Team 和 Enterprise 等其他付費方案,應該不會等太久。

Operator 支援哪些平台

Operator 透過利用網頁,來遠端控制一個網頁瀏覽器來運作,因此它本身不限於特定的作業系統平台。

使用者只要登入 Operator 網站,就可以使用,意味著任何瀏覽器都支援。

Operator 使用技巧

  • 雖然 Operator 能理解自然語言,但提供的指令越清晰、具體,成功率越高。像是「在 Uber Eats 上幫我訂一份大份的夏威夷披薩和一瓶可樂,送到我預設的地址」。
  • 需要輸入密碼或信用卡資訊時,請接管操作,完成後再將控制權交還給 Operator。
  • 對於常用網站,可以花點時間設定好偏好,這樣才能讓未來的自動化任務更有效率。
  • 如果你剛開始使用,可以從簡單的填寫問卷、查詢資料等任務開始,熟悉其運作模式後,再嘗試更複雜的跨網站任務。

Operator 支援的語言有哪些

Operator 的操作介面有繁體中文,使用的大語言模型也支援多國語言,包括中文,代表說完全不用擔心看不懂,或是不知道怎麼輸入指令。

Operator 缺點

  • 準確性:目前的版本在處理複雜的網頁介面或特別的設計時,可能會出錯,AI 還未達到人類操作的百分之百準確性。
  • 任務複雜度的限制:對於需要高度創意或複雜決策的任務,例如製作精美的簡報或管理複雜的行事曆系統,Operator 目前還沒辦法做到。
  • 速度可能較慢:由於需要分析畫面並決定下一步操作,執行速度有時可能不如自行手動操作快。
  • 價格昂貴且尚未於全球推出:目前僅限於部分國家的 ChatGPT Pro 用戶,訂閱費用每個月要價 200 美元,價格非常貴。
Picture of Rocky

Rocky

曾任職於各大科技網站編輯,目前也是電腦王阿達資深編輯,接觸科技已經長達 10 年,熱愛將一些新科技、知識、和經驗分享給所有人。目前居住在日本,老婆是日本人,偶爾也會分享一些日本生活內容。

全部文章