2026年6月9日 · 8分鐘
AI 代理導入後該看什麼數據?30/60/90 天 KPI 量測指南,告訴你何時該擴大
32% 的企業說 AI「看不到立即成效」。本文清楚拆解第 30、60、90 天各該量測哪些 KPI,以及數據在什麼時候告訴你該擴大、調整或停手。

根據 Deloitte–HKU AI 採用指數 2026,AI 在企業內表現不如預期的兩大主因,是「看不到立即成效」(32%)與「商業價值或 ROI 不明確」(24%)。這兩種失敗都指向同一個根本原因:企業在導入 AI 時,根本沒有定義「成功長什麼樣子」,也沒想好怎麼量測。
這份指南給你一套具體的量測框架,用在你跟 AI 代理相處的前 90 天:該追蹤什麼、數字應該長什麼樣、以及數據在什麼時候告訴你該擴大、調整、還是停手。
先講清楚:這裡說的 AI 代理,不是只會回答問題的問答機器人。它是一個會「採取行動」的 AI 客服,會擷取並分流名單、跑多步驟引導流程、查訂單、協助預約,甚至串接你正在用的工具與資料庫(例如 Airtable)對資料即時採取行動。會量測它,你才知道這些行動有沒有產生價值。
為什麼是 90 天?不能更快嗎?
AI 代理會隨時間變好。第一週會暴露設定問題;第一個月會顯現準確率的型態;第二個月會顯現轉換的影響;第三個月會顯現單位經濟效益。
在前 48 小時就評斷一個 AI 代理,就像在新員工報到第一天就考核他,資料太薄、沒有意義。但等六個月又太久,如果工具沒在運作,你需要在第 90 天就知道,才能及時把投資轉向。
90 天也對應到一個現實的學習曲線:知識庫要花時間補齊、對話流程要靠真實對話來校準、員工也要時間建立對系統的信任。把這三件事壓縮在更短的時間內評斷,等於還沒給系統長到該有的樣子就下判決。反過來說,一套有結構的量測能讓你不靠感覺、而靠數據說話,這正好對治 Deloitte–HKU 指出的「ROI 不明確」這個失敗主因。
第 1–30 天:AI 能不能處理好基本的事?
第一個月只回答一個問題:AI 能不能穩定處理你最常見、最重複的客戶訊息?
30 天時「有在運作」長什麼樣
AI 能在沒有真人介入的情況下,正確回答 FAQ 型問題(營業時間、價格、地點、庫存)。非營業時間的訊息能得到即時回應,而不是已讀不回的沉默。員工的信任正在建立,他們看到 AI 處理簡單的、把困難的轉接出來。可以參考 Photobucket 在導入 Zendesk AI 的頭幾個月內,達到 96% 的 CSAT 與 30% 的工單減少,但這些成果來自有結構的量測,不是憑感覺。
該追蹤的 KPI
| KPI | 如何量測 | 目標 |
|---|---|---|
| 首次回應時間 | 客戶訊息到 AI 首次回覆的平均時間 | 30 秒以內(AI 應近乎即時) |
| AI 解決率 | 不需轉真人即解決的對話比例 | 第 1 個月 50–70%(之後會進步) |
| 必填欄位擷取率 | AI 對話中蒐集到客戶姓名+聯絡方式的比例 | 60% 以上 |
| 轉接率 | 轉給真人的對話比例 | 30–50%(第 1 個月偏高沒關係) |
| 「卡住」率 | 客戶重複問同一個問題的對話比例 | 10% 以下 |
| 每次對話成本 | (平台費+訊息費)÷ 總對話數 | 先記為基準,第 2–3 個月比較 |
如何解讀數據
如果轉接率偏高,但 AI 在轉接前已擷取到結構化資料(姓名、聯絡方式、問題類型),那你的系統其實有在運作,只是需要補強知識庫。優先依照 AI 最常轉接的主題,去填補上傳資訊裡的缺口。
如果「卡住」率高於 10%,代表 AI 誤解了常見問題。回頭檢視那些特定對話,更新你的知識庫或對話流程來對症下藥。想把對話流程設計得更扎實,可參考 如何設計對話流程。
第 31–60 天:AI 有在創造商業價值嗎?
第二個月回答:AI 有沒有創造可量測的商業影響,也就是更多合格名單、更多預約、或更少的員工負擔?
60 天時「有在運作」長什麼樣
AI 穩定地過濾名單、把對話分流給對的團隊成員,並減少員工花在重複訊息上的時間。你能看到 AI 處理的對話與商業成果(預約、銷售、詢問品質)之間的連結。
該追蹤的 KPI
| KPI | 如何量測 | 目標 |
|---|---|---|
| 合格名單率 | 產出已標記、合格名單的 AI 對話比例 | 占總對話數 20% 以上 |
| 預約或轉換率 | 名單 → 已預約或完成購買 | 追蹤趨勢,對比第 1 個月基準 |
| 真人工作量 | 每位員工每小時處理的真人對話數 | 應較第 1 個月下降 |
| CSAT 訊號 | 客戶完成率、回饋、重複互動 | 持平或改善 |
| 影響營收 | 來自 AI 擷取名單或預約的營收 | 追蹤總額,並算出占月營收百分比 |
如何解讀數據
如果名單品質上升但轉換沒跟上,瓶頸很可能在真人接手的流程或跟進的時機,而不在 AI。檢視員工回應 AI 擷取合格名單的速度,以及交接時帶過去的背景資訊(已蒐集的資料)是否足夠讓員工成交。
如果員工工作量沒下降,檢查 AI 是不是在處理對的訊息。它可能在解決低優先的詢問,而高頻、重複的問題還是流到員工那裡,這是對話流程要調整,不是平台的問題。
第 61–90 天:單位經濟效益撐得起來嗎?
第三個月回答:這能不能規模化?隨著量放大,每產生一個有用結果的成本有沒有在下降?
90 天時「有在運作」長什麼樣
各個活躍通路的營運穩定。成本可預測。你累積到足夠的資料,可以決定要擴張(增加通路、提高訊息量、建更多對話流程)還是把現有設定最佳化。
該追蹤的 KPI
| KPI | 如何量測 | 目標 |
|---|---|---|
| 每個名單或預約成本 | (每月 AI 總成本)÷(擷取名單或預約數) | 三個月呈下降趨勢 |
| 自動解決率 | 由 AI 完全解決的 FAQ 型訊息比例 | 65% 以上 |
| 影響營收 | 可歸因於 AI 擷取名單的月營收 | 應超過 AI 總成本 2 倍以上 |
| 合規檢查表 | 員工準則就位?培訓完成?品質審查在跑? | 第 90 天三項都應為「是」 |
| 規模就緒度 | 量放大時每結果成本是否持平或下降 | 持平或下降=可擴大 |
如何解讀數據
如果每個有用結果的成本隨量成長而下降,代表你已達到可持續的單位經濟效益。這就是該加碼投資的訊號:加第二個通路、提高訊息方案、或為更多使用情境建對話流程。
如果成本持平但成果沒成長,你很可能已碰到目前設定的天花板。檢視知識庫是否涵蓋所有常見問題、對話流程是否擷取了所有名單類型,以及加第二個通路會不會帶進額外的量。在台灣個資法(個人資料保護法,法務部)規範下,擴大蒐集名單時也要同步檢視資料蒐集與保存是否合規。
不同產業的合理基準在哪裡?
不同產業的健康基準不一樣,拿錯標準對照會誤判。一家高頻、問題標準化的電商,AI 解決率本來就會比一家高度客製的外貿公司高,硬要兩者對齊只會讓你過早停手或過晚停手。
以下是台灣中小企業常見產業的 90 天合理參考帶,請當成「對照組」而非絕對門檻。實際數字會隨知識庫完整度與對話流程設計而上下浮動。
| 產業情境 | 90 天 AI 解決率參考帶 | 主要量測重點 |
|---|---|---|
| 電商/零售 | 65–80% | 查訂單、查庫存、退換貨分流 |
| 餐飲 | 60–75% | 訂位、菜單與營業時間、外送詢問 |
| 美業/預約型服務 | 55–70% | 預約引導、療程諮詢、改期 |
| 外貿/B2B | 40–60% | 名單資格確認、規格詢問、報價分流 |
| 一般服務業 | 55–70% | FAQ、報價、轉真人時機 |
解讀方式:如果你的數字落在參考帶內、且呈上升趨勢,代表設定方向對了,繼續補知識庫即可。如果明顯低於參考帶下緣,先別怪 AI,多半是知識庫缺口或對話流程沒設計好。想從根本把流程設計對,可參考 如何設計對話流程。
要注意的是:解決率只是其中一個面向。一家外貿公司就算 AI 解決率只有 45%,但只要它穩定擷取到合格名單、把高價值詢問漂亮地交接給業務,這套系統對它就是「有在運作」的。別讓單一數字綁架你的判斷。
「停手」訊號:什麼時候 AI 不是對的工具?
不是每家企業都會看到正面成果。以下這些 90 天時的訊號,代表 AI 客服現在不是對的投資。
每週 AI 解決的對話少於 5 筆。 你的訊息量太低,撐不起平台成本。改用自動回覆與人工回應就好。
經過 90 天調校後,AI 解決率仍低於 40%。 你的客戶問題可能太複雜或太獨特,超出目前 AI 能力。這在客製化服務、複雜的 B2B 銷售、與高度技術性的領域很常見。
員工拒絕使用系統。 如果你的團隊是在繞過 AI 而不是跟 AI 協作(搶在 AI 回應前先回、無視 AI 擷取的名單、不檢視轉接的對話),問題在採用,不在技術。先處理團隊的動態,再重新投資工具。想避免一開始就導入失敗,可參考 為什麼中小企業的 AI 專案會失敗。
常見問題
第 1 個月最重要的單一 KPI 是什麼?
AI 解決率,也就是 AI 在沒有真人介入下處理的對話比例。這告訴你 AI 是否貼合你實際的訊息型態。第 1 個月目標 50–70%,第 3 個月進步到 65% 以上。
沒有 CRM 我要怎麼量 ROI?
手動追兩個數字:AI 擷取的名單(蒐集到的姓名與聯絡方式)與這些名單的轉換(預約、銷售、有進展的詢問)。就算只用一張簡單的試算表記「AI 擷取名單 → 成果」,也足以算出 AI 有沒有回本。
如果我的解決率高、但營收影響低呢?
這通常代表 AI 在解決簡單問題(營業時間、怎麼走),卻沒擷取到高意圖名單(價格詢問、預約請求)。調整你的對話流程,在有商業價值的詢問上加入名單擷取,而不只是提供資訊。
我該多久檢視一次 AI 表現?
前 60 天每週一次(花 15–20 分鐘看對話紀錄與 KPI)。之後改成每月一次,除非遇到問題。前 60 天是大多數設定改善發生的時期。
我什麼時候該加第二個通路?
當你的主要通路在 60 天以上呈現穩定、正面的指標之後。具體來說:AI 解決率 60% 以上、每個名單成本下降或持平,且有第二個通路存在未被滿足需求的證據。
資料來源:Deloitte–HKU AI 採用指數 2026、OECD「Generative AI and the SME Workforce」(2025)、WhatsApp Business 平台定價 (2026)、Zendesk 2025 CX 趨勢報告。