AI 代理導入後該看什麼數據？30／60／90 天 KPI 量測指南，告訴你何時該擴大

根據 Deloitte–HKU AI 採用指數 2026，AI 在企業內表現不如預期的兩大主因，是「看不到立即成效」（32%）與「商業價值或 ROI 不明確」（24%）。這兩種失敗都指向同一個根本原因：企業在導入 AI 時，根本沒有定義「成功長什麼樣子」，也沒想好怎麼量測。

這份指南給你一套具體的量測框架，用在你跟 AI 代理相處的前 90 天：該追蹤什麼、數字應該長什麼樣、以及數據在什麼時候告訴你該擴大、調整、還是停手。

先講清楚：這裡說的 AI 代理，不是只會回答問題的問答機器人。它是一個會「採取行動」的 AI 客服，會擷取並分流名單、跑多步驟引導流程、查訂單、協助預約，甚至串接你正在用的工具與資料庫（例如 Airtable）對資料即時採取行動。會量測它，你才知道這些行動有沒有產生價值。

為什麼是 90 天？不能更快嗎？

AI 代理會隨時間變好。第一週會暴露設定問題；第一個月會顯現準確率的型態；第二個月會顯現轉換的影響；第三個月會顯現單位經濟效益。

在前 48 小時就評斷一個 AI 代理，就像在新員工報到第一天就考核他，資料太薄、沒有意義。但等六個月又太久，如果工具沒在運作，你需要在第 90 天就知道，才能及時把投資轉向。

90 天也對應到一個現實的學習曲線：知識庫要花時間補齊、對話流程要靠真實對話來校準、員工也要時間建立對系統的信任。把這三件事壓縮在更短的時間內評斷，等於還沒給系統長到該有的樣子就下判決。反過來說，一套有結構的量測能讓你不靠感覺、而靠數據說話，這正好對治 Deloitte–HKU 指出的「ROI 不明確」這個失敗主因。

第 1–30 天：AI 能不能處理好基本的事？

第一個月只回答一個問題：AI 能不能穩定處理你最常見、最重複的客戶訊息？

30 天時「有在運作」長什麼樣

AI 能在沒有真人介入的情況下，正確回答 FAQ 型問題（營業時間、價格、地點、庫存）。非營業時間的訊息能得到即時回應，而不是已讀不回的沉默。員工的信任正在建立，他們看到 AI 處理簡單的、把困難的轉接出來。可以參考 Photobucket 在導入 Zendesk AI 的頭幾個月內，達到 96% 的 CSAT 與 30% 的工單減少，但這些成果來自有結構的量測，不是憑感覺。

該追蹤的 KPI

KPI	如何量測	目標
首次回應時間	客戶訊息到 AI 首次回覆的平均時間	30 秒以內（AI 應近乎即時）
AI 解決率	不需轉真人即解決的對話比例	第 1 個月 50–70%（之後會進步）
必填欄位擷取率	AI 對話中蒐集到客戶姓名＋聯絡方式的比例	60% 以上
轉接率	轉給真人的對話比例	30–50%（第 1 個月偏高沒關係）
「卡住」率	客戶重複問同一個問題的對話比例	10% 以下
每次對話成本	（平台費＋訊息費）÷ 總對話數	先記為基準，第 2–3 個月比較

如何解讀數據

如果轉接率偏高，但 AI 在轉接前已擷取到結構化資料（姓名、聯絡方式、問題類型），那你的系統其實有在運作，只是需要補強知識庫。優先依照 AI 最常轉接的主題，去填補上傳資訊裡的缺口。

如果「卡住」率高於 10%，代表 AI 誤解了常見問題。回頭檢視那些特定對話，更新你的知識庫或對話流程來對症下藥。想把對話流程設計得更扎實，可參考如何設計對話流程。

第 31–60 天：AI 有在創造商業價值嗎？

第二個月回答：AI 有沒有創造可量測的商業影響，也就是更多合格名單、更多預約、或更少的員工負擔？

60 天時「有在運作」長什麼樣

AI 穩定地過濾名單、把對話分流給對的團隊成員，並減少員工花在重複訊息上的時間。你能看到 AI 處理的對話與商業成果（預約、銷售、詢問品質）之間的連結。

該追蹤的 KPI

KPI	如何量測	目標
合格名單率	產出已標記、合格名單的 AI 對話比例	占總對話數 20% 以上
預約或轉換率	名單 → 已預約或完成購買	追蹤趨勢，對比第 1 個月基準
真人工作量	每位員工每小時處理的真人對話數	應較第 1 個月下降
CSAT 訊號	客戶完成率、回饋、重複互動	持平或改善
影響營收	來自 AI 擷取名單或預約的營收	追蹤總額，並算出占月營收百分比

如何解讀數據

如果名單品質上升但轉換沒跟上，瓶頸很可能在真人接手的流程或跟進的時機，而不在 AI。檢視員工回應 AI 擷取合格名單的速度，以及交接時帶過去的背景資訊（已蒐集的資料）是否足夠讓員工成交。

如果員工工作量沒下降，檢查 AI 是不是在處理對的訊息。它可能在解決低優先的詢問，而高頻、重複的問題還是流到員工那裡，這是對話流程要調整，不是平台的問題。

第 61–90 天：單位經濟效益撐得起來嗎？

第三個月回答：這能不能規模化？隨著量放大，每產生一個有用結果的成本有沒有在下降？

90 天時「有在運作」長什麼樣

各個活躍通路的營運穩定。成本可預測。你累積到足夠的資料，可以決定要擴張（增加通路、提高訊息量、建更多對話流程）還是把現有設定最佳化。

該追蹤的 KPI

KPI	如何量測	目標
每個名單或預約成本	（每月 AI 總成本）÷（擷取名單或預約數）	三個月呈下降趨勢
自動解決率	由 AI 完全解決的 FAQ 型訊息比例	65% 以上
影響營收	可歸因於 AI 擷取名單的月營收	應超過 AI 總成本 2 倍以上
合規檢查表	員工準則就位？培訓完成？品質審查在跑？	第 90 天三項都應為「是」
規模就緒度	量放大時每結果成本是否持平或下降	持平或下降＝可擴大

如何解讀數據

如果每個有用結果的成本隨量成長而下降，代表你已達到可持續的單位經濟效益。這就是該加碼投資的訊號：加第二個通路、提高訊息方案、或為更多使用情境建對話流程。

如果成本持平但成果沒成長，你很可能已碰到目前設定的天花板。檢視知識庫是否涵蓋所有常見問題、對話流程是否擷取了所有名單類型，以及加第二個通路會不會帶進額外的量。在台灣個資法（個人資料保護法，法務部）規範下，擴大蒐集名單時也要同步檢視資料蒐集與保存是否合規。

不同產業的合理基準在哪裡？

不同產業的健康基準不一樣，拿錯標準對照會誤判。一家高頻、問題標準化的電商，AI 解決率本來就會比一家高度客製的外貿公司高，硬要兩者對齊只會讓你過早停手或過晚停手。

以下是台灣中小企業常見產業的 90 天合理參考帶，請當成「對照組」而非絕對門檻。實際數字會隨知識庫完整度與對話流程設計而上下浮動。

產業情境	90 天 AI 解決率參考帶	主要量測重點
電商／零售	65–80%	查訂單、查庫存、退換貨分流
餐飲	60–75%	訂位、菜單與營業時間、外送詢問
美業／預約型服務	55–70%	預約引導、療程諮詢、改期
外貿／B2B	40–60%	名單資格確認、規格詢問、報價分流
一般服務業	55–70%	FAQ、報價、轉真人時機

解讀方式：如果你的數字落在參考帶內、且呈上升趨勢，代表設定方向對了，繼續補知識庫即可。如果明顯低於參考帶下緣，先別怪 AI，多半是知識庫缺口或對話流程沒設計好。想從根本把流程設計對，可參考如何設計對話流程。

要注意的是：解決率只是其中一個面向。一家外貿公司就算 AI 解決率只有 45%，但只要它穩定擷取到合格名單、把高價值詢問漂亮地交接給業務，這套系統對它就是「有在運作」的。別讓單一數字綁架你的判斷。

「停手」訊號：什麼時候 AI 不是對的工具？

不是每家企業都會看到正面成果。以下這些 90 天時的訊號，代表 AI 客服現在不是對的投資。

每週 AI 解決的對話少於 5 筆。 你的訊息量太低，撐不起平台成本。改用自動回覆與人工回應就好。

經過 90 天調校後，AI 解決率仍低於 40%。 你的客戶問題可能太複雜或太獨特，超出目前 AI 能力。這在客製化服務、複雜的 B2B 銷售、與高度技術性的領域很常見。

員工拒絕使用系統。 如果你的團隊是在繞過 AI 而不是跟 AI 協作（搶在 AI 回應前先回、無視 AI 擷取的名單、不檢視轉接的對話），問題在採用，不在技術。先處理團隊的動態，再重新投資工具。想避免一開始就導入失敗，可參考為什麼中小企業的 AI 專案會失敗。

常見問題

第 1 個月最重要的單一 KPI 是什麼？

AI 解決率，也就是 AI 在沒有真人介入下處理的對話比例。這告訴你 AI 是否貼合你實際的訊息型態。第 1 個月目標 50–70%，第 3 個月進步到 65% 以上。

沒有 CRM 我要怎麼量 ROI？

手動追兩個數字：AI 擷取的名單（蒐集到的姓名與聯絡方式）與這些名單的轉換（預約、銷售、有進展的詢問）。就算只用一張簡單的試算表記「AI 擷取名單 → 成果」，也足以算出 AI 有沒有回本。

如果我的解決率高、但營收影響低呢？

這通常代表 AI 在解決簡單問題（營業時間、怎麼走），卻沒擷取到高意圖名單（價格詢問、預約請求）。調整你的對話流程，在有商業價值的詢問上加入名單擷取，而不只是提供資訊。

我該多久檢視一次 AI 表現？

前 60 天每週一次（花 15–20 分鐘看對話紀錄與 KPI）。之後改成每月一次，除非遇到問題。前 60 天是大多數設定改善發生的時期。

我什麼時候該加第二個通路？

當你的主要通路在 60 天以上呈現穩定、正面的指標之後。具體來說：AI 解決率 60% 以上、每個名單成本下降或持平，且有第二個通路存在未被滿足需求的證據。

資料來源：Deloitte–HKU AI 採用指數 2026、OECD「Generative AI and the SME Workforce」(2025)、WhatsApp Business 平台定價 (2026)、Zendesk 2025 CX 趨勢報告。

為什麼是 90 天？不能更快嗎？

第 1–30 天：AI 能不能處理好基本的事？

30 天時「有在運作」長什麼樣

該追蹤的 KPI

如何解讀數據

第 31–60 天：AI 有在創造商業價值嗎？

60 天時「有在運作」長什麼樣

該追蹤的 KPI

如何解讀數據

第 61–90 天：單位經濟效益撐得起來嗎？

90 天時「有在運作」長什麼樣

該追蹤的 KPI

如何解讀數據

不同產業的合理基準在哪裡？

「停手」訊號：什麼時候 AI 不是對的工具？

常見問題

第 1 個月最重要的單一 KPI 是什麼？

沒有 CRM 我要怎麼量 ROI？

如果我的解決率高、但營收影響低呢？

我該多久檢視一次 AI 表現？

我什麼時候該加第二個通路？

準備好試用 Omago？