能讓財務總監簽字批核的五大支柱AI TCO框架
有一個五大支柱的框架,能區分財務總監會批准的AI預算建議書,與會被退回的版本。獲批的建議書有三個共同特徵:將三年期內所有經常性成本逐一列明、為每一條成本對應一個可量化的業務成果,並為模型定價波動預留30%的緩衝空間。本文將逐項拆解這個框架,並提供2026年的基準數字,協助香港企業為自己的模型錨定起點。
這個轉變並非可選項。根據FinOps Foundation 2026年框架更新,AI成本管理已在大型企業普及率達98%,較去年的63%大幅上升。Gartner預測:到2028年,超過80%的企業AI預算審批將要求提交涵蓋維運、資料管道與基礎設施的多年期TCO模型。沒有在2026年建立這套模型的CIO與CTO,就是2027年要向董事會解釋預算超支的人。
什麼是AI總體擁有成本?它與傳統IT TCO有何不同?
AI總體擁有成本(AI Total Cost of Ownership,AI TCO)是指在生產環境運行一項AI能力的多年期全成本,涵蓋模型推理、資料準備、微調、評估、監控、整合、變革管理,以及生命週期終結時的再訓練支出。與傳統IT TCO相比,AI TCO具有兩個不尋常特徵:每次請求的成本可能因模型定價年中調整而波動;持續性的資料與評估成本,通常會在12個月內超越原本的模型支出。
Keyhole Software 2026年企業支出報告觀察到:多數於2024年建立AI商業方案的組織,將18個月後的營運成本低估了2至3倍。模式十分一致:企業只計算了API或授權費,忽略了周邊生態系統,最終在年中重新編列預算。
企業AI TCO模型的五大支柱是什麼?
2026年的AI TCO模型建基於五大成本支柱:推理、資料、人員、治理與緩衝。每一支柱都代表一個會隨時間增長、且董事會在批核預算前要求看見透明度的類別。
支柱一:推理(Inference)。呼叫基礎模型API或運行自託管模型的每次請求成本,包括輸入token、輸出token、圖像與音訊處理,以及任何按次附加費用。
支柱二:資料(Data)。資料準備、向量儲存、檢索基礎設施、微調資料標註與持續資料更新的成本。業界基準現在估算,到生產第二年,資料成本佔總AI支出的30%至50%。
支柱三:人員(People)。機器學習工程師、資料工程師、提示詞工程師、評估專員、安全審查人員,加上業務使用者投入於AI培訓與採用的時間百分比。
支柱四:治理(Governance)。稽核日誌、模型風險審查、PDPO合規檢視、受規管行業的金管局模型風險管理、紅隊與安全評估,以及政策文件編製。
支柱五:緩衝(Contingency)。Gartner 2026年建議預留30%緩衝,以應對三類風險:模型定價變動(前沿API價格曾在單一年度移動20%至40%)、工作負載增長(AI使用量在頭24個月通常按年翻倍),以及監管調整成本。
如何準確計算支柱一(推理)?
推理成本的計算方式為:平均每次請求token數 × 每月請求量 × 已公佈的每token價格,並在此基礎上加30%作為超額尖峰溢價、加15%作為重試與評估呼叫溢價。對於自託管的小型語言模型,等效計算是GPU實例成本加儲存加網絡流出費用。
FinOps Foundation的AI成本估算工作組在2026年的基準做法是:在三個使用情境下模擬推理成本,即P50(中位數月份)、P90(高峰月份)與P99(最壞情況)。多數2024年版TCO模型只用了P50,這就是現實世界AI帳單令財務總監在第二年大吃一驚的首要原因。
一個實用錨點:一家在200名員工內部使用AI助理的香港中型企業,前沿API推理成本在P50約為每月8,000至14,000美元,在P90為每月18,000至28,000美元。自託管SLM的等效成本通常為這些數字的10%至20%,但會在支柱三的人員開支上增加。
如何準確計算支柱二(資料)?
資料成本是模型生命週期內一次性與經常性資料工作的總和。一次性成本包括初始資料清洗、分類體系設計、黃金標準評估集建立。經常性成本包括向量資料庫儲存與查詢、嵌入向量生成、文件更新,以及每季評估集更新。
2026年的業界基準是:成熟生產AI部署在三年期內,會將總AI預算的30%至50%投入於資料。2024年的CIO錯誤,是把資料工作視為一次性建置開支。2026年的修正則是:將資料當作永久性營運項目,並至少每季更新一次。
對香港企業而言,還有一個額外的資料成本項目:雙語或三語覆蓋。純英語資料集會產生在中英夾雜業務工作流上表現欠佳的模型。第一年通常要為本地化資料準備增加20%至35%的支出。
如何準確計算支柱三(人員)?
人員支柱是大多數企業低估得最嚴重的地方。它涵蓋技術型AI人員,亦包括業務側的變革管理、培訓交付與持續使用者支援。Deloitte 2026年企業AI現狀調查的基準顯示,三年期內企業AI人員成本佔總AI支出的35%至45%,僅次於推理。
一家為200名員工部署AI的香港中型企業的典型分項:一名全職機器學習工程師或AI主管、0.5名資料工程師、0.25名安全審查人員、第一年0.5名變革管理與培訓交付人員(到第二年下降至0.2名),以及每位業務使用者每年約30至60小時的培訓與上手時間。
最常被忽略的子項是評估。生產級AI系統需要一名常設評估工程師,或一個等效的託管服務。沒有持續評估,模型質量會悄悄退化;而失敗的代價(在客戶或監管者面前出錯)遠遠超過評估人員的開支。
如何準確計算支柱四(治理)?
治理成本涵蓋所有保護企業免受AI相關法律、監管與聲譽風險的支出。對香港企業而言,下限由私隱專員公署2025年3月發布的《員工使用生成式AI檢查表》設定,要求記錄AI使用政策、資料留存評估,以及任何處理個人資料的AI影響評估。
對受規管行業而言,下限明顯更高。金管局GenA.I. Sandbox++框架(2026年3月擴展),要求認可機構維持模型風險清單、每年評估演算法偏見,並對AI可達致的決策進行文件記錄。銀行與保險公司應將治理預算設於總AI支出的15%至25%。
對非受規管的中型企業,治理通常佔總AI支出的8%至15%,最大的子項是年度模型風險審查、所有對外AI的安全紅隊測試,以及持續的PDPO合規稽核。
模型應如何向財務總監與董事會呈現?
董事會級別的AI TCO模型應該是一頁紙。上半頁:五大支柱的三年逐年成本表。下半頁:對應的逐年業務價值表,呈現每個AI工作負載產生的生產力增益、成本替代或收入影響。一條36個月回收期摘要線連繫兩個表。
2026年的最佳實踐是,在同一份簡報中包含三個情境:保守情境(低使用量增長、純前沿模型架構、不進行SLM遷移)、基準情境(中度增長、混合架構、第二年計劃SLM遷移)、進取情境(高增長、第二年已建立成熟混合架構、第三年擴展至相鄰用例)。財務總監會以保守情境設定預算下限,並以基準情境作規劃。
有一件事這個模型絕對不能做:把授權費與部署成本混為一談。把6萬美元企業授權費等同AI預算列出,會是最快讓財務總監失去信任的方式,因為實際帳單到來時通常是這個數字的三倍。
企業AI TCO建模常見陷阱有哪些?
第一個陷阱是只用單點推理成本,而非P50/P90/P99三情境。實際生產AI流量是有突發性的,以平均使用量為基礎的預算,會在任何有營銷活動、監管申報窗口或季末結算的月份被突破。
第二個陷阱是把資料當作一次性項目處理。生產級AI需要永久性的資料更新、評估集維護與嵌入向量重生成。略過經常性資料項目,是18個月差異報告變紅的最常見原因。
第三個陷阱是遺漏機會成本。如果一名業務分析師因評估管道薄弱,每季要花40小時看顧AI輸出,那就是一個應該入模型的真實成本。
第四個陷阱是忘記退場成本。36個月的TCO模型應該包括模型在生命週期終結時的退役或替換成本:供應商離場、資料遷移,以及依賴該工作流的使用者過渡支援。
結語:贏得預算公信力的模型
財務總監並不反對AI投資。財務總監反對的是,會在第14個月給董事會帶來意外的AI投資。建構得好的AI TCO模型,就是把部門主管的策略野心轉化為可信預算申請的關鍵憑證。它就是「拿到一次資金」與「未來三年每年都拿到資金」之間的分別。
五大支柱框架是起始結構,數字屬於你的組織。填寫的工作,是策略與會計交會之處,也是希望在不爆預算的前提下擴展AI的香港企業,會選擇在下一個季度投入精力的地方。懂AI的冷,更懂你的難 — UD 同行28年,讓科技成為有溫度的陪伴。
下一步:與UD一起建構你的企業AI TCO模型
了解了框架,下一步是用適合你所屬行業、人數規模與風險水平的基準數字將其填滿。UD企業團隊手把手帶你完成每一步,從AI準備度評估、工作負載盤點、三年期成本建模,到董事會級簡報支援與持續FinOps檢視,二十八年香港企業服務經驗,全程陪你走。