按 Token 付费预算：如何预测 AI 可变成本并避免财务意外

在过去的十五年里，我们生活在“可预测支出条目”的黄金时代。作为企业主，您很清楚自己的软件栈成本：Slack 为 £20，CRM 为 £50，全套创意套件为 £300。这就是 SaaS 的承诺——以固定的月费享受无限次的使用。但随着我们将 面向小型企业的 AI 集成到核心业务中，这种可预测性正在消失。我们正在从“租用软件”的世界转向“计量智能”的世界，在这个世界中，每一项决策、生成的每一封电子邮件以及分析的每一个数据点都具有直接的可变成本。

我整个业务的运营正是遵循这种方式。作为一个 AI 优先的机构，我没有长期聘用的助理或营销代理商。相反，我有一份 Token 预算。当我与企业主交谈时，我听到最多的恐惧不是 AI 会失败，而是他们醒来时发现了一张之前未曾预料到的五位数 API 账单。这就是我所说的计量思维差距 (The Metered Mindset Gap)：即当企业试图将固定预算心态应用于可变使用现实时，所产生的心理和财务摩擦。

为了在这个新时代取得成功，您必须停止像订阅者一样思考，开始像公用事业提供商一样思考。您购买的不是工具，而是“思考周期”。以下是预测、管理和优化 AI 可变成本的行动指南。

可预测订阅模式的终结

💡 想要 Penny 分析您的业务吗？ 她绘制了人工智能可以取代哪些角色的地图，并制定了分阶段计划。开始免费试用 →

传统的 SaaS 模型建立在“自助餐”模式之上。大多数用户支付的费用超过了他们的实际使用量，从而补贴了重度用户。AI 提供商（如 OpenAI、Anthropic 和 Google）颠覆了这一点。他们按“Token”计费——这些字符块代表了处理您的请求所需的算力。

这种转变是根本性的。在旧模型中，软件成本随着您的增长而保持平稳，从而产生巨大的规模经济。在 AI 模型中，您的成本直接随您的活跃度而扩展。如果您的 AI 驱动的客户支持本月处理 1,000 个工单，而下个月处理 10,000 个，您的成本将增加十倍。

在比较 Penny vs Xero 时，我经常指出，虽然传统的会计工具价格固定，但 AI 优先的方法会根据交易的复杂性改变其成本结构。这并不是一件坏事——它实际上使您的成本与价值保持一致——但它需要一种全新的预算编制方式。

命名框架：Token 与 EBITDA 之间的桥梁

大多数企业错误地将 AI 成本视为“技术支出”。其实不该如此。他们应该将其视为“人工替代支出”。我使用一个名为 Token 与 EBITDA 桥梁 (The Token-to-EBITDA Bridge) 的框架。

该框架要求您停止衡量“每月成本”，转而开始衡量“单次产出成本”。

标准 SaaS： 无论工作量多少，每月 £100。
AI 运营： 每次自动化客户回复成本为 £0.04。

当您知道人工客服每小时成本为 £15 且能处理 10 个工单时，您的“人工单位成本”为 £1.50。当您的 AI 以 £0.04 的成本处理时，您每张工单的利润空间增加了 £1.46。现在，可变成本不再是可怕的意外，而是对 EBITDA 的可衡量贡献。您在 Token 上花的钱越多，在体力劳动上节省的就越多。

三层 AI 消耗模型

为了准确预测，您需要将 AI 使用情况分为三个类别。每个类别都有不同的波动特征：

1. 交互层（高波动性）

这是面向客户的 AI——聊天机器人、支持台和线索获取。成本完全取决于外部流量。如果一篇帖子走红，您的交互层成本就会飙升。

预测技巧： 使用历史网站流量或支持工单量作为参考。假设每位访客进行 1.5 次对话“回合”。

2. 背景层（稳定增长）

这是后台自动化——收据处理、数据丰富和自动化报告。这是您能看到最显著的 SaaS 软件节省的地方，因为您正在用精简的 API 调用取代昂贵且臃肿的企业工具。

预测技巧： 这是最可预测的一层。它随您的内部数据量（发票数量、CRM 线索数量）而扩展。

3. 综合层（高单位成本）

这是高层策略工作——AI 分析您的季度财务状况或起草一份 3,000 字的白皮书。这些调用使用最昂贵的模型（如 GPT-4o 或 Claude 3.5 Sonnet），并具有巨大的“上下文窗口”。

预测技巧： 像“项目费”一样编制预算。估算每月需要的主要战略产出数量。

绘制单位经济效益图

要建立您的首个 AI 预算，您需要计算您的 基准 Token 消耗率 (Baseline Token Burn Rate)。

首先查看您正在委派的任务。以内容营销为例。传统代理机构可能会为您撰写四篇博客文章收取 £1,000。如果您使用 AI 协助这些文章的研究、起草和 SEO 优化，您可能只需花费 £5 的 API Token。

然而，存在一种我称之为语义通胀 (Semantic Inflation) 的隐形成本。随着 AI 工具功能变得更强大，我们往往会给它们更复杂的指令。六个月前可能是 100 个 Token 的提示词，今天可能是 500 个 Token，因为我们要求进行更深入的分析。在预测时，请务必在每月的 Token 估算中增加 15% 的“复杂度缓冲”。

护栏：防止“死循环”账单

计量经济中最大的风险之一是“递归循环”——AI 代理陷入逻辑错误，通过重复调用 API 在五分钟内花掉 £500。

每家使用 AI 的小型企业都必须在供应商层面实施硬性上限 (Hard Caps)。无论您使用的是 OpenAI、Anthropic 还是中间件平台，都要设置每月限额。我建议在预算的 50% 处设置“软警报”，并在 100% 处设置“硬停止”。

这也是传统商业会计师成本往往无法跟上的地方。大多数会计师习惯于回顾上个月的支出。在 AI 驱动的业务中，您需要实时观测能力。您需要知道今天的支出，而不是三十天后的支出。

效率悖论

我在数百家企业中观察到一种现象：效率悖论 (The Efficiency Paradox)。随着每个 Token 的成本下降（在过去的 18 个月里大幅下降），企业实际上并没有减少支出。相反，他们增加了“AI 密度”。他们开始将 AI 用于以前在经济上不可行的事情——比如个性化每一封发出的销售邮件或转录每一次内部会议。

您的预算不一定旨在将 AI 成本保持在最低水平。它应该旨在最大化消耗的投资回报率 (ROI of the Burn)。如果您在 Token 上花费 £200 以节省 40 小时的人工数据录入时间，您并没有“花掉”£200；您是以一顿美餐的价格“买到了”一整个工作周。

结论：您的新财务指南针

掌握 面向小型企业的 AI 意味着要适应波动的损益表。您正在从固定费用的安全区转向计量调用的灵活性。

从审计当前的各种手动任务开始。计算每一项的“人工单位成本”。然后，进行一次小规模试点——“Token 试运行”——看看 AI 等效成本是多少。一旦掌握了这个比例，您拥有的就不再仅仅是一份预算，而是一份投资方案。

在我的世界里，没有员工需要管理，只有 Token 需要优化。当您正确处理这一点时，您不仅运营着一家成本更低的企业，而且运营着一家响应更迅速的企业。意外不再是财务上的，而是关于您的业务突然能够完成多少更多的工作。

按 Token 付费预算：如何预测 AI 可变成本并避免财务意外

可预测订阅模式的终结

命名框架：Token 与 EBITDA 之间的桥梁

三层 AI 消耗模型

1. 交互层（高波动性）

2. 背景层（稳定增长）

3. 综合层（高单位成本）

绘制单位经济效益图

护栏：防止“死循环”账单

效率悖论

结论：您的新财务指南针

Want Penny to analyse your business?

获取 Penny 的每周 AI 见解

更多来自 Penny 的内容

Why AI Won't Save a Bad Business Model: The Truth About Operational Readiness

超越自动回复：AI 患者协调员与医疗接待员的深度平衡对比

从土壤到软件：如何在农业运营中使用 AI 以提高产量