
今年以来,硅谷掀起“Token最大化”(tokenmaxxing)之风,Token与KPI直接挂钩,不断增长的消耗量被视为生产力提升。在硅谷,亚马逊建立内部排行榜,根据员工使用AI的情况排名。Meta内部的排名系统让员工比拼谁消耗的Token最多。如今,这些昂贵的AI账单开始让企业感到压力。
据英国《金融时报》6月30日报道,在员工纷纷采用AI编程工具后,美国打车应用公司Uber仅四个月就耗尽了2026年一整年的AI预算,迫使管理层限制使用量。现在,Uber限制每位员工每月使用AI编程工具的费用为1500美元。毕马威5月对2145名全球企业领导者的调查显示,由于成本超过收益,其中近半数表示已缩减了AI智能体的使用。
“人们真的在说…… ‘我的公司在第一季度就花掉了2026年的预算’。”OpenAI首席执行官山姆·奥特曼在6月早些时候表示,“今年年初,一个从未被提及的问题……突然变成了一个巨大的问题”。
尽管Token价格在降低,但AI公司的Token定价从固定订阅模式转向按使用量收费,完成一项任务的总成本在上升。任务步骤和数据更多,输入的内容更长,每项任务的Token使用量难以估算,企业面临不可预测且价格高昂的AI支出账单。
咨询机构Gartner预计,到2028年,AI编程成本将超过开发者的平均薪资。Gartner的调查发现,3/4的高管预计今年技术预算将增加,其中近半数预计会有两位数增长。
飙升的Token账单让企业重新审视AI支出情况,重塑模型选择方式,企业开始接受更便宜的模型。据路透社报道,微软CEO萨提亚·纳德拉(Satya Nadella)和美国网络安全公司Palo Alto Networks的CEO尼科什·阿罗拉(Nikesh Arora)等科技高管纷纷表示,更小、更便宜的模型足以满足企业大部分需求。
另据《金融时报》报道,企业软件公司Atlassian限制每位员工在给定时期内可以使用的Token数量。员工可以申请更多Token,但需经理批准。Atlassian首席执行官迈克·坎农-布鲁克斯(Mike Cannon-Brookes)表示,很多公司基本上就是选最贵的模型,想用多少就用多少,“这相当危险,因为它也会教出非常糟糕的习惯。”
企业也在转向OpenRouter这样的AI市场平台,在分配任务时,简单任务选择具有成本效益的系统,编程等复杂任务用高端模型处理。开源模型有利于企业降低AI成本,OpenRouter上最受欢迎的四个模型全部来自中国,其中DeepSeek位居榜首。
硅谷AI搜索初创公司Perplexity首席执行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)表示,如果有一个开源模型能在90%的情况下完成任务,而它的成本比前沿模型更便宜,就可能会选择使用。他表示,前沿智能的未来依然光明,但企业不会再像过去几个月那样不计成本地投入了。能够从AI消耗的电力中提供最大经济价值的公司,最终才能获得最高的估值。
帮助企业运行AI模型的WEKA公司首席AI官瓦尔·贝尔科维奇(Val Bercovici)表示,开源模型以10%的价格做到90%的效果,“我们不需要在每个环节都花费高昂的Token。”
阿罗拉呼吁,AI实验室现在就应该按几年后预计的低价来对Token收费。持有多家科技巨头股份的Synovus证券公司私人财富管理财务顾问克里斯托弗·布朗(Christopher Brown)则认为,OpenAI和Anthropic之间将出现价格战,因为两者都在争夺率先IPO的机会。
信钰证券提示:文章来自网络,不代表本站观点。