中国AI Token工厂崛起:半年增长20余倍,产业闭环初现

虎嗅
2026年6月19日 21:30

过去两年,token的生产成本持续下降,而售价却一路攀升。这一看似矛盾的现象,背后反映的是基于Token商业模式逐渐成熟的产业逻辑。

硬件和模型的优化迭代,几乎都指向一个共同目标:更便宜的推理、更廉价的算力。

但另一方面,智能体(Agent)场景的成熟和业务闭环的形成,使token交易逐步脱离价格敏感,转向对效率与价值的追求。无问芯穹的联合创始人兼CEO夏立雪表示,真正能从AI中获利的人,不会被价格劝退,只会致力于如何降低生产成本。他形容,这几乎是已经“看明白了”的商业判断。

无问芯穹是一家2023年成立的公司,与清华大学电子工程系有紧密联系,其模式在业内被称为“token工厂”。不同于传统AI企业,它不研发通用大模型,也不做芯片或面向消费者的应用,而是专注于将供需两端的算力资源进行高效调度、匹配和优化,把优质token高效产出并提供给芯片厂、模型厂和应用厂商。

这种创新模式让无问芯穹能比产业链上的其他公司更早察觉AI产业的微妙变化。

夏立雪本人 图片由无问芯穹提供

据公司今年5月披露,去年12月至今年4月底,无问芯穹的Agentic MaaS平台调用量实现超20倍的同比增长,这一高增长趋势反映了推理市场的爆发式发展。

这一趋势标志着,推理需求的规模已超越训练市场。据国际数据机构统计,2026年全球企业在推理基础设施上的资本支出预计达680亿美元,而训练基础设施支出仅为450亿美元。从产业分工来看,AI产业的重心正在向“推理”领域转移。

随着AI不再只是回答问题的工具,而是开始承担复杂任务,如写完整代码、审阅合同、跟进项目等,token的消耗量呈现数十倍乃至上百倍的增长。无问芯穹的数据表明,在其Agentic MaaS平台中,95%以上的token调用量来自智能体场景。

推理需求的爆发,正在重塑AI产业的生态结构,芯片制造商、模型公司、云服务商都在重新对齐价值重心,基础设施服务商则从“管道”向“工厂”转型,进而成为AI产业链中具有更大影响力的一环。

衡量无问芯穹这种token工厂是否成功,公司内部设定了一个核心指标:每月能产出多少有价值的万亿参数级模型token。这一指标包含两个关键维度——生产效率(单位时间内的token产出量)和系统稳定性(确保连续运行不宕机)。

通过软硬协同优化,无问芯穹实现了过去一两年内5到10倍的性价比提升。公司提出的AI生产力公式——AI生产力=智能规模×Token生产效率×Token价值转化,正在成为业界共识。

夏立雪认为,token的爆发就像移动互联网从3G到4G的转折,不再局限于某款应用,而是推动产业内部的深度重构。AI不仅仅是工具,而是组织者,能够协调不同智力模块,实现真正的协作。

这种协作已在代码生成、线上营销等场景中落地。例如,AI已能实现类似于“一人团队协作”的模式,不同的AI分别承担代码编写、评审保障等任务,形成最基础的分工体系。这类AI型组织,正逐步覆盖更多行业。

无问芯穹团队讨论 图片由无问芯穹提供

无问芯穹的核心优势在于系统化的视野和持续创新的能力。它能够同时对接多家芯片厂商,把通用的架构统一接入、调度和优化,形成一个灵活且稳定的生态系统。

夏立雪进一步解释,token的生产、消费、定价和交易正逐步成为AI领域中的“货币单位”,它包含了技术经济模型中最重要的变量,即“如何让每个token产生最大价值”。

随着token经济学在产业中的落地,公司也在拓展自身的业务边界,从Token生产工厂,走向token价值转化环节,实现更大的系统价值。

虎嗅:当华为、中兴等系统厂商也采用集群方式提高token性价比时,无问芯穹的模式有什么壁垒?

夏立雪: 我们的壁垒在于软硬协同方面有长期积累与成熟成果。我们以系统算法驱动硬件适配,不局限于单一硬件或模型,而是覆盖整个产业生态。这种技术适配性和中立立场形成高度壁垒。

此外,我们的布局是面向整个算力供需生态,把市场上所有芯片视为可优化变量。当产业生态变得复杂,比如多种芯片、多种模型并存,我们这种全局优化能力就成为生态层次的壁垒。

虎嗅:从芯片到模型之间存在中间优化空间,无问芯穹如何建立这一中间层?

夏立雪: 我们正在打造一个跨越芯片与模型的中间层,把不同架构的芯片,如CAN、SUCA、MARCA等,统一接入并管理,实现高效的调度和资源整合。我们的愿景是帮助芯片厂商把复杂的“产品说明书”转化为实际可用的生产能力。

虎嗅:能否给出一些具体数据说明token成本下降情况?

夏立雪: 以万亿参数规模的大模型为例,我们实现的token每秒产能的性价比较之前提升了5到10倍。这是软硬协同优化带来的直接成果。

在token产能方面,我们关注两个核心指标:微观层面的生产效率和宏观层面的系统稳定性。两者都至关重要,因为只有基于稳定可靠的服务,客户才能持续使用并扩大需求。

虎嗅:无问芯穹这个商业模式,在不依赖国产替代叙事的情况下是否依然能增长?

夏立雪: 到了2026年,中国和海外市场在AI产业分配上出现相似趋势。无论在哪个地区,资源都面临供不应求的情况。无问芯穹的商业模式恰好能解决这个根本性问题。

虎嗅:token的爆发是否极大推动了中国芯片厂商在行业中的竞争力?

夏立雪: 2026年,国产芯片的市场机会很大。token作为衡量AI生产力的核心单位,正在帮助中国芯片企业实现从“能不能用”到“好不好用”的重大跨越。

虎嗅:在Prefill与Decode的分化中,国产芯片有何优势?

夏立雪: Prefill是当前国产芯片更适应的场景,因其核心是计算密集,而Decode则对芯片间的通信带宽和底层软硬件生态有更高的要求。这意味着国产芯片正在向更高性能迈进。

虎嗅:如果抛开国产化叙事,无问芯穹的业务仍然有增长动力吗?

夏立雪: 在2026年,不管市场是否被划分为“中国”或“海外”,整体供需关系都处于紧张状态。我们所处的赛道,核心是解决这种资源不足的问题。

本文内容版权归原作者所有。

阅读原文 ↗

评论 (0)

暂无评论,快来抢沙发吧!
中国AI Token工厂崛起:半年增长20余倍,产业闭环初现 - 加闻网 (CanNews.ca)