來(lái)源:北京商報(bào) 時(shí)間:2026-03-31 16:48
“Token”正在成為AI行業(yè)最熱的詞。近日召開(kāi)的2026中關(guān)村論壇年會(huì)上,Kimi創(chuàng)始人兼CEO楊植麟、智譜CEO張鵬的話題繞不開(kāi)它。楊植麟將Token定義為未來(lái)的GDP,張鵬直言“Token長(zhǎng)期靠低價(jià)競(jìng)爭(zhēng)不利于行業(yè)發(fā)展”。1000多公里外,騰訊高級(jí)執(zhí)行副總裁湯道生和副總裁李強(qiáng)也分別談及Token,前者稱(chēng)“同樣模型能力下,不同的Harness(腳手架)設(shè)計(jì),Token成本相差很大”,后者認(rèn)為T(mén)oken切換很容易,黏性弱、補(bǔ)貼一停客戶(hù)很容易流失。當(dāng)OpenClaw(網(wǎng)友昵稱(chēng)“龍蝦”)們讓Token消耗呈指數(shù)級(jí)爆發(fā),Token不再只是技術(shù)名詞,而是關(guān)乎商業(yè)模式的關(guān)鍵變量。
Token“燒穿”成本
龍蝦掀起的智能體熱潮,讓Token消耗量呈指數(shù)級(jí)爆發(fā)。Token是什么?國(guó)家數(shù)據(jù)局的定義是AI大模型處理信息的最小單元,Token可計(jì)量、可定價(jià)、可交易。
百度千帆平臺(tái)產(chǎn)品負(fù)責(zé)人張婷向北京商報(bào)記者解釋?zhuān)八炔煌耆扔谝粋€(gè)字,也不完全等于一個(gè)詞,而是介于兩者之間的一種‘語(yǔ)言碎片’。比如漢字‘我’是一個(gè)Token,‘今天’可能是一個(gè)Token,但‘國(guó)際化’可能被拆成‘國(guó)際’和‘化’兩個(gè)Token。因?yàn)榇竽P兔鎸?duì)的語(yǔ)言是全球性的,Token是一種通用的‘最大公約數(shù)’,讓模型可以用統(tǒng)一的方式處理所有語(yǔ)言和符號(hào)”。
根據(jù)國(guó)家數(shù)據(jù)局消息,2024年初,中國(guó)日均Token調(diào)用量為1000億;至2025年底,躍升至100萬(wàn)億;2026年3月,已突破140萬(wàn)億,兩年增長(zhǎng)超千倍。
云廠商與AI大模型企業(yè)的反應(yīng)從2月開(kāi)始,智譜取消對(duì)GLM Coding Plan的首購(gòu)優(yōu)惠,套餐價(jià)格整體漲幅30%起。3月上旬,騰訊云已上調(diào)兩款自研模型價(jià)格,其中Tencent HY2.0 Instruct模型漲幅達(dá)463%,下旬阿里云、百度智能云同日宣布AI算力漲價(jià),最高漲幅34%。
對(duì)于智能體火爆到Token消耗增長(zhǎng)的邏輯鏈路,張鵬近日做了詳細(xì)解釋?zhuān)篈gent在面臨復(fù)雜任務(wù)時(shí),模型思考的鏈路很長(zhǎng),Token消耗量非常大,模型推理的成本也相應(yīng)地提高,因此把Token的價(jià)格回歸到正常的商業(yè)價(jià)值。長(zhǎng)期靠低價(jià)競(jìng)爭(zhēng)也不利于整個(gè)行業(yè)的發(fā)展。
在接受北京商報(bào)記者等媒體采訪時(shí),李強(qiáng)表示,“Token的經(jīng)濟(jì)性很快也會(huì)被所有的客戶(hù)關(guān)注到,如果只考慮消耗量不考慮經(jīng)濟(jì)性,可能你在用戶(hù)端的價(jià)格或成本會(huì)更高,這將對(duì)公司的長(zhǎng)遠(yuǎn)健康發(fā)展帶來(lái)負(fù)面影響”。
Harness“腳手架”藏在水面下
Token到底是怎樣定價(jià)的?張婷向北京商報(bào)記者舉例拆解,“比如‘今天北京天氣怎么樣’,加上AI的回答,大概消耗50—100個(gè)Token。你讓AI寫(xiě)一篇800字的作文,算上你的提示詞和完整輸出,大概消耗1000—1500個(gè)Token”?!皳Q算成錢(qián):目前百度千帆平臺(tái)上主流模型的價(jià)格,每百萬(wàn)Token幾毛錢(qián)的水平。也就是說(shuō),1塊錢(qián)可以讓AI寫(xiě)大約1000篇800字作文?!睆堟帽硎尽?/p>
但當(dāng)Token消耗量以指數(shù)級(jí)增長(zhǎng),一個(gè)更深層的問(wèn)題浮出水面:這些Token并非都花在了“刀刃”上?!癟oken像汽油,Agent像汽車(chē)引擎。如果只關(guān)注油耗,不關(guān)注引擎的經(jīng)濟(jì)性和輸出能力,客戶(hù)最終也會(huì)舍棄?!崩顝?qiáng)用油耗來(lái)解讀Token的效率。
Nextie(明日新程)創(chuàng)始人、“小冰之父”李笛也向北京商報(bào)記者表示,“Token消耗熱指向了一個(gè)有趣的現(xiàn)象:Tokenmaxxing(即Token刷量大賽),現(xiàn)在很多開(kāi)發(fā)者和公司在瘋狂刷高Token消耗量,甚至將其視為一種‘算力肌肉’的展示。但這種無(wú)節(jié)制的燃燒會(huì)帶來(lái)巨大的ROI(投資回報(bào)率)失衡”。
在以上背景下,另一個(gè)概念Harness在硅谷和國(guó)內(nèi)技術(shù)圈快速出圈。
李笛向北京商報(bào)記者詳細(xì)解釋?zhuān)琀arness的直譯是“馬具”或“韁繩”。如果說(shuō)大模型是一匹力大無(wú)窮但方向不定的野馬,Harness就是那套能讓它在既定軌道上奔跑的約束系統(tǒng)。
“AI落地不只是算法題,更是工程題,”湯道生拋出這個(gè)判斷,“在同樣的模型能力下,不同的腳手架或Harness的設(shè)計(jì),比如給模型調(diào)用什么工具、有層次的上下文工程、長(zhǎng)記憶的管理、工作流的實(shí)現(xiàn)等,都對(duì)實(shí)際使用效果與Token成本有很大的影響?!?/p>
小米MiMo大模型負(fù)責(zé)人羅福莉在解讀OpenClaw價(jià)值時(shí)也提到這個(gè)名詞,“OpenClaw把國(guó)內(nèi)那些‘次閉源’水平模型的上限拉得很高,同時(shí)可以靠一套Harness(約束控制體系)等諸多設(shè)計(jì),保證模型的任務(wù)完成度和準(zhǔn)確率,把下限保證得很好”。
云廠商重造“地基”
具體到工程層面,騰訊云智能體開(kāi)發(fā)平臺(tái)ADP,通過(guò)RAG(檢索增強(qiáng)生成)、知識(shí)庫(kù)等能力給智能體連接上“圖書(shū)館”,讓行業(yè)專(zhuān)家永遠(yuǎn)在線。然后是Claw跑在Agent Runtime的安全沙箱:Claw作為智能系統(tǒng)的神經(jīng)中樞,通過(guò)從技能庫(kù)發(fā)現(xiàn)與下載Skills,不斷學(xué)習(xí)與積累連接外部系統(tǒng)的能力,借助大模型來(lái)對(duì)外收發(fā)指令,觸發(fā)行動(dòng);AgentRuntime的沙箱方案還能用于大模型強(qiáng)化學(xué)習(xí)的程序結(jié)果驗(yàn)證,提升強(qiáng)化學(xué)習(xí)的訓(xùn)練效率。
這只是基礎(chǔ)設(shè)施的冰山一角。
“算力的盡頭可能就是電力?!崩顝?qiáng)在采訪中透露,騰訊兩年前開(kāi)始探索算電協(xié)同,“與合作伙伴在內(nèi)蒙古利用當(dāng)?shù)氐娘L(fēng)電和光儲(chǔ)直接為數(shù)據(jù)中心供電,結(jié)合氫能和儲(chǔ)能平衡清潔能源的波峰波谷,同時(shí)協(xié)調(diào)算力的高峰期與低谷期,一方面大幅度降低用電成本,另一方面降低碳排放?!?/p>
另一層的變化發(fā)生在調(diào)度機(jī)制?!爱?dāng)前云計(jì)算時(shí)代的基礎(chǔ)設(shè)施是為服務(wù)人類(lèi)工程師設(shè)計(jì)的,而不是為AI設(shè)計(jì)的。長(zhǎng)遠(yuǎn)來(lái)看,基礎(chǔ)設(shè)施應(yīng)該是一個(gè)整體,這一整套應(yīng)該能夠自我進(jìn)化、自我迭代,能夠形成一個(gè)自主的組織,相當(dāng)于整套基礎(chǔ)設(shè)施由一個(gè)被認(rèn)可的CEO來(lái)管理,它可能是一個(gè)Claw,根據(jù)它的AI客戶(hù)需求,自主迭代自己的基礎(chǔ)設(shè)施”,無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪解釋道。
值得注意的是,目前頭部云廠商擁有雙重身份,阿里云、騰訊云、百度智能云都既是Token供給方,也是Token消耗方。
根據(jù)阿里云最近公布的目標(biāo),未來(lái)五年,云和AI商業(yè)化年收入將突破1000億美元。同時(shí),阿里集團(tuán)向員工提供Token額度,鼓勵(lì)員工在工作中使用先進(jìn)的AI模型與工具。
李強(qiáng)稱(chēng),“Token肯定是騰訊云非常重要的管理指標(biāo)之一,但沒(méi)有把Token放在最高優(yōu)先級(jí),且用極端獎(jiǎng)勵(lì)政策來(lái)推動(dòng),騰訊更愿意把精力放在研發(fā)更好的引擎上,通過(guò)提供好用的AI產(chǎn)品產(chǎn)生真實(shí)的Token消耗”。2025年騰訊云實(shí)現(xiàn)規(guī)?;?026年我們不想太激進(jìn)”,李強(qiáng)直言。
當(dāng)140萬(wàn)億Token沖擊產(chǎn)業(yè),又一輪較量已經(jīng)開(kāi)始。
責(zé)任編輯:劉礎(chǔ)琪