“頭部 應(yīng)用 DeepSeek 月均下載量 較第一季度環(huán)比 下跌 72.2% ; 騰訊元寶月均下載量 環(huán)比 下跌 54% ; Kimi 月均下載量 環(huán)比 跌 57.7% ?!?/span>
文 / 巴九靈(微信公眾號(hào):吳曉波頻道)
900天,GPT-5終于閃亮登場(chǎng),但是朋友圈似乎并沒(méi)有那么熱鬧。
圈內(nèi)人士轉(zhuǎn)發(fā)點(diǎn)贊,說(shuō)要“搶走打工人飯碗了”,而圈外人士了無(wú)波瀾。
圖源:OpenAI官網(wǎng)
在發(fā)布會(huì)前后,OpenAI CEO山姆·奧特曼做足了給世界一個(gè)“驚喜”的氛圍。
會(huì)場(chǎng)前說(shuō),面對(duì)GPT-5,感覺(jué)自己一無(wú)是處;會(huì)場(chǎng)中,把GPT-5形容為熟悉各個(gè)領(lǐng)域的專(zhuān)家;在會(huì)后的宣發(fā)文章,則是強(qiáng)調(diào)它“博士級(jí)”的智能水平。
奧特曼甚至不惜否定前作:“GPT-3像個(gè)高中生,GPT-4像個(gè)大學(xué)生?!薄拔覈L試過(guò)用回GPT-4,但效果相當(dāng)糟糕?!?/p>
他在發(fā)布會(huì)上反復(fù)強(qiáng)調(diào)這些話。
OpenAI發(fā)布會(huì),山姆·奧特曼
怎么形容GPT-5呢?結(jié)合報(bào)道和專(zhuān)家分析,總結(jié)如下
◎ 首先,編程能力變強(qiáng)了。
比如,可以?xún)煞昼娋涂梢源罱ǔ鲆粋€(gè)完整網(wǎng)站,五分鐘做出一款語(yǔ)言學(xué)習(xí)App,并能精準(zhǔn)識(shí)別并修復(fù)Bug。
當(dāng)然,還是不免出現(xiàn)Bug。比如,演示過(guò)程中展示的性能測(cè)試圖表制造了GPT-5“碾壓式領(lǐng)先”GPT-o3和GPT-4o模型的“幻象”。
◎ 其次,實(shí)現(xiàn)免費(fèi)了。
GPT-5首次使用推理模型來(lái)支持ChatGPT的免費(fèi)版本。用奧特曼的話來(lái)說(shuō):“讓每個(gè)人都能獲得博士級(jí)別的智慧?!?/p>
知名數(shù)字經(jīng)濟(jì)學(xué)者劉興亮高速小巴,“這反映了AI應(yīng)用正逐漸邁向‘免費(fèi)也能用上高級(jí)能力’的趨勢(shì),標(biāo)志著更復(fù)雜、更可靠的AI技術(shù)正在普惠大眾,不再局限于付費(fèi)人群。”
但是,“不是真免費(fèi),有限制,用多了或者問(wèn)題太復(fù)雜,它就會(huì)切換成“迷你版”(GPT-5 mini),這個(gè)版本能力就弱一些了。想一直用好的,還是得掏錢(qián)買(mǎi)Plus或者更貴的Pro。”深度科技研究院院長(zhǎng)張孝榮如此補(bǔ)充道。
◎ 第三,下了大力氣解決“AI幻覺(jué)”。
GPT-5聯(lián)網(wǎng)搜索時(shí)錯(cuò)誤率比GPT-4o低45%,獨(dú)立思考時(shí)錯(cuò)誤率比OpenAI o3低80%。
OpenAI發(fā)布 會(huì)
然而,就在GPT5發(fā)布前的幾個(gè)月,人們對(duì)AI應(yīng)用的熱情出現(xiàn)明顯消退。
點(diǎn)點(diǎn)數(shù)據(jù)顯示,2025年5月,全球AI APP蘋(píng)果App Store與谷歌GooglePlay雙端預(yù)估下載總量達(dá)2.8億次(不含重復(fù)下載),環(huán)比4月下滑了16.4%。
6月,下載總量達(dá)2.7億次,環(huán)比下滑了1.6%;7月,3.4億次,環(huán)比6月上漲了24.9%。
此外,TOP 5應(yīng)用下載量占比中,ChatGPT、Google Gemini分別由6月份的35%和8%下滑至7月份的29%和5%。
在國(guó)內(nèi),據(jù)《2025年二季度AI應(yīng)用價(jià)值榜》顯示,頭部應(yīng)用DeepSeek月均下載量較第一季度環(huán)比下跌72.2%,其MAU環(huán)比下滑9.3%;騰訊元寶月均下載量環(huán)比下跌54%;Kimi月均下載量環(huán)比跌57.7%,同時(shí)MAU環(huán)比降35%。
姍姍來(lái)遲的GPT-5到底帶來(lái)了哪些突破性的改變,為什么普通人對(duì)包括它在內(nèi)的AI應(yīng)用不再“熱誠(chéng)”,要如何喚起大家對(duì)AI的興趣?小巴邀請(qǐng)了業(yè)內(nèi)人士來(lái)深入談?wù)劇?/p>
1
GPT-5的核心優(yōu)勢(shì)是什么?哪些方面不如預(yù)期?
陸新之
商界AI新媒體總編輯
央媒評(píng)論員
可能是因?yàn)槭孪葟垞P(yáng)很久,千呼萬(wàn)喚始出來(lái)之后,倒沒(méi)有感覺(jué)到特別驚艷。
但是用起來(lái)還是能有變化,回答更嚴(yán)謹(jǐn),準(zhǔn)確度變高,也更簡(jiǎn)潔了。
實(shí)事求是來(lái)說(shuō),今時(shí)今日的大模型的版本進(jìn)化,不會(huì)有太革命性的飛躍了。
之前4o的多模態(tài)發(fā)布那次的驚艷感,已經(jīng)很難重現(xiàn)。暫時(shí)可見(jiàn),對(duì)比國(guó)內(nèi)的DeepSeek、豆包和通義等同類(lèi),GPT-5還是綜合能力更強(qiáng)一些,而且自動(dòng)動(dòng)態(tài)切換思考和非思考模型。
初步感覺(jué)的這版核心優(yōu)勢(shì),就是代碼能力和推理能力的進(jìn)化,這個(gè)大部分普通人感知不明顯,開(kāi)發(fā)者可能感知明顯一些。
當(dāng)然,不及我們期待的,就是Agent能力,因?yàn)檫@應(yīng)該是OpenAI的方向之一,本來(lái)期待的是一出來(lái)就可以替代大部分通用Agents,顯然現(xiàn)在還做不到,得等下一版了。
張孝榮
深度科技研究院院長(zhǎng)
GPT-5確實(shí)進(jìn)步不小,好用多了,但沒(méi)能成神。
尤其是所謂“博士級(jí)智能水平”還是有點(diǎn)夸大。
我認(rèn)為,它在編程領(lǐng)域進(jìn)步最突出,比如讓它寫(xiě)個(gè)帶學(xué)習(xí)功能的法語(yǔ)小游戲網(wǎng)頁(yè),幾分鐘就能整出來(lái),代碼寫(xiě)得還挺好看,比之前處于大學(xué)生水平的GPT-4強(qiáng)一截。數(shù)學(xué)推理能力的得分也不錯(cuò),準(zhǔn)確率提升,幻覺(jué)率下降。
看病歷報(bào)告啥的,也能解釋得比較清楚,還帶點(diǎn)人情味兒(當(dāng)然,醫(yī)生還是得看,不能全靠它)。
文章寫(xiě)作上,比上一代更接近人類(lèi)風(fēng)格,當(dāng)然,跟人類(lèi)作家相比,還是有點(diǎn)生硬。
中文能力還是差點(diǎn)意思。用中文寫(xiě)東西,比如寫(xiě)短視頻腳本、文章啥的,它出來(lái)的東西還是有點(diǎn)“外國(guó)味兒”,語(yǔ)感不如國(guó)內(nèi)的通義千問(wèn),DS,文小言等。
看圖看視頻的能力,也比不過(guò)之前的GPT-4o和國(guó)內(nèi)的通義,比如讓它分析個(gè)復(fù)雜圖表或者中國(guó)公司財(cái)報(bào),就很容易抓瞎。
AI幻覺(jué)下降是值得稱(chēng)道的一大進(jìn)步。比如讓它上網(wǎng)查資料再回答,它犯錯(cuò)幾率比GPT-4o低了45%;讓它認(rèn)真思考復(fù)雜問(wèn)題,犯錯(cuò)幾率比之前的“聰明版”低了80%。實(shí)在搞不懂或者問(wèn)題不對(duì),它也會(huì)老實(shí)承認(rèn)“我不會(huì)”或者“你這問(wèn)題有問(wèn)題”,不會(huì)硬著頭皮瞎蒙。
美國(guó)用戶使用OpenAI GPT-5人工智能模型
劉興亮
知名數(shù)字經(jīng)濟(jì)學(xué)者
工信部信息通信經(jīng)濟(jì)專(zhuān)家委員會(huì)委員
1.形態(tài)進(jìn)化。從“選模型”到“模型會(huì)選自己”,GPT-5直接成了ChatGPT的默認(rèn)款,會(huì)根據(jù)任務(wù)自動(dòng)決定“快答”還是“深想”,你也能手動(dòng)切換到“GPT-5 Thinking/Pro”來(lái)走更長(zhǎng)推理,而且這次面向所有用戶開(kāi)放,付費(fèi)用戶只是額度更高,同時(shí)還上了語(yǔ)音升級(jí)、學(xué)習(xí)模式,以及接入了Gmail/日歷等“生活插件”。
一句話,少折騰菜單,多交付結(jié)果。
2.硬指標(biāo)+新工具。碼得更像人,寫(xiě)得更像你。官方放出的基準(zhǔn)顯示,GPT-5在數(shù)字、真實(shí)世界編碼、視覺(jué)和健康等多項(xiàng)評(píng)測(cè)拔尖,并且強(qiáng)化多步指令與工具編排……翻譯成人話就是:寫(xiě)代碼更少?gòu)U話,走流程更少走神。
3.更聰明不等于更“上道”,更安全不等于沒(méi)風(fēng)險(xiǎn)。
我很認(rèn)可它在推理/編碼的進(jìn)步,但在寫(xiě)作質(zhì)感和AGI跨度上并沒(méi)有達(dá)到我的想象。OpenAI一邊高舉“更少幻覺(jué)/更少欺騙”的大旗,一邊推出“Safe-Completions”安全訓(xùn)練并承認(rèn)涉及生物等領(lǐng)域的高風(fēng)險(xiǎn)屬性,這意思就是說(shuō)能干的更多了,能“作妖”的邊界也得更嚴(yán)。
在商業(yè)層面上,GPT-5更像一臺(tái)利潤(rùn)引擎,鋪開(kāi)給全體用戶,押注企業(yè)用量會(huì)放大。所以,我給GDP-5的初步結(jié)論是四個(gè)更——更快更強(qiáng)更準(zhǔn)更懂我。
但我更想強(qiáng)調(diào)的是,別急著給程序員寫(xiě)墓志銘,也別指望它給PPT裝靈魂,先把它當(dāng)超級(jí)實(shí)習(xí)生,該放權(quán)放權(quán),該驗(yàn)收驗(yàn)收。
2
怎么看國(guó)內(nèi)外頭部AI應(yīng)用的下載和月活出現(xiàn)明顯下滑?
陸新之
商界AI新媒體總編輯
央媒評(píng)論員
大模型廠家與巨頭很興奮,但是一直沒(méi)有剛需應(yīng)用,還缺一個(gè)現(xiàn)象級(jí)出圈的產(chǎn)品,所以在殺手級(jí)應(yīng)用出來(lái)之前,大多數(shù)開(kāi)發(fā)者與中小公司還得煎熬一段。AI時(shí)代也在呼喚移動(dòng)互聯(lián)網(wǎng)時(shí)代的TikTok與拼多多。
現(xiàn)在的AI應(yīng)用發(fā)力方向,逐步轉(zhuǎn)向業(yè)務(wù)+AI,而不是純AI應(yīng)用,這是比較務(wù)實(shí)的。但是也缺少一點(diǎn)想象力。目前,除了頂級(jí)的大模型,大部分AI應(yīng)用都是基于原有的業(yè)務(wù)或者行業(yè)經(jīng)驗(yàn)+AI去做原有業(yè)務(wù)的增長(zhǎng)和進(jìn)化。當(dāng)然,原生AI應(yīng)用新造的需求很難出圈,目前也難有清晰的商業(yè)模式。但是真正未來(lái)能夠指數(shù)級(jí)發(fā)展的公司,更大可能還是在原生AI應(yīng)用。
張孝榮
深度科技研究院院長(zhǎng)
當(dāng)前下滑是行業(yè)擠泡沫的陣痛,用戶過(guò)了嘗鮮期,只保留有用的工具,這也是市場(chǎng)走向成熟的必經(jīng)之路——能活下來(lái)的,必是那些讓AI從“炫技”變成“水電煤”的產(chǎn)品。那些蹭熱點(diǎn)、同質(zhì)化、做流量、創(chuàng)新不足的產(chǎn)品,注定會(huì)被淘汰。
現(xiàn)在AI圈打得很熱鬧,基本是“巨頭打架,小廠找縫鉆”的局面,現(xiàn)在拼的是誰(shuí)能綁定用戶生活、誰(shuí)更便宜、誰(shuí)解決實(shí)際問(wèn)題。單打獨(dú)斗的小AI,基本沒(méi)戲了。
從國(guó)內(nèi)外對(duì)比來(lái)看,國(guó)外AI在算力上領(lǐng)先優(yōu)勢(shì)明顯,技術(shù)迭代速度加快。
劉興亮
知名數(shù)字經(jīng)濟(jì)學(xué)者
工信部信息通信經(jīng)濟(jì)專(zhuān)家委員會(huì)委員
普適型聊天機(jī)器人疲軟,用戶興趣轉(zhuǎn)移。通用AI聊天應(yīng)用下載量大幅下降,MAU也下滑明顯,這說(shuō)明這一類(lèi)產(chǎn)品已經(jīng)失去新鮮感,用戶轉(zhuǎn)而青睞更具針對(duì)性的工具型應(yīng)用(如辦公、教育類(lèi)AI工具)。
產(chǎn)品定位與差異化不足。很多AI社交或聊天產(chǎn)品同質(zhì)化嚴(yán)重,功能體驗(yàn)重復(fù)、引導(dǎo)缺乏新意,導(dǎo)致用戶留存率下降、興趣減弱。
行業(yè)轉(zhuǎn)向“功能垂類(lèi)”應(yīng)用。諸如AI寫(xiě)作、在線輔導(dǎo)、助考類(lèi)工具,在特定場(chǎng)景需求推動(dòng)下表現(xiàn)仍強(qiáng)勁(如畢業(yè)季寫(xiě)作需求上漲、AI高考志愿專(zhuān)家應(yīng)用暴漲)。
AI應(yīng)用市場(chǎng)已從“聊天爆款”回歸理性階段,用戶更愿意為“解決實(shí)際問(wèn)題”的垂直應(yīng)用埋單。
3
AI是否已經(jīng)開(kāi)始改變了人們的生活?
張孝榮
深度科技研究院院長(zhǎng)
在重復(fù)勞動(dòng)、數(shù)據(jù)活上超有用,但搞藝術(shù)、做復(fù)雜決策、惠及普通人還差點(diǎn)意思,現(xiàn)在還是花拳繡腿,最多只發(fā)揮了六成功力。
大模型本質(zhì)是“語(yǔ)言縫合怪”,全靠拼詞造句碰答案,不懂分辨事實(shí)真假,加強(qiáng)倫理限制后,幻覺(jué)率更高。從根本上說(shuō),AI幻覺(jué)像“改不掉的撒謊習(xí)慣”,能管住七八成就不錯(cuò)了,現(xiàn)在有許多技術(shù)可以減少AI幻覺(jué),但是沒(méi)法根除。
陸新之
商界AI新媒體總編輯
央媒評(píng)論員
目前,AI應(yīng)用的價(jià)值還遠(yuǎn)遠(yuǎn)沒(méi)有發(fā)揮出來(lái),無(wú)論是對(duì)于工作與生活。更多的用戶還是當(dāng)一個(gè)問(wèn)答機(jī)器人,加點(diǎn)畫(huà)畫(huà)生成視頻等等,還是很淺的嘗試。
比如教育,對(duì)于懂AI的人來(lái)說(shuō)會(huì)用提示詞就能把豆包變成一個(gè)很好用的教育工具,但是對(duì)于普通人就不知道怎么問(wèn),所以現(xiàn)階段的Agents有真實(shí)的需求,也能夠發(fā)展得快。對(duì)智能體來(lái)說(shuō),2025年下半年是一個(gè)窗口期。
幻覺(jué)問(wèn)題我反而不是很擔(dān)心,因?yàn)檫€是能有解決的方法。大模型都有一個(gè)范圍調(diào)節(jié),創(chuàng)意優(yōu)先的選擇但是自然幻覺(jué)率最高,而控制幻覺(jué)率的話,容易回答不全面,這也取決于個(gè)體的使用習(xí)慣。
其實(shí)大模型的預(yù)訓(xùn)練的數(shù)據(jù)相對(duì)來(lái)說(shuō)還是比較可控的,主要是聯(lián)網(wǎng)搜索之后的內(nèi)容常常出問(wèn)題,這個(gè)需要巨頭后面改善搜索的RAG技術(shù)。同時(shí),個(gè)人也要對(duì)于幻覺(jué)有警惕與覺(jué)察,要有自己的判斷來(lái)使用。