ponoro极品中国女人,无码精品人妻AV一区二区三区

DeepSeek朝硅谷“開了一槍”

財(cái)聯(lián)社

2025-01-27 09:41:16

DeepSeek代表了中國“硬核技術(shù)創(chuàng)新”的敘事，這些創(chuàng)業(yè)者和公司們，正在開啟一個(gè)中國創(chuàng)新故事的新篇章。

文|張洋洋

幾乎是一夜之間，“來自東方的神秘力量”又一次擊中海外人士心臟。

近兩日，國產(chǎn)AI黑馬DeepSeek（深度求索）在全球科技界刷屏。新模型發(fā)布后的訪問量激增，一度讓DeepSeek閃崩，但問題在數(shù)分鐘內(nèi)得到解決。AI界上一次出現(xiàn)宕機(jī)情況，還是月之暗面的Kimi出圈爆火之時(shí)。

截至發(fā)稿，DeepSeek在美區(qū)蘋果App Store的免費(fèi)排行榜中飆升至第二，第一是ChatGPT。

▍與OpenAI“掰手腕”

DeepSeek本次“刷屏”，起因是1月20日其正式發(fā)布推理大模型DeepSeek-R1，該模型在數(shù)學(xué)、編程和推理等關(guān)鍵領(lǐng)域的表現(xiàn)，能與OpenAI的最強(qiáng)推理模型o1“掰手腕”，但其API調(diào)用成本卻低了90%-95%。

DeepSeek-R1的驚艷表現(xiàn)，先是引發(fā)了海外市場的強(qiáng)烈關(guān)注。在美國，多位AI行業(yè)的資深專家和從業(yè)者盛贊DeepSeek-R1。

美國計(jì)算機(jī)科學(xué)家、薩姆·奧爾特曼的導(dǎo)師吳恩達(dá)在第55屆世界經(jīng)濟(jì)論壇（冬季達(dá)沃斯）上點(diǎn)贊DeepSeek——“我對 DeepSeek 的進(jìn)展印象深刻。我認(rèn)為他們能夠以非常經(jīng)濟(jì)的方式訓(xùn)練模型。他們最新發(fā)布的推理模型，非常出色……‘加油’！”。

微軟CEO薩蒂亞·納德拉也公開表示，“他們（DeepSeek）切實(shí)有效地開發(fā)出了一款開源模型，在推理計(jì)算方面表現(xiàn)出色，且超級計(jì)算效率極高?！奔{德拉還強(qiáng)調(diào)，“我們必須非常、非常認(rèn)真地對待中國的這些進(jìn)展”。

DeepSeek成立于2023年5月，其背后是國內(nèi)對沖基金巨頭幻方量化。

2023年11月2日，DeeSeek推出首個(gè)模型DeepSeek Coder，該模型免費(fèi)供商業(yè)使用且完全開源。2023年11月29日，DeepSeek LLM上線，其參數(shù)規(guī)模達(dá)到 67B，性能接近 GPT-4，同時(shí)還發(fā)布了該模型的聊天版本 DeepSeek Chat。

真正讓Deepseek在AI界出圈的，是其在2024年5月開源的第二代MoE大模型DeepSeek-V2。該模型在性能上比肩GPT-4 Turbo，價(jià)格卻只有GPT-4的百分之一，DeepSeek由此被稱作“價(jià)格屠夫”、“AI界的拼多多”。

隨后的2024年下半年，這家公司還先后發(fā)布了DeepSeek R1-lite-preview和DeepSeek-V3。

到了2025年推出的R1模型，在數(shù)學(xué)能力測試中，該模型在MATH基準(zhǔn)測試上達(dá)到了77.5%的準(zhǔn)確率，與OpenAI的o1不相上下；在編程領(lǐng)域，R1在Codeforces評測中達(dá)到了2441分的水平，高于96.3%的人類參與者。

而這一切，是在不到600萬美元的投入和2048塊低性能的H800芯片的條件下完成的，訓(xùn)練時(shí)間僅用兩個(gè)月。這種“四兩撥千斤”的模式，顛覆了人們對OpenAI“大力出奇跡”式的固有認(rèn)知，結(jié)果令全球側(cè)目。

▍為何是DeepSeek？

在國內(nèi)7家頭部的大模型創(chuàng)業(yè)公司當(dāng)中，DeepSeek可以說是最不顯山不露水的一家。在各個(gè)大模型廠商早已開啟買量，進(jìn)行廣告投放品牌營銷時(shí)，據(jù)《科創(chuàng)板日報(bào)》記者了解，這家公司至今尚未有公關(guān)團(tuán)隊(duì)。

2023年4月，幻方量化宣布成立新組織，集中資源和力量，探索AGI的本質(zhì)。當(dāng)時(shí)幻方就表示，多年以來，公司堅(jiān)持把營收的大部分投入人工智能領(lǐng)域，建設(shè)領(lǐng)先的AI硬件基礎(chǔ)設(shè)施，進(jìn)行大規(guī)模的研究，探索人類未知的奧秘。

如今來看，在這一年多時(shí)間里，DeepSeek的進(jìn)展迅速。當(dāng)下的AI戰(zhàn)事進(jìn)入中場，戰(zhàn)況尤為激烈，為何是DeepSeek先讓硅谷 “慌了神”？

近期，在微信朋友圈中，《科創(chuàng)板日報(bào)》記者注意到，不少AI領(lǐng)域的從業(yè)者和投資人，對此進(jìn)行了分析討論。除了技術(shù)實(shí)力本身，團(tuán)隊(duì)的創(chuàng)新理念和人才隊(duì)伍，是業(yè)內(nèi)人士認(rèn)為DeeSeek能在群狼環(huán)伺的AI界殺出重圍的主要原因。

幻方量化和DeepSeek創(chuàng)始人梁文鋒，畢業(yè)于浙江大學(xué)信息與通信工程專業(yè)。業(yè)內(nèi)口碑稱，這是一位極致的80后技術(shù)理想主義者。創(chuàng)立幻方，梁文鋒就在幕后潛心鉆研技術(shù)，在DeepSeek時(shí)代，其依舊延續(xù)著低調(diào)作風(fēng)，和一線研究員一樣，每天“看論文，寫代碼，參與小組討論”。

“過去很多年，中國公司習(xí)慣了別人做技術(shù)創(chuàng)新，我們拿過來做應(yīng)用變現(xiàn)，但這并非是一種理所當(dāng)然。這一波浪潮里，我們的出發(fā)點(diǎn)，就不是趁機(jī)賺一筆，而是走到技術(shù)的前沿，去推動整個(gè)生態(tài)發(fā)展。”在接受《暗涌》的采訪中，梁文鋒說。

DeepSeek的招聘公告中，赫然寫著“頂尖人才招聘”。公開信息顯示，目前的DeepSeek團(tuán)隊(duì)，集結(jié)了一批國內(nèi)名校畢業(yè)的高密度年輕人才，其中不乏應(yīng)屆生、實(shí)習(xí)生。在這里，工作經(jīng)驗(yàn)不再是衡量人才的唯一標(biāo)準(zhǔn)。DeepSeek的HR在社交媒體平臺表示，“著重考察人選素質(zhì)和對大模型的熱愛”。

只要員工的技術(shù)提案有潛力，他們所需算力和資源都能得到充分滿足。在大模型領(lǐng)域，算力是稀缺的資源，DeepSeek則是“萬卡GPU訓(xùn)練集群，無需申請，不限使用”。

對于這些人才，多名熟悉DeepSeek的AI業(yè)內(nèi)人士也反饋，給出的薪酬極具競爭力。

“投身于探索 AGI 的本質(zhì)，不做中庸的事，帶著好奇心，用最長期的眼光去回答最大的問題”，這是DeepSeek官方微信號寫下的簡介。某種程度上，DeepSeek代表了中國“硬核技術(shù)創(chuàng)新”的敘事。可喜的是，DeepSeek并非孤例。

前不久，宇樹科技發(fā)布了一段最新機(jī)器狗產(chǎn)品B2-W的演示視頻，視頻中B2-W機(jī)器狗展現(xiàn)了一系列高難度動作，這引來馬斯克點(diǎn)贊轉(zhuǎn)發(fā)評論，火爆全網(wǎng)。

幾乎是在一同期，黃仁勛的英偉達(dá)中國年會之行中，宇樹科技CEO王興興受邀參與，一行人當(dāng)中，還有銀河通用創(chuàng)始人兼CTO王鶴、深涌智能Emerging AI創(chuàng)始人黃可鋮等。

以這些硬核技術(shù)的創(chuàng)業(yè)者和公司為代表，他們正在開啟一個(gè)中國創(chuàng)新故事的新篇章。

上一篇：幣圈興奮了！已招募百名志愿者寫代碼，馬斯克要用區(qū)塊鏈做DOGE

下一篇：DeepSeek登頂蘋果App Store免費(fèi)應(yīng)用榜

精品国产蜜桃一区二区三区_满足的呻吟小芳笫二章_97成人在线观看_纯肉大尺度肉动漫在线观看